这是我的第 69 篇原创文章
艾小仙最近问我:PHP 是不是最好的语言?,我说论 垃圾回收,PHP 可能更简单粗暴一点。艾小仙满脸惊疑:PHP 还有垃圾回收?
Java 中的垃圾回收机制,大家肯定都有所了解,比如如何确定垃圾,有两种算法,引用计数法
和可达性分析算法
。
Java 中使用的是可达性分析算法,而 PHP 使用的引用计数算法。
我们都知道引用计数算法较难处理循环引用的问题,PHP 这波奇怪的操作可太秀了,那 PHP 的垃圾回收原理是怎么样的?
原理: 给对象添加一个引用计数器,每当有一个地方引用它,计数器的值就加一。每当有一个引用失效,计数器的值就减一。
释放
掉,不属于
垃圾。垃圾回收器不会处理 。可能
成为一个垃圾。垃圾鉴定程序
,把真正
的垃圾释放掉。缺点: 需要维护引用计数器,有一定的消耗。且较难处理循环引用的问题。后面也会讲到如何解决这个问题。
下面的例子说明引用计数的是如何变化的:
//这个 value 被变量$x 引用 1 次,refcount = 1
$x = array();
//这个 value 被变量$x,$y 分别引用 1 次,refcount = 2
$y = $x;
//这个 value 被变量 $x, $y, $z 分别引用 1 次,refcount = 3
$z = $y;
//这个 value 被变量$x,$z 分别引用 1 次,refcount = 2,
//$y 被销毁了,没有引用 array 这个 value
unset($y);
每个 php 变量存在一个叫 zval
的变量容器中。一个 zval 变量容器,除了包含变量的类型和值,还包括两个字节的额外信息。
第一个是 is_ref
,是个 bool 值,用来标识这个变量是否是属于引用集合(reference set) 。通过这个字节,php 引擎才能把普通变量和引用变量区分开来,由于 php 允许用户通过使用&来使用自定义引用,zval 变量容器中还有一个内部引用计数机制,来优化内存使用。
第二个额外字节是 refcount
,用以表示指向这个 zval 变量容器的变量(也称符号即 symbol )个数。
有 5 种类型用的引用计数:
string、array、object、resource、reference
下面的表格说明了只有 type_flag 为以下 8 种类型且 IS_TYPE_REFCOUNTED=true 的变量才使用引用计数,如下表所示
使用引用计数的类型
断开 value 指向的情形:
(1)修改变量时会断开原有 value 的指向。
(2)函数返回时会释放所有的局部变量。
unset()
函数。类似于 Java 中的 System.gc()
垃圾收集器收集的可能垃圾
到达一定数量后,启动垃圾鉴定、回收程序。
原理:垃圾是由于成员引用自身导致的,那么就对 value 的 refcount 减一操作,如果 value 的 refount 变为了 0,则表明其引用全部来自自身成员,value 属于垃圾。
白色
。黑色
。我称 _zend_gc_globals 结构体为垃圾管家,它会对垃圾进行管理,收集到的可能成为垃圾的 value 就保存在这个结构的 buf 中,称为垃圾缓存区。
(1)php.ini 解析后调用 gc_init() 初始垃圾管家_zend_gc_globals。
主要作用就是分配缓冲区 buffer 空间和初始化配置。
(2)gc_init() 函数里面调用 gc_reset() 函数初始化。
主要作用就是初始化后续要用到的变量配置。
(1)在销毁一个变量时就会判断是否需要收集。调用 i_zval_ptr_dtor() 函数
gc_possible_root方法
由于回收方法 zend_gc_collect_cycles() 实在是太长,我把几个关键步骤理出来了:
白色
- 垃圾,黑色
- 非垃圾,紫色
- 防止重复插入。- END -