Python weakref (弱引用 ) 教程

marsggbo

发布于 2021-06-10 00:04:21

9840

发布于 2021-06-10 00:04:21

文章被收录于专栏：AutoML(自动机器学习)

原文：https://blog.csdn.net/NeverLate_gogogo/article/details/107021695 本文有删改

前言

首先提一点：大家遇到python模块的使用问题，尽可能去 python document去找答案。

但是关于weakref，官网上给的例子，并不能让我们理解这个弱引用。于是在网上查了一些资料，也是比较模糊。

于是我还是从变量到垃圾回收再到若弱引用讲起这件事吧。因为他们是息息相关的，只有l理解了变量的引用和垃圾回收才会更好的理若引用的概念。

然后最后我再举2个例子，说明弱引用是怎么体现出来的。

一、变量

1.1 变量是什么？

变量是一个对象别名，可以理解成变量是贴在对象上的一个标签，所以当执行

my_list = [1,2,3,4] 其实就是在 [1,2,3,4]这个对象上贴了一个标签 my_list，我们可以通过这个标签来找到对象，进而可以操作对象。

那么我又执行：

my_list2 = my_list 这个时候发生了什么呢，其实就是又给[1,2,3,4]这个对象添加了一个标签。当然，这种说法是只限于对可变对象的操作。我们可以参考下图：

每个变量都有标识、类型和值。对象一旦创建，它的标识绝不会变；可以把标识理解为对象在内存中的地址。is 运算符比较两个对象的标识；id() 函数返回对象标识的整数表示。

因此当我们对上面执行 id(my_list1) 与 id(my_list) 他们返回的值是一样的，因为他们指向同一个对象，my_list与my_list1只是标签而已。

1.2 `==`和`is`之间的比较

== 运算符比较两个对象的值（对象中保存的数据），而 is 比较对象的标识。

is 运算符比 == 速度快，因为它不能重载.接比较两个对象的整数 ID。

a == b 是语法糖，等同于 a.__eq__(b)。

__eq__ 方法继承自 object, 比较两个对象的 ID，结果与 is 一样。但是多数内置类型使用更有意义的方式覆盖了 __eq__ 方法，会考虑对象属性的值。相等性测试可能涉及大量处理工作，例如，比较大型集合或嵌套层级深的结构时。

二、del与垃圾回收机制

这里我们只讨论引用计数规则的垃圾回收机制

python中对象绝不会自行销毁；然而，无法得到对象时，可能会被当作垃圾回收。无法得到对象包括两种： ①没有人引用这个对象了，也就是说这个对象身上被贴的标签都没有了，这时候我们其实就找不到这个对象了； ②相互引用

del 语句删除名称（也就是我们说的标签），而不是对象。当我们把贴在对象身上的标签全部删除了，这时候python垃圾回收机制的引用计数（可以理解为贴标签计数）检测到引用此对象的次数为0，那么就触发了垃圾回收机制，销毁此对象。

因此del命令并不会删除对象，而是当del删除了对象的最后一个引用时，会触发垃圾回收机制，回收器将对象销毁。这个概念要搞清。（看例1的代码）

重新绑定也可能会导致对象的引用数量归零，导致对象被销毁。什么意思呢？

我们执行下面的代码：

my_list = [1,2,3,4]
my_list = [3,4,5,6]

这个时候，对象[1,2,3,4]就被销毁了，为什么？

因为my_list这个标签从对象[1,2,3,4]上被撕下来了，贴到了对象[3,4,5,6]上。这时候对象[1,2,3,4]的引用计数是不是就为0了，这时候就触发垃圾回收机制，将[1,2,3,4]这个对象给销毁了。

所以说，重新绑定也可能导致对象被销毁

（可以看例1的代码）

# 代码示例1
>>> import weakref
>>> s1 = {1,2,3}    # 给对象{1,2,3}贴了一个标签s1
>>> def bye():      # 对象{1,2,3}被销毁时，调用这个函数
...     print("拜拜，你被销毁了")
...
>>> ender = weakref.finalize(s1,bye)      # 绑定回调函数
>>> ender.alive                           # 看对象{1,2,3}仍然存活
True
>>> s1 = {4,5,6}                          # 当标签s1从{1,2,3}上撕下来，对象{1,2,3}被销毁了
拜拜，你被销毁了
>>> ender.alive
False

如果两个对象相互引用（不懂相互引用的可以自行学习一下）,当它们的引用只存在二者之间时，垃圾回收程序会判定它们都无法获取，进而把它们都销毁。

__del__ 特殊方法.不会销毁实例，不应该在代码中调用。即将销毁实例时，Python 解释器会调用 __del__ 方法，给实例最后的机会，释放外部资源。参考标准库del特殊方法.

在 CPython 中，垃圾回收使用的主要算法是引用计数。

实际上，每个对象都会统计有多少引用指向自己.

当引用计数归零时，对象立即就被销毁：CPython 会在对象上调用 __del__ 方法（如果定义了），然后释放分配给对象的内存。

CPython　2.0 增加了分代垃圾回收算法，用于检测引用循环中涉及的对象组——如果一组对象之间全是相互引用，即使再出色的引用方式也会导致组中的对象不可获取。

Python 的其他实现有更复杂的垃圾回收程序，而且不依赖引用计数，这意味着，对象的引用数量为零时可能不会立即调用 del 方法。

# 代码示例2
# 使用 weakref.finalize 注册一个在销毁对象时调用的回调函数。
In [166]: import weakref
 
In [167]: s1 = {1,2,3}
 
In [168]: s2 =  s1  # 指向同一个集合.
 
In [169]: def bye():  # 回调函数一定不能是要销毁的对象的绑定方法（类方法），否则会有一个指向对象的引用。
     ...:     print("拜拜，你被销毁了")
     ...:
 
In [170]: ender = weakref.finalize(s1,bye)  # 注册回调， 并返回一个变量，判断是否销毁。
 
In [171]: ender.alive
Out[171]: True
 
In [172]: del s1
 
In [173]: ender.alive # 说明 del s1 是删除引用，而不是对象。
Out[173]: True
 
In [174]: s2 = 'spam'  # 重新绑定 s2 后，表示 {1,2,3} 无法获取 （引用计数为0），此时调用 bye 回调函数.
拜拜，你被销毁了
 
In [175]: ender.alive  # ender 为 弱引用， 不在 计数 范围内.
Out[175]: False

所以，每个引用就相当于一个标签，通过这个标签我们可以找到这个对象。一旦这些标签别撕没了，也就是对象的引用为0的时候，就出触发python的垃圾回收的机制。

三、弱引用

这个时候可以引出我们心心念的弱引用了。

3.1 弱引用是什么？

在上文，我们看到，当执行 my_list=[1,2,3,4]时，这时候就相当于给对象[1,2,3,4]加了一个强引用（标签）。再执行my_list1 = my_list时，那么对象[1,2,3,4]的强引用个数就变为了2，我们想要触发python的垃圾回收机制销毁对象[1,2,3,4]时，就必须把两个强引用my_list和my_list1都删除。

这时候，my_list2 = [1,2,3,4]这种方式，我不想使·my_list2·成为对象的强引用，那么我就可以把·my_list2·定义为一个弱引用，这时候，就当发生贴标签的操作时，就会是一个弱引用。而弱引用不会影响垃圾回收的计数。也就是说，一个对象，只要强引用个数为0，就会触发python的垃圾回收机制，而不管你有多少个弱引用，都是没关系的。

3.2 弱引用介绍与使用

弱引用不会增加对象的引用数量。引用的目标对象称为所指对象（referent）。因此，弱引用不会妨碍所指对象被当作垃圾回收。

弱引用在缓存应用中很有用，因为不想仅因为被缓存引用着而始终保存缓存对象。

使用 weakref.ref 实例可以获取所指对象。如果对象存在，调用弱引用可以获取对象；否则返回 None 。

weakref.ref 类其实是低层接口，供高级用途使用，多数程序最好使用 weakref 工具集 和 finalize 。

weakref 工具集合:

WeakKeyDictionary:
WeakValueDictionary: 这是一种可变映射，里面的值是对象的弱引用。被引用的对象在程序中的其他地方被当作垃圾回收后，对应的键会自动从 WeakValueDictionary 中删除。因此，WeakValueDictionary 经常用于缓存。
WeakSet: 保存元素弱引用的集合类。元素没有强引用时，集合会把它删除。
finalize (内部使用弱引用)

如果一个类需要知道所有实例，一种好的方案是创建一个 WeakSet 类型的类属性，保存实例的引用。

如果使用常规的 set ，实例永远不会被垃圾回收，因为类中有实例的强引用，而类存在的时间与 Python 进程一样长，除非显式删除类。

弱引用局限：

基本的 list 和 dict 实例不能作为所指对象, 但是它们的子类可以作为弱引用所指对象.
基本的 int 、 list 、 tuple 、string 、dict 实例不能作为弱引用的目标。
但是 set 实例可以作为所指对象。
但是， str 、 dict 、list 的子类实例和用户自定义的类型实例可以作为弱引用所指对象.
然而， int 、 tuple 的子类实例也不能作为弱应用对象.

3.3 弱引用使用举例

任何的数据结构都是可以弱引用的，我们要多利用weakref包中提供的工具类

# 前提： Python 控制台会自动把 _ 变量绑定到结果不为 None 的表达式结果上。
In [1]: import weakref
 
In [2]: a_set = {0,1}
 
In [3]: wref = weakref.ref(a_set)  # 弱引用对象 wref
 
In [4]: wref
Out[4]: <weakref at 0x10f29aea8; to 'set' at 0x10e906f28>
 
In [5]: wref()  # 返回的是被引用的对象，{0, 1}。因为是控制台会话，所以 {0, 1} 会绑定给 _ 变量。
Out[5]: {0, 1}
 
In [6]: a_set = {2, 3, 4}   # a_set 不再指代 {0, 1} 集合，因此集合的引用数量减少了。但是 _ 变量仍然指代它。
 
In [7]: wref()
Out[7]: {0, 1}
 
In [8]: wref() is None  # 计算这个表达式时，{0, 1} 存在，因此 wref() 不是 None。但是，随后 _ 绑定到结果值 False。现在 {0, 1} 没有强引用了。
Out[8]: False
 
In [9]: wref() is None  # 因为 {0, 1} 对象不存在了，所以 wref() 返回 None。
Out[9]: Ture

WeakValueDictionary 示例：

class Cheese:
 
    def __init__(self, kind):
        self.kind = kind
 
    def __repr__(self):
        return 'Cheese(%r)' % self.kind

# 执行：
In [2]: import weakref
 
In [3]: stock = weakref.WeakValueDictionary()  # 创建弱引用字典实例。
 
In [4]: catalog = [Cheese('Read Leicester'), Cheese('Tilsit'),Cheese('Brie'), Cheese('Parmesan')]
 
In [6]: for cheese in catalog:
   ...:     stock[cheese.kind] = cheese  # 名称映射到实例. [弱引用]
   ...:
 
In [7]: sorted(stock.keys())
Out[7]: ['Brie', 'Parmesan', 'Read Leicester', 'Tilsit']
 
In [8]: del catalog
 
In [9]: sorted(stock.keys())  # 为什么还剩一个？ 因为临时变量。
Out[9]: ['Parmesan']
 
In [10]: del cheese
 
In [11]: sorted(stock.keys())  # 临时变量删除后，为空.
Out[11]: []

下面这个例子，是我自己编写的，大家要搞懂下面的这个例子，相信对弱引用，就有些理解了。

>>> import weakref
>>>
>>> class C:                            # 这里新建一个类，因为WeakValueDictionary()
...     def __init__(self, value):      # 要求value是一个obj
...             self.value = value
...
>>> def test_weak_value_dict():
...     d= weakref.WeakValueDictionary()
...     k1 = 'test1'                    
...     v1 = C(1)                       # 这时候C(1)是有一个强引用的：v1
...     d[k1] = v1                      # 这个语句也就是字典赋值，但是由于我们用的
...     print(d[k1])                    # WeakValueDictionary()，所以字典里的是弱引用
...     del v1                          # 这时候删除了C(1)唯一的强引用 v1，因此
...     print(d[k1])                    # WeakValueDictionary()里面 k1,v1 这个键值对消失了
...
>>> test_weak_value_dict()
<__main__.C object at 0x000001793E545198>
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
  File "<stdin>", line 8, in test_weak_value_dict
  File "C:\Users\ASUS\Anaconda3\lib\weakref.py", line 137, in __getitem__
    o = self.data[key]()
KeyError: 'test1'
>>>

我们如果使用dict代替WeakValueDictionary()，会发生什么呢？

dict内部的引用都是强引用，因此我们删除了C(1)的强引用v1，还有dict里面对C(1)的强引用，因此c(1)不会被销毁

>>> import weakref
>>>
>>> class C:
...     def __init__(self, value):
...             self.value = value
...
>>> def test_weak_value_dict():
...     d= dict()
...     k1 = 'test1'
...     v1 = C(1)
...     d[k1] = v1
...     print(d[k1])
...     del v1
...     print(d[k1])
...
>>> test_weak_value_dict()
<__main__.C object at 0x000001793E545390>
<__main__.C object at 0x000001793E545390>

可以看到没有发生报错，就是因为dict里面的引用为强引用

再看下面一个例子，直接报错，搞明白原因了吗？

>>> import weakref
>>>
>>> class C:
...     def __init__(self, value):
...             self.value = value
...
>>> def test_weak_value_dict():
...     d= weakref.WeakValueDictionary()
...     k1 = 'test1'
...     d[k1] = C(1)
...     print(d[k1])
...
>>> test_weak_value_dict()
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
  File "<stdin>", line 5, in test_weak_value_dict
  File "C:\Users\ASUS\Anaconda3\lib\weakref.py", line 137, in __getitem__
    o = self.data[key]()
KeyError: 'test1'

为什么报错：keyerror？

因为这条记录已经被删除了。为什么？

我们看对C(1)的引用有谁？只有WeakValueDictionary()中的弱引用，根本没有强引用。

所以触发垃圾回收机制将C(1)销毁了，因此WeakValueDictionary()关于C(1)的记录也就删除了。

四、`weakref.ref()` 和`weakref.proxy()` 的区别

其实这两个只是使用上有稍微的区别，proxy()算是给用户提供一个更加简洁的接口，看下面的代码就懂了。

>>>
>>> import weakref
>>> class C:
...     def __init__(self, value):
...             self.value = value
>>> c_obj = C(1)
>>> ref = weakref.ref(c_obj)
>>> ref()
<__main__.C object at 0x000001793E5454A8>
>>> ref().value
1
>>>
>>> proxy = weakref.proxy(c_obj)
>>> proxy
<weakproxy at 0x000001793DF55CC8 to C at 0x000001793E5454A8>
>>> proxy.value
1

我们在使用weak.ref时，返回值ref，需要执行ref()才是弱引用的对象，ref() 相当于 c_obj

而weakref.proxy的返回值直接就是弱引用的对象，返回值proxy直接相当于c_obj

本文参与腾讯云自媒体同步曝光计划，分享自作者个人站点/博客。

原始发表：2021-05-31 ，如有侵权请联系 cloudcommunity@tencent.com 删除

java

python

编程算法

本文分享自作者个人站点/博客前往查看

如有侵权，请联系 cloudcommunity@tencent.com 删除。

本文参与腾讯云自媒体同步曝光计划，欢迎热爱写作的你一起参与！

java

python

编程算法

登录后参与评论

0 条评论

热度