浅析Python中的弱引用与基础类型支持情况
作者:及时
背景
最近有一个业务场景需要用Python自行实现一个简单的LRU cache,不可避免的接触到了弱引用这一概念,这里记录一下。
强引用
Python内存回收由垃圾回收器自动管理,当一个对象的引用计数归0时,其内存就可能被回收掉,而引用计数器的数值其实就是代表有多少个强引用指向该对象,我们日常写的Python代码如果没有使用到weakref模块一般都只会涉及到强引用。
可以通过sys.getrefcount查看对象的引用计数,如以下代码:
import sys alist = [1, 2, 3] # alist引用计数=1 print(sys.getrefcount(alist)) # 包括getrefcount本身新增的强引用,输出2 blist = alist print(sys.getrefcount(alist)) # 新增blist强引用,输出3 print(blist) # 输出[1, 2, 3] del blist print(sys.getrefcount(alist)) # 删除了blist,强引用-1, 输出2
弱引用
与强引用相对,弱引用并不会影响对象的引用计数,也就是说其不影响对象是否被回收的判定,如以下代码:
import sys import weakref class tlist(list): # list本身不支持弱引用,但其子类支持 pass alist = tlist([1, 2, 3]) # alist引用计数=1 print(sys.getrefcount(alist)) # 输出2 bref = weakref.ref(alist) # bref为对alist对象的弱引用 print(bref()) # 返回弱引用对象,输出: [1, 2, 3] print(sys.getrefcount(alist)) # 由于弱引用不影响引用计数,依然输出2 del alist # 删除alist,对象引用计数变为0 print(bref()) # 由于bref指向的对象已无任何强引用,返回None
如上代码所示弱引用不会影响对象的引用计数,亦即不会影响对象内存的回收,但是这里碰到一个引人疑惑的点,就是Python中的基本数据类型对弱引用的支持分了三种情况。
基础类型对于弱引用支持情况
基础类型int、list、dict、tuple、str不支持弱引用,对其执行弱引用会报错:
---------------------------------------------------------------------------
TypeError Traceback (most recent call last)
<ipython-input-3-9daeb515714d> in <module>
----> 1 weakref.ref(alist)
TypeError: cannot create weak reference to 'list' object
可以通过__weakrefoffset__查看类型是否支持弱引用,该变量表示弱引用指针相对对象起始地址的偏移量,>0表示支持弱引用:
In [1]: int.__weakrefoffset__
Out[1]: 0
In [2]: str.__weakrefoffset__
Out[2]: 0
In [3]: tuple.__weakrefoffset__
Out[3]: 0
In [4]: list.__weakrefoffset__
Out[4]: 0
In [5]: dict.__weakrefoffset__
Out[5]: 0
In [6]: set.__weakrefoffset__
Out[6]: 192
官方文档中介绍:
Several built-in types such as list and dict do not directly support weak references but can add support through subclassing:
CPython implementation detail: Other built-in types such as tuple and int do not support weak references even when subclassed.
总结基础类型对弱引用的支持分为以下三种情况(for python3.8):
- 对于list、dict、str本身不支持弱引用,但可以通过创建子类的方式对其进行弱引用
- 对于int、tuple本身及其子类均不支持弱引用
- set直接支持弱引用
这又是出于什么考虑?通过一番探究得出以下可能原因:
- 绝大部分场景下,基础类型使用并不涉及到弱引用,所以基础类型不支持弱引用可以有效避免相应的overhead。
- 弱引用添加于Python2.1,所以对于之后添加的类型(包括object、type、set等)默认都是支持弱引用的,除非有明确的理由不这么做。
- 对于list、dict、int、str、tuple这些2.1之前的基础类型为了兼容性考虑均默认不支持弱引用,而set添加与2.3,因此其直接支持弱引用。
- int、str、tuple这些不可变对象,在CPython解释器中会有特殊的处理逻辑:
4.1 如[-5, 256]范围的小整数池一开始就被创建好了,在程序的整个生命周期无论是否被实际引用都不会被回收。
4.2 又如对于同一个compilation unit的tuple对象,如果取值相同,编译器会将独立的多个相同的tuple对象处理为指向同一个对象的多个强引用。
在这些情况下使用弱引用并没有什么明显的好处,反而额外引入了overhead,综合考虑直接对其不支持弱引用。 - 出于CPython的具体实现细节,对于int、tuple的子类也不支持弱引用。
到此这篇关于浅析Python中的弱引用与基础类型支持情况的文章就介绍到这了,更多相关Python弱引用内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!