Python学习之名字,作用域,名字空间
作者: 编程学习网
前言:
我们在PyFrameObject里面看到了3个独立的名字空间:f_locals、f_globals、f_builtins。名字空间对于Python来说是一个非常重要的概念,Python虚拟机的运行机制和名字空间有着非常紧密的联系。并且在Python中,与名字空间这个概念紧密联系在一起的还有名字、作用域这些概念,下面就来剖析这些概念是如何体现的。
变量只是一个名字
很早的时候我们就说过,从解释器的角度来看,变量只是一个泛型指针PyObject *,而从Python的角度来看,变量只是一个名字、或者说符号,用于和对象进行绑定的。
变量的定义本质上就是建立名字和对象之间的约束关系,所以a = 1这个赋值语句本质上就是将a和1绑定起来,让我们通过a这个符号可以找到对应的PyLongObject。
除了变量赋值,创建函数、类也相当于定义变量,或者说完成名字和对象之间的绑定。
def foo(): pass class A(): pass
创建一个函数也相当于定义一个变量,会先根据函数体创建一个函数对象,然后将名字foo和函数对象绑定起来。所以函数名和函数体之间是分离的,同理类也是如此。
import os
导入一个模块,也是在定义一个变量。import os相当于将名字os和模块对象绑定起来,通过os可以找到指定的模块对象。
import numpy as np当中的as语句同样是在定义变量,将名字np和对应的模块对象绑定起来,以后就可以通过np这个名字去获取指定的模块了。
另外,当我们导入一个模块的时候,解释器是这么做的。比如:import os等价于os=__import__("os"),可以看到本质上还是一个赋值语句。
作用域和名字空间
我们说赋值语句、函数定义、类定义、模块导入,本质上只是完成了名字和对象之间的绑定。而从概念上讲,我们实际上得到了一个name和obj之间的映射关系,通过name可以获取对应的obj,而它们的容身之所就是名字空间。
所以名字空间是通过PyDictObject对象实现的,这对于映射来说简直再适合不过了。而在前面介绍字典的时候,我们说过字典是被高度优化的,原因就是虚拟机本身也重度依赖字典,从这里的名字空间即可得到体现。
但是一个模块内部,名字还存在可见性的问题,比如:
a = 1 def foo(): a = 2 print(a) # 2 foo() print(a) # 1
我们看到同一个变量名,打印的确是不同的值,说明指向了不同的对象,换句话说这两个变量是在不同的名字空间中被创建的。
然后我们知道名字空间本质上是一个字典,如果两者是在同一个名字空间,那么由于字典的key的不重复性,当执行a=2的时候,会把字典里面key为a的value给更新成2。但是在外面还是打印1,这说明两者所在的不是同一个名字空间,打印的也就自然不是同一个a。
因此对于一个模块而言,内部是可能存在多个名字空间的,每一个名字空间都与一个作用域相对应。作用域就可以理解为一段程序的正文区域,在这个区域里面定义的变量是有意义的,然而一旦出了这个区域,就无效了。
对于作用域这个概念,至关重要的是要记住:它仅仅是由源程序的文本所决定的。在Python中,一个变量在某个位置是否起作用,是由它的文本位置决定的。
因此Python具有静态作用域(词法作用域),而名字空间则是作用域的动态体现,一个由程序文本定义的作用域在Python运行时会转化为一个名字空间、即一个PyDictObject对象。而进入一个函数,显然进入了一个新的作用域,因此函数在执行时,会创建一个名字空间。
我们之前说,在对Python源代码进行编译的时候,对于代码中的每一个block,都会创建一个PyCodeObject与之对应。而当进入一个新的名字空间、或者说作用域时,我们就算是进入一个新的block了。
而根据我们使用Python的经验,显然函数、类都是一个新的block,当Python运行的时候会为它们创建各自的名字空间。
所以名字空间是名字、或者变量的上下文环境,名字的含义取决于名字空间。更具体的说,一个变量绑定的对象是不确定的,需要由名字空间来决定。
位于同一个作用域的代码可以直接访问作用域中出现的名字,即所谓的直接访问;但不同作用域,则需要通过访问修饰符 . 进行属性访问。
class A: a = 1 class B: b = 2 print(A.a) # 1 print(b) # 2
如果想在B里面访问A里面的内容,要通过A.属性的方式,表示通过A来获取A里面的属性。但是访问B的内容就不需要了,因为都是在同一个作用域,所以直接访问即可。
访问名字这样的行为被称为名字引用,名字引用的规则决定了Python程序的行为。
a = 1 def foo(): a = 2 print(a) # 2 foo() print(a) # 1
还是上面的代码,如果我们把函数里面的a=2给删掉,意味着函数的作用域里面已经没有a这个变量了,那么再执行程序会有什么后果呢?从Python层面来看,显然是会寻找外部的a。
因此我们可以得到如下结论:
- 作用域是层层嵌套的;
- 内层作用域可以访问外层作用域;
- 外层作用域无法访问内层作用域,尽管我们没有试,但是想都不用想。如果是把外层的a=1给去掉,那么最后面的print(a)铁定报错;
- 查找元素会依次从当前作用域向外查找,也就是查找元素时,对应的作用域是按照从小往大、从里往外的方向前进的;
LGB规则
我们说函数、类有自己的作用域,但是模块对应的源文件本身也有相应的作用域。比如:
name = "编程学习网" age = 16 def foo(): return 123 class A: pass
由于这个文件本身也有自己的作用域,显然是global作用域,所以解释器在运行这个文件的时候,也会为其创建一个名字空间,而这个名字空间就是global名字空间。它里面的变量是全局的,或者说是模块级别的,在当前文件的任意位置都可以直接访问。
而函数也有作用域,这个作用域称为local作用域,对应local名字空间;同时Python自身还定义了一个最顶层的作用域,也就是builtin作用域,像内置函数、内建对象都在builtin里面。
这三个作用域在Python2.2之前就存在了,所以那时候Python的作用域规则被称之为LGB规则:名字引用动作沿着local作用域(local名字空间)、global作用域(global名字空间)、builtin作用域(builtin名字空间)来查找对应的变量。
而获取名字空间,Python也提供了相应的内置函数:
- locals函数:获取当前作用域的local名字空间,local名字空间也称为局部名字空间;
- globals函数:获取当前作用域的global名字空间,global名字空间也称为全局名字空间;
- __builtins__函数:或者import builtins,获取当前作用域的builtin名字空间,builtint名字空间也称为内置名字空间;
每个函数都有自己local名字空间,因为不同的函数对应不同的作用域,但是global名字空间则是全局唯一。
name = "编程学习网" def foo(): pass print(globals()) # {..., 'name': '编程学习网', 'foo': <function foo at 0x000002977EDF61F0>}
里面的...表示省略了一部分输出,我们看到创建的全局变量就在里面。而且foo也是一个变量,它指向一个函数对象。
但是注意,我们说foo也是一个独立的block,因此它会对应一个PyCodeObject。但是在解释到def foo的时候,会根据这个PyCodeObject对象创建一个PyFunctionObject对象,然后将foo和这个函数对象绑定起来。
当我们调用foo的时候,再根据PyFunctionObject对象创建PyFrameObject对象、然后执行,这些留在介绍函数的时候再细说。总之,我们看到foo也是一个全局变量,全局变量都在global名字空间中。
总之,global名字空间全局唯一,它是程序运行时的全局变量和与之绑定的对象的容身之所,你在任何一个地方都可以访问到global名字空间。正如,你在任何一个地方都可以访问相应的全局变量一样。
此外,我们说名字空间是一个字典,变量和对象会以键值对的形式存在里面。那么换句话说,如果我手动地往这个global名字空间里面添加一个键值对,是不是也等价于定义一个全局变量呢?
globals()["name"] = "编程学习网" print(name) # 编程学习网 def f1(): def f2(): def f3(): globals()["age"] = 16 return f3 return f2 f1()()() print(age) # 16
我们看到确实如此,通过往global名字空间里面插入一个键值对完全等价于定义一个全局变量。并且global名字空间是唯一的,你在任何地方调用globals()得到的都是global名字空间,正如你在任何地方都可以访问到全局变量一样。
所以即使是在函数中向global名字空间中插入一个键值对,也等价于定义一个全局变量、并和对象绑定起来。
- name="xxx" 等价于 globals["name"]="xxx";
- print(name) 等价于 print(globals["name"]);
对于local名字空间来说,它也对应一个字典,显然这个字典就不是全局唯一的了,每一个局部作用域都会对应自身的local名字空间。
def f(): name = "夏色祭" age = 16 return locals() def g(): name = "神乐mea" age = 38 return locals() print(locals() == globals()) # True print(f()) # {'name': '夏色祭', 'age': 16} print(g()) # {'name': '神乐mea', 'age': 38}
显然对于模块来讲,它的local名字空间和global名字空间是一样的,也就是说,模块对应的PyFrameObject对象里面的f_locals和f_globals指向的是同一个PyDictObject对象。
但是对于函数而言,局部名字空间和全局名字空间就不一样了。调用locals是获取自身的局部名字空间,而不同函数的local名字空间是不同的。但是globals函数的调用结果是一样的,获取的都是global名字空间,这也符合函数内找不到某个变量的时候会去找全局变量这一结论。
所以我们说在函数里面查找一个变量,查找不到的话会找全局变量,全局变量再没有会查找内置变量。本质上就是按照自身的local空间、外层的global空间、内置的builtin空间的顺序进行查找。
因此local空间会有很多个,因为每一个函数或者类都有自己的局部作用域,这个局部作用域就可以称之为该函数的local空间;但是global空间则全局唯一,因为该字典存储的是全局变量。无论你在什么地方,通过调用globals函数拿到的永远是全局名字空间,向该空间中添加键值对,等价于创建全局变量。
对于builtin名字空间,它也是一个字典。当local空间、global空间都没有的时候,会去builtin空间查找。问题来了,builtin名字空间如何获取呢?答案是使用builtins模块,通过builtins.__dict__即可拿到builtin名字空间。
# 等价于__builtins__ import builtins #我们调用list显然是从内置作用域、也就是builtin名字空间中查找的 #但我们只写list也是可以的 #因为local空间、global空间没有的话,最终会从builtin空间中查找 #但如果是builtins.list,那么就不兜圈子了 #表示: "builtin空间,就从你这获取了" print(builtins.list is list) # True builtins.dict = 123 #将builtin空间的dict改成123 #那么此时获取的dict就是123 #因为是从内置作用域中获取的 print(dict + 456) # 579 str = 123 #如果是str = 123,等价于创建全局变量str = 123 #显然影响的是global空间 print(str) # 123 # 但是此时不影响builtin空间 print(builtins.str) # <class 'str'>
这里提一下Python2当中,while 1比while True要快,为什么?
因为True在Python2中不是关键字,所以它是可以作为变量名的。那么Python在执行的时候就要先看local空间和global空间里有没有True这个变量,有的话使用我们定义的,没有的话再使用内置的True。
而1是一个常量,直接加载就可以,所以while True多了符号查找这一过程。但是在Python3中两者就等价了,因为True在Python3中是一个关键字,也会直接作为一个常量来加载。
eval和exec
记得之前介绍 eval 和 exec 的时候,我们说这两个函数里面还可以接收第二个参数和第三个参数,它们分别表示global名字空间、local名字空间。
# 如果不指定,默认当前所在的名字空间 # 显然此时是全局名字空间 exec("name = '古明地觉'") print(name) # 古明地觉 # 但是我们也可以指定某个名字空间 dct = {} # 将 dct 作为全局名字空间 # 这里我们没有指定第三个参数,也就是局部名字空间 # 如果指定了全局名字空间、但没有指定局部名字空间 # 那么局部名字空间默认和全局名字空间保持一致 exec("name = 'satori'", dct) print(dct["name"]) # satori
至于 eval 也是同理:
dct = {"seq": [1, 2, 3, 4, 5]} try: print(eval("sum(seq)")) except NameError as e: print(e) # name 'seq' is not defined # 告诉我们 seq 没有被定义 # 因为我们需要将 dct 作为名字空间 print(eval("sum(seq)", dct)) # 15
所以名字空间本质上就是一个字典,所谓的变量不过是字典里面的一个 key。为了进一步加深印象,
再举个模块的例子:
# 我们自定义一个模块吧 # 首先模块也是一个对象,类型为 <class 'module'> # 但是底层没有将这个类暴露给我们,所以需要换一种方式获取 import sys module = type(sys) # 以上就拿到了模块的类型对象,调用即可得到模块对象 my_module = module("自己定义的") print(sys) # <module 'sys' (built-in)> print(my_module) # <module '自己定义的'> # 此时的 my_module 啥也没有,我们为其添砖加瓦 my_module.__dict__["name"] = "古明地觉" print(my_module.name) # 古明地觉 # 给模块设置属性,本质上也是操作相应的属性字典 # 当然获取属性也是如此。如果再和exec结合的话 code = """ age = 16 def foo(): return "我是函数foo" from functools import reduce """ # 此时属性就设置在了模块的属性字典里面 exec(code, my_module.__dict__) print(my_module.age) # 16 print(my_module.foo()) # 我是函数foo print(my_module.reduce(int.__add__, [1, 2, 3, 4, 5])) # 15
怎么样,是不是很有趣呢?以上就是本次分享的所有内容,想要了解更多欢迎前往公众号:Python编程学习圈,每日干货分享
到此这篇关于Python学习之名字,作用域,名字空间的文章就介绍到这了,更多相关Python名字内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!