Python文件系统模块pathlib库
作者:springsnow
一、pathlib库官方定义
pathlib 是Python内置库,Python 文档给它的定义是 Object-oriented filesystem paths(面向对象的文件系统路径)。pathlib 提供表示文件系统路径的类,其语义适用于不同的操作系统。
路径类在纯路径之间划分,纯路径提供纯粹的计算操作而没有 I / O,以及具体路径,它继承纯路径但也提供 I / O 操作。
二、pathlib秘籍
1、 基本用法
- Path.iterdir() # 遍历目录的子目录或者文件
- Path.is_dir() # 判断是否是目录
- Path.glob() # 过滤目录(返回生成器)
- Path.resolve() # 返回绝对路径
- Path.exists() # 判断路径是否存在
- Path.open() # 打开文件(支持with)
- Path.unlink() # 删除文件或目录(目录非空触发异常)
2、 基本属性
- Path.parts # 分割路径 类似os.path.split(), 不过返回元组
- Path.drive # 返回驱动器名称
- Path.root # 返回路径的根目录
- Path.anchor # 自动判断返回drive或root
- Path.parents # 返回所有上级目录的列表
3、 改变路径
- Path.with_name() # 更改路径名称, 更改最后一级路径名
- Path.with_suffix() # 更改路径后缀
4、 拼接路径
- Path.joinpath() # 拼接路径
- Path.relative_to() # 计算相对路径
5、 测试路径
- Path.match() # 测试路径是否符合pattern
- Path.is_dir() # 是否是文件
- Path.is_absolute() # 是否是绝对路径
- Path.is_reserved() # 是否是预留路径
- Path.exists() # 判断路径是否真实存在
6、 其他方法
- Path.cwd() # 返回当前目录的路径对象
- Path.home() # 返回当前用户的home路径对象
- Path.stat() # 返回路径信息, 同os.stat()
- Path.chmod() # 更改路径权限, 类似os.chmod()
- Path.expanduser() # 展开~返回完整路径对象
- Path.mkdir() # 创建目录
- Path.rename() # 重命名路径
- Path.rglob() # 递归遍历所有子目录的文件
三、os和pathlib.Path的区别
相对于 os 模块的 path 方法,Python3 标准库 pathlib 模块的 Path 对路径的操作会更简单。
1、 获取当前文件路径
使用 os 模块时,通过 getcwd()
方法可以直接获取当前文件路径
在 Pycharm 中,可以使用 os.path.dirname(__file__)
获取当前文件路径,因为 Python 并没有提供 __file__ 这个概念,他是 Pycharm 提供的:
import os print(os.getcwd()) # C:\Users\bobin.yang\PycharmProjects\untitled print(os.path.dirname(__file__)) # C:/Users/bobin.yang/PycharmProjects/untitled
在 pathlib 模块中,通过 Path.cwd()
方法可以直接获取当前文件路径,我们可以动手试一试:
import pathlib print(pathlib.Path.cwd()) # C:\Users\bobin.yang\PycharmProjects\untitled
通过 Pycharm 我们可以使用快捷键 ctrl+鼠标左键
点击查看该方法的详细介绍。
从上图中可以看出 cwd()
方法不过是对 os 库中 getcwd()
方法进行了封装,看起来好像更差劲了,但是官方的推出一定不是子虚乌有的,现在让我们一起来揭秘。
2、 获取上层/上层目录
上面那个案例仿佛让 pashlib 库的使用变得更加复杂了,为了揭秘,我们只能一同感受下 pathlib 库的构成,了解 pathlib 库如何带给我们便捷。
在 os 模块中,如果我们要获取某一个文件的父目录,os 模块的写法为:
import os print(os.path.dirname(os.path.dirname(os.getcwd()))) # C:\PycharmProjects
在 pathlib 库中,可以通过这样简洁方法实现:
import pathlib print(pathlib.Path.cwd().parent) # C:\PycharmProjects
并且,如果你需要找他爷爷,是不是再来一个 .parent
就行了。相比较 os 模块的 os.path.dirname()
是不是方便太多太多了?
3、 路径拼接
如果你要在他父目录中拼接路径,通过 os 模块你可能需要写这么一长串代码:
import os print(os.path.join(os.path.dirname(os.getcwd()), '路径拼接', '真麻烦')) # C:\PycharmProjects\路径拼接\真麻烦
当你使用 pathlib 的时候,我们一起来感受他的便捷之处吧!
# /Users/mac/test.py import os paths = ('路径拼接', '真麻烦') print(pathlib.Path.cwd().parent.joinpath(*paths)) # C:\PycharmProjects\路径拼接\真麻烦
通过 pathlib 库拼接路径,你可以很方便的调节他在他祖辈的位置,妙哉。
4、 其他封装
pathlib 封装了很多的 os.path 中的方法,如下所示:
- os.path.expanduser() --> pathlib.Path.home()
- os.path.expanduser() --> pathlib.Path.expanduser()
- os.stat() --> pathlib.Path.stat()
- os.chmod() --> pathlib.Path.chmod()
四、pathlib.PurePath的使用
上一节的操作大部分都是通过 pathlib 库中的 Path 实现,其实他还有一个更加高大上的模块,也就是我们这一节的主角:pathlib.PurePath
。
PurePath 是一个纯路径对象,纯路径对象提供了实际上不访问文件系统的路径处理操作。
有三种方法可以访问这些类,我们也称之为 flavor 。
1、 PurePath.match
下面让我们来实现一个神奇的功能,判断当前的路径下是否有符合'*.py'规则的文件。
import pathlib print(pathlib.PurePath(__file__).match('*.py')) # True
输出为什么会是 True
呢?因为当前文件夹下不就有一个 test.py
吗?
2、 PurePath的子类:PurePosixPath(非Windows系统)、PureWindowsPath
看见 pathlib.PurePath 后面跟着 match,那是不是能说明他是个对象,而不是一个单纯的路径字符串,因此我们可以试着打印 pathlib.PurePath 看一看。
import pathlib os_path = os.path.dirname(__file__) print(os_path) # C:/PycharmProjects/untitled pure_path = pathlib.PurePath(__file__) print(pure_path) # C:\PycharmProjects\untitled\run.py print(type(pure_path)) # <class 'pathlib.PureWindowsPath'> print(pathlib.PurePath(__file__).match('*.py')) # True
通过打印 os.path 获取当前路径的结果,得到一个路径字符串;而通过 pathlib.PurePath 则获得了一个 PurePosixPath 对象,并且由此得到的路径包括了当前文件 run.py。
到此这篇关于Python文件系统模块pathlib库的文章就介绍到这了。希望对大家的学习有所帮助,也希望大家多多支持脚本之家。