python

关注公众号 jb51net

关闭
首页 > 脚本专栏 > python > pathlib 面向对象文件系统路径

python中pathlib 面向对象的文件系统路径

作者:LKIDTI数据

文章介绍了Python 3.4+内置的标准库pathlib,该库提供面向对象的文件系统路径处理,通过pathlib,可以更方便地进行路径操作,感兴趣的朋友一起看看吧

pathlib:面向对象的文件系统路径

pathlib官方介绍: Python3.4+内置的标准库,Object-oriented filesystem paths(面向对象的文件系统路径)

1. 使用示例

1.1 最常用:获取项目目录

os.path方法

import os
project_dir = os.path.dirname(os.path.dirname(os.path.abspath(__file__)))
print(project_dir)  # /Users/root/Code/project
print(type(project_dir))  # <class 'str'>

pathlib方法

from pathlib import Path
project_dir = Path(__file__).resolve().parent.parent
print(project_dir)  # /Users/root/Code/project
print(type(project_dir))  # <class 'pathlib.PosixPath'>

1.2 遍历一个目录下指定文件

os方法

file_list = []
for file in os.listdir(csv_dir):
    if not file.endswith('.csv'):
        continue
    file_list.append(file)

pathlib方法

from pathlib import Path
csv_dir = Path(csv_dir)
file_list = csv_dir.glob('*.csv')

1.3 递归目录下的所有文件

os方法

os.walk方法

file_list = []
for root, dirs, files in os.walk('/Users/root/Code/project'):
  for f in files:
    if f.endswith('.py'):
      file_list.append(os.path.join(root, f))
# glob方法
from glob import glob
file_list = glob('/Users/root/Code/project/**/*.py', recursive=True)

pathlib方法

file_list = csv_dir.rglob('*.csv')  # 生成器对象

2. 优势对比

1、当需要获取多个层级目录时,os.path需要使用嵌套的写法,而pathlib则是正常的链式调用。pathlib的使用更加友好,使得路径对象更加明确。
2、os.path只用于基本的路径处理,如果需要其他操作如重命名/新建/复制文件等,需要用os下的其他模块。而pathlib可以用于处理路径相关操作,并且是一个轻量级的库。
3、os.path操作的路径时字符串,而pathlib操作的路径时对象。提供了对资源路径和资源命名结构的通用抽象。它把文件系统接口从os模块中隔离出来,打开了从应用层配置文件系统的大门。

换句话说,pathlib.Path这个接口代表的可以不仅是os的资源路径,还可以是HDFS的资源路径,RESTful API的资源路径。

3. 基本介绍

1、官网上给出的该模块提供表示文件系统路径的类,如下,其语义适用于不同的操作系统,路径类被分为提供纯计算操作而没有 I/O 的纯路径,以及从纯路径继承而来但提供 I/O 操作的具体路径。一般情况下,直接使用Path即可。

2、Path属性

4. 常见用法

获取当前文件绝对路径

from pathlib import Path
path = Path(__file__).resolve()
path
>>> /Users/root/Code/project/conf/path_conf.py

获取当前文件的上级目录

from pathlib import Path
path = Path(__file__).resolve()
path.parent
>>> /Users/root/Code/project/conf
path.parent.parent
>>> /Users/root/Code/project

获取文件名

from pathlib import Path
path = Path(__file__).resolve()
path.name
>>> path_conf.py
path.stem
>>> path_conf
path.suffix
>>> .py

修改文件名,修改后缀

from pathlib import Path
file = Path('data.csv')
new_file = file.with_name('result.csv')
new_file = file.with_suffix('.txt')

路径拼接

from pathlib import Path
root = Path(__file__).resolve().parent
# 方式1
conf_file = root / 'conf/path_conf.py'
# 方式2
conf_file = root / Path('conf/path_conf.py')
# 方式3
conf_file = root.joinpath('conf/path_conf.py')

路径判断

from pathlib import Path
path = Path(__file__).resolve()
path.is_file()  # 是否为文件
path.is_dir()  # 是否为目录
path.exists()  # 是否存在

文件操作

from pathlib import Path
file = Path(__file__).resolve()
file.touch()  # 新建文件
file.replace('../data.csv')  # 移动文件
file.unlink()  # 删除文件

读取文件

file = Path('../data/1.csv')
data = file.read_text()  # 读取文件
data = file.write_text()  # 写入文件
# 也可以作为普通路径使用
with open(file, 'r') as f:
  data = f.read()

5. 参考资料

https://docs.python.org/zh-cn/3/library/pathlib.html
https://www.cnblogs.com/heniu/p/12872604.html
https://zhuanlan.zhihu.com/p/87940289
https://zhuanlan.zhihu.com/p/33524938
https://www.jianshu.com/p/a820038e65c3
https://cloud.tencent.com/developer/article/1640696

您可能感兴趣的文章:
阅读全文