python

关注公众号 jb51net

关闭
首页 > 脚本专栏 > python > Python文件与目录自动化

Python使用os、pathlib、shutil实现文件与目录自动化实战

作者:我材不敲代码

在日常办公、开发运维、数据处理场景中,文件操作是最高频的需求之一手动操作重复繁琐、效率极低,而Python可以通过内置库实现全自动化处理,本文将从现代首选pathlib入手,循序渐进讲解三大库的核心用法,搭配可直接运行的代码案例,需要的朋友可以参考下

前言

在日常办公、开发运维、数据处理场景中,文件操作是最高频的需求之一:批量重命名照片、分类整理文档、批量压缩文件夹、清理无用缓存文件、批量读写数据文件等。手动操作重复繁琐、效率极低,而Python可以通过内置库实现全自动化处理。

Python文件自动化核心依赖三大内置库,无需额外安装,开箱即用,覆盖基础路径处理、系统级操作、高级批量文件处理全场景,是Python自动化必备核心技能。

Python 文件操作三大核心库对比:

对比维度

pathlib

os

shutil

定位

现代面向对象路径操作

系统级底层文件/目录操作

高级文件批量操作

Python版本

3.4+ 新增

全版本兼容

全版本兼容

代码风格

简洁优雅、面向对象

函数式、传统繁琐

功能聚合、调用简单

核心优势

路径处理极简、跨平台、可读性强

权限操作、系统参数获取、兼容性强

支持文件夹整体复制、压缩、递归操作

学习难度

推荐场景

日常90%文件路径操作

系统配置、权限修改、兼容旧项目

批量复制、移动、压缩、删除文件夹

本文将从现代首选pathlib入手,循序渐进讲解三大库的核心用法,搭配可直接运行的代码案例,最后通过综合实战,带你掌握文件自动化全流程开发。

第一章:核心库对比与环境准备

1.1 三大文件库定位区别

很多新手会混淆os、pathlib、shutil三个库,简单一句话区分:

1.2 环境与导入方式

三个库均为Python内置标准库,无需pip安装,直接导入即可使用:

# 导入三大核心库
from pathlib import Path
import os
import shutil

第二章:pathlib —— 现代Python文件操作首选

pathlib采用面向对象设计,摒弃了os.path繁琐的字符串拼接方式,跨平台兼容性极强(自动适配Windows/Linux/Mac路径分隔符),是目前Python官方推荐的文件操作方式。

2.1 Path路径创建与解析

支持绝对路径、相对路径创建,可快速拼接路径、获取路径各层级信息:

from pathlib import Path

# 1. 创建相对路径
p1 = Path("test/file.txt")
# 2. 创建绝对路径
p2 = Path("/Users/xxx/Desktop/file.txt")
# 3. 拼接路径(极简写法,替代字符串拼接)
p3 = Path("test") / "img" / "photo.jpg"

# 路径信息解析
print("文件名:", p3.name)          # photo.jpg
print("文件后缀:", p3.suffix)      # .jpg
print("纯文件名:", p3.stem)        # photo
print("上级目录:", p3.parent)      # test/img
print("是否绝对路径:", p3.is_absolute())

2.2 路径判断与属性获取

快速判断路径是否存在、是文件还是文件夹,获取文件大小、修改时间等属性:

from pathlib import Path

p = Path("test.jpg")

# 基础判断
print("路径是否存在:", p.exists())
print("是否是文件:", p.is_file())
print("是否是文件夹:", p.is_dir())

# 文件属性
if p.exists():
    print("文件大小(字节):", p.stat().st_size)
    print("最后修改时间:", p.stat().st_mtime)

2.3 文件/目录创建与删除

from pathlib import Path

# 1. 创建单层目录
dir1 = Path("test_dir")
dir1.mkdir(exist_ok=True)  # exist_ok=True 存在则不报错

# 2. 创建多级嵌套目录
dir2 = Path("a/b/c")
dir2.mkdir(parents=True, exist_ok=True)

# 3. 创建空文件
file = Path("test.txt")
file.touch(exist_ok=True)

# 4. 删除文件/空目录
file.unlink(missing_ok=True)  # 删除文件
dir1.rmdir()  # 删除空目录

2.4 遍历目录与批量匹配文件

支持遍历文件夹、批量筛选指定后缀文件,是批量处理的核心功能:

from pathlib import Path

# 目标文件夹
root = Path("./photos")

# 1. 遍历当前目录所有文件(不递归)
for file in root.iterdir():
    if file.is_file():
        print("文件:", file.name)

# 2. 批量匹配所有jpg/png图片(递归遍历子文件夹)
img_list = list(root.rglob("*.jpg")) + list(root.rglob("*.png"))
print("图片总数:", len(img_list))

# 3. 匹配所有txt文档
txt_list = list(root.rglob("*.txt"))

2.5 文件读写极简操作

pathlib简化了文件读写操作,无需手动open/close,代码更简洁:

from pathlib import Path

file = Path("data.txt")

# 写入内容(覆盖写入)
file.write_text("Hello Python文件自动化!", encoding="utf-8")

# 追加内容
file.write_text("\n新增一行内容", encoding="utf-8")

# 读取内容
content = file.read_text(encoding="utf-8")
print("文件内容:", content)

# 读写二进制文件(图片、视频等)
img = Path("test.jpg")
img_data = img.read_bytes()

第三章:os模块 —— 底层系统级文件操作

os模块是Python传统文件操作核心,主打系统层级操作,适合需要兼容旧项目、修改文件权限、获取系统路径的场景。

3.1 常用路径与目录操作

import os

# 获取当前工作目录
print("当前目录:", os.getcwd())

# 切换工作目录
os.chdir("./test")

# 创建/删除目录
os.mkdir("os_dir")  # 单层目录
os.makedirs("x/y/z", exist_ok=True)  # 多级目录
os.rmdir("os_dir")  # 删除空目录

# 路径拼接(传统方式)
path = os.path.join("test", "img", "1.jpg")
print("拼接路径:", path)

# 判断路径
print(os.path.exists(path))
print(os.path.isfile(path))
print(os.path.isdir(path))

3.2 系统环境与文件权限操作

import os

# 获取系统环境变量
print("系统PATH:", os.environ.get("PATH"))

# 修改文件权限(Linux/Mac生效)
os.chmod("test.txt", 0o755)

# 获取文件绝对路径
abs_path = os.path.abspath("test.txt")
print("绝对路径:", abs_path)

3.3 传统文件遍历方法

import os

# 遍历目录所有文件
for root, dirs, files in os.walk("./test"):
    print("当前遍历目录:", root)
    print("子文件夹:", dirs)
    print("所有文件:", files)

第四章:shutil —— 高级文件批量操作工具

os和pathlib无法直接复制/移动非空文件夹,也不支持压缩解压,shutil完美弥补该短板,是批量文件处理的核心工具。

4.1 文件/文件夹复制与移动

import shutil

# 1. 复制单个文件
shutil.copy("test.txt", "copy_test.txt")

# 2. 复制整个文件夹(包含所有子文件)
shutil.copytree("./src_dir", "./dst_dir", dirs_exist_ok=True)

# 3. 移动文件/文件夹
shutil.move("copy_test.txt", "./dst_dir/copy_test.txt")

# 4. 重命名文件
shutil.move("old_name.txt", "new_name.txt")

4.2 批量删除与递归清空

import shutil

# 递归删除整个文件夹(包含所有文件和子文件夹)
shutil.rmtree("./dst_dir", ignore_errors=True)

4.3 压缩与解压文件

import shutil
import zipfile

# 1. 压缩整个文件夹为zip
shutil.make_archive("压缩包", "zip", "./src_dir")

# 2. 解压zip文件
with zipfile.ZipFile("压缩包.zip", "r") as zip_ref:
    zip_ref.extractall("./解压目录")

第五章:综合实战:文件批量自动化工具

整合三大库核心功能,开发3个可直接落地的实战脚本,覆盖日常高频自动化场景。

5.1 实战1:批量重命名文件

批量修改文件夹内所有图片名称,统一格式:序号+自定义名称

from pathlib import Path

def batch_rename(folder_path, prefix="风景"):
    """批量重命名图片文件"""
    path = Path(folder_path)
    # 筛选所有图片
    img_list = list(path.glob("*.jpg")) + list(path.glob("*.png"))
    
    for idx, file in enumerate(img_list, 1):
        # 新文件名
        new_name = f"{prefix}_{idx}{file.suffix}"
        new_path = path / new_name
        file.rename(new_path)
        print(f"重命名成功: {file.name} → {new_name}")

# 调用
batch_rename("./photos", prefix="旅行照片")

5.2 实战2:分类整理不同格式文件

自动识别文件后缀,将图片、文档、视频、压缩包分类归档

from pathlib import Path
import shutil

def classify_files(folder_path):
    """文件自动分类整理"""
    path = Path(folder_path)
    # 定义文件分类规则
    classify_rule = {
        "图片": [".jpg", ".png", ".jpeg", ".gif"],
        "文档": [".txt", ".pdf", ".docx", ".xlsx"],
        "压缩包": [".zip", ".rar", ".7z"],
        "视频": [".mp4", ".avi", ".mov"]
    }

    # 遍历所有文件
    for file in path.iterdir():
        if file.is_dir():
            continue
        suffix = file.suffix.lower()
        # 匹配分类
        for folder, suffix_list in classify_rule.items():
            if suffix in suffix_list:
                target_dir = path / folder
                target_dir.mkdir(exist_ok=True)
                shutil.move(str(file), str(target_dir / file.name))
                print(f"分类成功: {file.name} → {folder}")
                break

# 调用
classify_files("./混合文件")

5.3 实战3:批量压缩指定目录文件

import shutil
from datetime import datetime

def zip_folder(folder_path):
    """批量压缩文件夹,命名带时间戳"""
    now = datetime.now().strftime("%Y%m%d%H%M%S")
    zip_name = f"文件备份_{now}"
    shutil.make_archive(zip_name, "zip", folder_path)
    print(f"压缩完成,文件名称:{zip_name}.zip")

# 调用
zip_folder("./photos_processed")

三大库选择指南与最佳实践

业务需求

推荐库

核心原因

路径拼接、文件遍历、批量筛选

pathlib

代码简洁、跨平台、可读性极强

文件读写、判断文件属性

pathlib

极简API,无需手动管理文件句柄

系统环境获取、文件权限修改

os

专属系统级操作,无替代方案

兼容老旧Python项目

os/os.path

低版本Python不支持pathlib

文件夹整体复制、递归删除

shutil

唯一支持批量文件夹操作的内置库

文件压缩、解压、批量迁移

shutil+zipfile

功能完善、开箱即用

总结

1、优先使用pathlib:日常90%的文件路径、遍历、读写场景,pathlib都是最优选择,代码更优雅、跨平台兼容性更好。

2、os作为补充:仅在需要系统级操作、兼容旧项目时使用。

3、shutil处理批量复杂操作:文件夹复制、递归删除、压缩解压必备。

三者组合使用,可以实现所有文件自动化场景,彻底解放双手,大幅提升办公和开发效率。

以上就是Python使用os、pathlib、shutil实现文件与目录自动化实战的详细内容,更多关于Python文件与目录自动化的资料请关注脚本之家其它相关文章!

您可能感兴趣的文章:
阅读全文