python遍历文件夹的各种方法大全
作者:骐骥1
前言
Python 提供了一些库,可以帮助我们实现文件夹遍历。在本文中,我将介绍三种常用的遍历文件夹的方法,并且给出每种方法的使用示例和优缺点分析。
方法一:os.walk()
os.walk() 是 Python 中最常用的遍历文件夹的方法。这个方法会自动地递归遍历文件夹中的所有子文件夹。在遍历过程中,返回的是一个元组(root, dirs, files),其中 root 表示当前遍历到的文件夹的路径,dirs 表示当前文件夹下的子文件夹,files 表示当前文件夹下的所有文件。
import os # 遍历文件夹 def traversal_folder(folder_path): for root, dirs, files in os.walk(folder_path): # 遍历当前文件夹下的所有文件 for file_name in files: file_path = os.path.join(root, file_name) print(file_path) # 调用函数 folder_path = r"D:\data" traversal_folder(folder_path)
优点:os.walk() 能够自动遍历文件夹下的子文件夹,无需手动递归。
缺点:对于大型文件夹,os.walk() 会占用大量的内存,因为它需要把所有的文件都存储在内存中,会导致程序崩溃。
方法二:os.listdir()
os.listdir() 是 Python 中另一种常用的遍历文件夹的方法。这个方法会返回指定路径下的所有文件和文件夹的列表,但是不会递归遍历。
import os # 遍历文件夹 def traversal_folder(folder_path): for file_name in os.listdir(folder_path): file_path = os.path.join(folder_path, file_name) print(file_path) # 调用函数 folder_path = r"D:\data" traversal_folder(folder_path)
优点:os.listdir() 执行速度比 os.walk() 更快。
缺点:os.listdir() 不会递归遍历,如果需要递归遍历的话,还需要在函数中加入递归操作。
方法三:glob.glob()
glob.glob() 是 Python 中一种使用比较少见的遍历文件夹的方法。这个方法会根据指定的文件名模式匹配到的所有文件和文件夹,并以一个列表的形式返回。类似于 os.listdir(),不会递归遍历。
import glob # 遍历文件夹 def traversal_folder(folder_path): for file_path in glob.glob(os.path.join(folder_path, '*')): print(file_path) # 调用函数 folder_path = r"D:\data" traversal_folder(folder_path)
优点:glob.glob() 使用简单,代码量少。
缺点:glob.glob() 不会递归遍历,如果需要递归遍历的话,还需要在函数中加入递归操作。
结论
以上就是三种常用的 Python 遍历文件夹的方法。在实际使用中,我们可以根据具体情况选择不同的方法来实现文件夹的遍历。如果需要递归遍历,建议使用 os.walk() 方法,如果只需要遍历当前文件夹,建议使用 os.listdir() 或 glob.glob() 方法。
到此这篇关于python遍历文件夹的各种方法大全的文章就介绍到这了,更多相关python遍历文件夹内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!