Python 忽略文件名编码的方法
作者:David Beazley
这篇文章主要介绍了Python 忽略文件名编码的方法,文中讲解非常细致,代码帮助大家更好的理解和学习,感兴趣的朋友可以了解下
问题
你想使用原始文件名执行文件的I/O操作,也就是说文件名并没有经过系统默认编码去解码或编码过。
解决方案
默认情况下,所有的文件名都会根据 sys.getfilesystemencoding()
返回的文本编码来编码或解码。比如:
>>> sys.getfilesystemencoding() 'utf-8' >>>
如果因为某种原因你想忽略这种编码,可以使用一个原始字节字符串来指定一个文件名即可。比如:
>>> # Wrte a file using a unicode filename >>> with open('jalape\xf1o.txt', 'w') as f: ... f.write('Spicy!') ... 6 >>> # Directory listing (decoded) >>> import os >>> os.listdir('.') ['jalapeño.txt'] >>> # Directory listing (raw) >>> os.listdir(b'.') # Note: byte string [b'jalapen\xcc\x83o.txt'] >>> # Open file with raw filename >>> with open(b'jalapen\xcc\x83o.txt') as f: ... print(f.read()) ... Spicy! >>>
正如你所见,在最后两个操作中,当你给文件相关函数如 open()
和 os.listdir()
传递字节字符串时,文件名的处理方式会稍有不同。
讨论
通常来讲,你不需要担心文件名的编码和解码,普通的文件名操作应该就没问题了。 但是,有些操作系统允许用户通过偶然或恶意方式去创建名字不符合默认编码的文件。 这些文件名可能会神秘地中断那些需要处理大量文件的Python程序。
读取目录并通过原始未解码方式处理文件名可以有效的避免这样的问题, 尽管这样会带来一定的编程难度。
关于打印不可解码的文件名,请参考
以上就是Python 忽略文件名编码的方法的详细内容,更多关于Python 忽略文件名编码的资料请关注脚本之家其它相关文章!
您可能感兴趣的文章:
- Python 编码规范(Google Python Style Guide)
- python 编码规范整理
- Python 常用 PEP8 编码规范详解
- Python开发编码规范
- Python3 json模块之编码解码方法讲解
- 解决python3 中的np.load编码问题
- python源文件的字符编码知识点详解
- Python新建项目自动添加介绍和utf-8编码的方法
- python3中编码获取网页的实例方法
- 关于Python字符编码与二进制不得不说的一些事
- 详解Python中的编码问题(encoding与decode、str与bytes)
- Python2与Python3关于字符串编码处理的差别总结
- python基础之编码规范总结