首页 > 脚本专栏 > python > Python调用df.to_csv()出现中文乱码

解决Python调用df.to_csv()出现中文乱码的问题

2024-09-18 12:12:34 作者：必须掂水

在Python使用df.to_csv()时,若出现中文乱码,可通过加入参数encoding="utf_8_sig"解决,"utf-8"编码不包含BOM,直接处理文件时会将BOM误读为内容；而"utf_8_sig"会识别并处理BOM,避免乱码,此方法为实践经验,供参考

Python调用df.to_csv()出现中文乱码

df = pd.DataFrame(data=total_info,
columns=[‘公司全名', ‘公司简称', ‘公司规模', ‘融资阶段', ‘区域', ‘职位名称', ‘工作经验', ‘学历要求', ‘薪资', ‘职位福利', ‘经营范围',
‘职位类型', ‘公司福利', ‘第二职位类型', ‘城市'])
df.to_csv(‘C:/Users/Shinelon/Desktop/Python_development_engineer.csv', index=False)

结果出现乱码：

解决方案

加上**encoding=“utf_8_sig”**就好了。

df.to_csv(‘C:/Users/Shinelon/Desktop/Python_development_engineer.csv', encoding=“utf_8_sig”)

注意注意

‘utf-8’ 和 ‘utf_8_sig’ 的区别：

”utf-8“ 是以字节为编码单元，它的字节顺序在所有系统中都是一样的，没有字节序问题，因此它不需要BOM，所以当用"utf-8"编码方式读取带有BOM的文件时，它会把BOM当做是文件内容来处理。
“uft-8-sig"中sig（ signature ）是"带有签名的utf-8”，所以"utf-8-sig"读取带有BOM的"utf-8文件时"会把BOM单独处理，与文本内容隔离开。

总结

以上为个人经验，希望能给大家一个参考，也希望大家多多支持脚本之家。

解决Python调用df.to_csv()出现中文乱码的问题

Python调用df.to_csv()出现中文乱码

解决方案

注意注意

总结

您可能感兴趣的文章: