首页 > 脚本专栏 > python > Python处理字符串中文编码

Python处理字符串中文(汉字)编码的实例

2024-04-17 09:02:03 作者：蛋蛋の微笑

这篇文章主要介绍了Python处理字符串中文(汉字)编码的实例,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教

Python处理字符串中文(汉字)编码

在实际开发中，发现打印Python打印经常出现乱码，大部分都是编码引起

所有的utf-8和gbk编码都得通过unicode编码进行转码如图：

首先，我们可以查看自己的字符串是什么编码格式：

注意：

在Python3 中，需要将strTest转换成二进制，再获取编码格式；

而在2.x时，不需要转换，之接传入：print chardet.detect(strTest)

import chardet
strTest = "这是一个测试用例"
print(chardet.detect(str_test.encode()))

得到输出结果：

然后根据你的需要转码：

如 xxx.decode('utf-8').encode('gbk')

str_to_gbk = str_test.encode('gbk')
print(chardet.detect(str_to_gbk))

另外，有些时候，我们输出打印时，会出现中文打印是 \uxxx 等，可以试试以下代码：

xxx.encode('utf-8').decode('unicode_escape')

以上为个人经验，希望能给大家一个参考，也希望大家多多支持脚本之家。