python

关注公众号 jb51net

关闭
首页 > 脚本专栏 > python > Python处理字符串中文编码

Python处理字符串中文(汉字)编码的实例

作者:蛋蛋の微笑

这篇文章主要介绍了Python处理字符串中文(汉字)编码的实例,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教

Python处理字符串中文(汉字)编码

在实际开发中,发现打印Python打印经常出现乱码,大部分都是编码引起

简单说一下utf-8/ gbk/ unicode编码之间的相互转换问题

所有的utf-8和gbk编码都得通过unicode编码进行转码如图:

首先,我们可以查看自己的字符串是什么编码格式:

注意:

在Python3 中,需要将strTest转换成二进制,再获取编码格式;

而在2.x时,不需要转换,之接传入:print chardet.detect(strTest)

import chardet
strTest = "这是一个测试用例"
print(chardet.detect(str_test.encode()))

得到输出结果:

然后根据你的需要转码:

如   xxx.decode('utf-8').encode('gbk')

python有两个函数 decode() 和 encode()

str_to_gbk = str_test.encode('gbk')
print(chardet.detect(str_to_gbk))

另外,有些时候,我们输出打印时,会出现中文打印是 \uxxx 等,可以试试以下代码:

xxx.encode('utf-8').decode('unicode_escape')

总结

以上为个人经验,希望能给大家一个参考,也希望大家多多支持脚本之家。

您可能感兴趣的文章:
阅读全文