Python如何显示所有汉字
作者:不在同一频道上的呆子
这篇文章主要介绍了Python如何显示所有汉字问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教
Python显示所有汉字
我们知道,在我们目前使用的计算机系统中,所有的数据都是以二进制形式表示的,而中文字符包含了大量的汉字、标点符号和其他特殊字符,需要通过编码方式将其转换为二进制数据进行处理。
其中,中文编码是将中文字符表示为计算机可以理解和处理的二进制数据的过程。
常见的中文编码方式有:GB2312、GBK、GB18030、Unicode。
在互联网应用中我们一般使用Unicode编码方式,所以本文就是通过遍历Unicode编码并把编码转换为字符,从而获取所有汉字。
在Unicode编码中,汉字的编码范围:0x4e00 ~ 0x9fa5
两个相关函数
- ord()函数:查看字符对应的编码
- chr()函数:将编码处理成对应的字符
具体实现所有汉字
for j in range(0x4e00, 0x6fa5 + 1): print(chr(j), end='')
python汉字字符处理
一、输出一串汉字字符串
#-*—coding:utf8-*- def txt_test(): string = u'今天你有毒!' print string txt_test()
输出:
二、输出字符串长度
#-*—coding:utf8-*- def txt_test(): string = '今天你有毒!' print string print len(string) txt_test()
输出: 18–与汉字的长度不符。
三、解码成UTF-8格式并测量长度
- 方法一:
#-*—coding:utf8-*- def txt_test(): string = u'今天你有毒!' print string print len(string) txt_test()
- 方法二:
#-*—coding:utf8-*- def txt_test(): string = '今天你有毒!' print string print len(string) print len(string.decode('utf-8')) txt_test()
输出:6–和汉字实际的长度一致。
四、把汉字字符串一个汉字一个汉字的输出
- 方法一:
#-*—coding:utf8-*- def txt_test(): string = u'今天你有毒!' print string print len(string) print len(string) for i in range(0,len(string),1): print string[i] txt_test()
输出:
- 方法二:
#-*—coding:utf8-*- def txt_test(): string = '今天你有毒!' print string print len(string) print len(string.decode('utf-8')) for i in range(0,len(string.decode('utf-8')),1): print string.decode('utf-8')[i] txt_test()
输出:
五、判断汉字字符串里面是否有某个汉字
- 方法一:
#-*—coding:utf8-*- def txt_test(): string = u'今天你有毒!' print string print len(string) print len(string) for i in range(0,len(string),1): print string[i] if string[i] == u'毒': print u'这句话里有个毒' txt_test()
- 方法二:
#-*—coding:utf8-*- def txt_test(): string = '今天你有毒!' print string print len(string) print len(string.decode('utf-8')) for i in range(0,len(string.decode('utf-8')),1): print string.decode('utf-8')[i] if string.decode('utf-8')[i] == u'毒': print '这句话里有个毒' txt_test()
输出:
总结
以上为个人经验,希望能给大家一个参考,也希望大家多多支持脚本之家。