python如何实现全角半角的相互转换
作者:西奥斯
这篇文章主要介绍了python如何实现全角半角的相互转换方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教
转换说明
全角半角转换说明
有规律(不含空格):
- 全角字符unicode编码从65281~65374 (十六进制 0xFF01 ~ 0xFF5E)
- 半角字符unicode编码从33~126 (十六进制 0x21~ 0x7E)
特例
空格比较特殊,全角为 12288(0x3000),半角为 32(0x20)
# 正则直接把全角空格替换为半角空格 text2 = re.sub('\s+', ' ', str1)
除空格外,全角/半角按unicode编码排序在顺序上是对应的(半角 + 0x7e= 全角),所以可以直接通过用+-法来处理非空格数据,对空格单独处理。
注:
- 中文文字永远是全角,只有英文字母、数字键、符号键才有全角半角的概念,
- 一个字母或数字占一个汉字的位置叫全角,占半个汉字的位置叫半角。
字符串整个替换
def strQ2B(ustring): """全角转半角""" rstring = "" for uchar in ustring: inside_code = ord(uchar) print(inside_code) if inside_code == 12288: # 全角空格直接转换 inside_code = 32 elif 65281 <= inside_code <= 65374: # 全角字符(除空格)根据关系转化 inside_code -= 65248 rstring += unichr(inside_code) return rstring def strB2Q(ustring): """半角转全角""" rstring = "" for uchar in ustring: inside_code = ord(uchar) if inside_code == 32: # 半角空格直接转化 inside_code = 12288 elif 32 <= inside_code <= 126: # 半角字符(除空格)根据关系转化 inside_code += 65248 rstring += unichr(inside_code) return rstring
总结
以上为个人经验,希望能给大家一个参考,也希望大家多多支持脚本之家。