Python中的bytes类型用法及实例分享
作者:Mar丶流年
前言;
Python bytes
类型用来表示一个字节串。“字节串“不是编程术语,是我自己“捏造”的一个词,用来和字符串相呼应。
bytes 是 Python 3.x 新增的类型,在 Python 2.x
中是不存在的。
字节串(bytes)和字符串(string)的对比:
- 字符串由若干个字符组成,以字符为单位进行操作;字节串由若干个字节组成,以字节为单位进行操作。
- 字节串和字符串除了操作的数据单元不同之外,它们支持的所有方法都基本相同。
- 字节串和字符串都是不可变序列,不能随意增加和删除数据。
bytes
只负责以字节序列的形式(二进制形式)来存储数据,至于这些数据到底表示什么内容(字符串、数字、图片、音频等),完全由程序的解析方式决定。如果采用合适的字符编码方式(字符集),字节串可以恢复成字符串;反之亦然,字符串也可以转换成字节串。
说白了,bytes 只是简单地记录内存中的原始数据,至于如何使用这些数据,bytes 并不在意,你想怎么使用就怎么使用,bytes 并不约束你的行为。
bytes 类型的数据非常适合在互联网上传输,可以用于网络通信编程;bytes
也可以用来存储图片、音频、视频等二进制格式的文件。
字符串和 bytes 存在着千丝万缕的联系,我们可以通过字符串来创建 bytes
对象,或者说将字符串转换成 bytes 对象。
有以下三种方法可以达到这个目的:
- 如果字符串的内容都是 ASCII 字符,那么直接在字符串前面添加b前缀就可以转换成
bytes
。 - bytes 是一个类,调用它的构造方法,也就是 bytes(),可以将字符串按照指定的字符集转换成 bytes;如果不指定字符集,那么默认采用 UTF-8。
- 字符串本身有一个
encode()
方法,该方法专门用来将字符串按照指定的字符集转换成对应的字节串;如果不指定字符集,那么默认采用 UTF-8。
1.bytes定义
例1:通过b'string
'定义bytes类型,但不支持中文(出现中文则报错)
例2:可以通过string.encoding('utf-8')
将字符串转换成bytes类型(兼容中文),还原通过bytes.decode('utf-8')
# coding:utf-8 if __name__ == '__main__': # 例1 b = b'abc123' print(b) # b'abc123' print(type(b)) # <class 'bytes'> # c = b'我abc123' Error # 例2 c = '我abc123' c = c.encode('utf-8') print(c) # b'\xe6\x88\x91abc123' print(type(c)) # <class 'bytes'> print(c.decode('utf-8')) # 我abc123
2.bytes方法
例1:string有的方法bytes大部分都有(但其字符串参数必须是bytes类型)
# coding:utf-8 if __name__ == '__main__': b = b'abc123' print(b.find(b'a')) # 0 c = 'abc123' print(c.find('a')) # 0 # b.find('a') Error 参数必须是bytes print(b.replace(b'a', b'f')) # b'fbc123' print(c.replace('a', 'f')) # fbc123 # b.replace('a', 'f') Error 参数必须是bytes
3.使用不同方式创建 bytes 对象
#通过构造函数创建空 bytes b1 = bytes() #通过空字符串创建空 bytes b2 = b'' #通过b前缀将字符串转换成 bytes b3 = b'http://c.biancheng.net/python/' print("b3: ", b3) print(b3[3]) print(b3[7:22]) #为 bytes() 方法指定字符集 b4 = bytes('C语言中文网8岁了', encoding='UTF-8') print("b4: ", b4) #通过 encode() 方法将字符串转换成 bytes b5 = "C语言中文网8岁了".encode('UTF-8') print("b5: ", b5)
运行结果:
b3: b'http://c.biancheng.net/python/'
112
b'c.biancheng.net'
b4: b'C\xe8\xaf\xad\xe8\xa8\x80\xe4\xb8\xad\xe6\x96\x87\xe7\xbd\x918\xe5\xb2\x81\xe4\xba\x86'
b5: b'C\xe8\xaf\xad\xe8\xa8\x80\xe4\xb8\xad\xe6\x96\x87\xe7\xbd\x918\xe5\xb2\x81\xe4\xba\x86'
从运行结果可以发现,对于非 ASCII 字符,print 输出的是它的字符编码值(十六进制形式),而不是字符本身。非 ASCII 字符一般占用两个字节以上的内存,而 bytes 是按照单个字节来处理数据的,所以不能一次处理多个字节。
到此这篇关于Python中的bytes类型及其用法的文章就介绍到这了,更多相关Python中的bytes类型内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!