python

关注公众号 jb51net

关闭
首页 > 脚本专栏 > python > Python struct.unpack() 用法

Python struct.unpack() 用法及常见错误详解

作者:极客不孤独

struct.unpack() 是 Python 中用于将二进制数据(字节序列)解析为 Python 数据类型的函数,通常与 struct.pack() 配对使用,下面给大家介绍Python struct.unpack()用法及常见错误,感兴趣的朋友一起看看吧

struct.unpack() 是 Python 中用于将二进制数据(字节序列)解析为 Python 数据类型的函数,通常与 struct.pack() 配对使用。它根据指定的格式字符串(format string)解析字节流,并返回一个包含解析结果的元组。

一、函数语法

struct.unpack(format, buffer)

返回值:包含解析后数据的元组。

二、格式字符串详解

格式字符串由两部分组成:

字节顺序/对齐字符(可选):

字符含义大小端
@本地顺序(默认)系统依赖
=本地标准大小系统依赖
<小端(Little-Endian)低位在前
>大端(Big-Endian)高位在前
!网络顺序(大端)RFC 标准

数据类型字符(必选):

字符C 类型Python 类型字节数
x填充字节跳过字节1
ccharbytes (长度1)1
bsigned charint1
Bunsigned charint1
?_Boolbool1
hshortint2
Hunsigned shortint2
iintint4
Iunsigned intint4
llongint4
Lunsigned longint4
qlong longint8
Qunsigned long longint8
ffloatfloat4
ddoublefloat8
schar[]bytes长度见下文
pPascal 字符串bytes1+长度
Pvoid*int系统依赖

特殊用法

特殊用法

三、使用示例

示例 1:解析整数和浮点数

import struct
# 二进制数据:小端顺序 (<) + int (i) + float (f)
buffer = b'\x01\x00\x00\x00\xcd\xcc\x8c@'
data = struct.unpack('<if', buffer)  # 解析1个int和1个float
print(data)  # 输出: (1, 7.000000476837158)

示例 2:解析字符串

# 数据:大端 (>) + 4字节字符串 (4s)
buffer = b'ABCD'
data = struct.unpack('>4s', buffer)
print(data)  # 输出: (b'ABCD',)

示例 3:解析混合类型

# 数据:小端 (<) + short (h) + 3字节字符串 (3s) + float (f)
buffer = b'\x01\x00XYZ\x00\x00\x80?'
data = struct.unpack('<h3sf', buffer)
print(data)  # 输出: (1, b'XYZ', 1.0)

示例 4:跳过填充字节

# 格式: 小端 (<) + char (c) + 填充1字节 (x) + int (i)
buffer = b'A\x00\x02\x00\x00\x00'
data = struct.unpack('<cx i', buffer)
print(data)  # 输出: (b'A', 2)

示例 5:解析数组

# 解析3个连续的 unsigned short (H)
buffer = b'\x01\x00\x02\x00\x03\x00'
data = struct.unpack('<3H', buffer)
print(data)  # 输出: (1, 2, 3)

四、关键注意事项

缓冲区长度必须匹配
使用 struct.calcsize(format) 验证格式字符串所需的字节数:

fmt = '<2i f'
buffer = b'\x00' * struct.calcsize(fmt)  # 创建匹配长度的缓冲区

字节顺序至关重要
大端/小端错误会导致解析数值异常:

# 错误示例:大端数据用小端解析
buffer = b'\x00\x00\x00\x01'  # 大端表示的整数 1
struct.unpack('<I', buffer)   # 错误!解析为 16777216 (0x01000000)

字符串处理
s 类型返回 bytes 对象,需用 .decode() 转为字符串:

data = struct.unpack('5s', b'Hello')[0]
print(data.decode('utf-8'))  # 输出: 'Hello'

内存对齐问题
默认格式 @ 会按本地对齐方式插入填充字节。使用 = 或标准顺序(</>)避免对齐。

五、常见错误

缓冲区长度与格式字符串不匹配。

结果依赖平台(32/64位),通常应避免使用。

通过合理设计格式字符串,struct.unpack() 可高效处理二进制协议(如网络数据、文件格式)。

到此这篇关于Python struct.unpack() 用法详解的文章就介绍到这了,更多相关Python struct.unpack() 用法内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

您可能感兴趣的文章:
阅读全文