C语言位段(位域)机制结构体的特殊实现及解析
作者:乔乔家的龙龙
概念
什么是位段?
位段又称为位域,C语言允许在一个结构体中以位为单位来指定其成员所占内存长度,这种以位为单位的成员就叫做称为位段( bit field) 。利用位段能够用较少的位数存储数据达到节省空间的目的。
位段是结构体特有的,所以声明是和结构是类似的,但有两个不同:
1. 位段成员必须是 int ,unsigned int,signed int
2. 位段成员名后边结构包括一个冒号和整型数字
举个栗子:
struct haha { unsigned int ch : 8; //8位 unsigned int chh : 6; //6位 unsigned int chhh : 18; //18位 }; struct haha dest;
内存分配
这里的 haha 就是一个位段的类型,这个神神秘秘的位段咱不常见,那么他的大小怎么算的呢?其实和结构体是一样的:
struct arr { int a:2; int b:5; int c:10; int d:30; }; int main() { printf("%d\n",sizeof(struct arr)); return 0; }
这里 a:2什么意思呢?
成员 a 只占 2 个比特位,后面同理,既然这样,那我们总计 47 比特位,也就是 6 个字节 48 个比特位已经足够了,那为什么又是 8 呢?位段的内存分配到底是怎样的?
这里千万不要犯低级错误误认为他的大小就是 47 个比特位,和前一篇博客叙述原理相同,因为都是 int 类型,所有成员会向 int 看齐,int 是四字节,默认 8 字节,对齐数取 4 字节,a+b < 1字节,合并申请 1 字节空间,后面都需要独立申请空间,总计 1+2+4 = 7字节,结构体大小必须是最大对齐数整数倍,取 4 的整数倍就是 8,因此为 8 字节。
位段跨平台问题
我们细想刚刚这种机制,a,b,c,d 分别为 2,5,10,30 比特位,而我一个字节是 8 个比特位,假若在给 a 分配了 1 字节后,还剩 6 比特位,这 6 个位子我要不要让给二哥 b 成员来享用呢?==我是一字节一字节榨干资本还是出手阔绰安排"单人房"呢?==这里就有了歧义。
要知道位段在空间上是按照需要以四字节 int 或一字节 char 的方式来开辟空间,他涉及很多的不确定性因素,这就是为什么位段是不跨平台的,注重可移植性的程序应该避免使用位段。
有什么不确定因素呢,就好比我们刚刚提到的内存分配问题,这个问题连C语言标准都没有规定我到底该怎么利用,需要由具体的编译器环境决定,编译器环境又依赖于不同的平台比如 Linux 是 gcc 标准,VS则是 windows 标准。
我们要知道:
- 1. int 位段被当成有符号数还是无符号数是不确定的。
- 2. 位段中最大位的数目不能确定(16位机器最大 16,32 位机器最大 32)。
- 3. 位段中成员的内存从左到右分配还是从右向左分配标准尚未定义。
- 4. 当一个结构中包含两个位段时,第二个位段成员比较大,无法容纳第一个位段剩余的位时,是应当舍弃还是利用,标准尚未定义。
作用
“ 这么个玄乎的玩意儿拿来干嘛啊 ”你可能会有这样的疑问
我们拿上面的情景来分析一手:
int a:2; int b:5; int c:10; int d:30;
我们不分配位段时,需要 16 个字节,分配后只要 8 个字节,其实位段就是为了节省空间,充当个省流大师。
位段使用的前提条件就是某些细节需要非常明确,假如我成员 a 的取值只有四种状态:00,01,10,11,那我给 a 分配 2 个字节是不是就足够了,那我就给 2 个,我如果一上手啪叽就是一个 int 类型,32 个字节横空出世,这个节省的性价比可不低哦~
当然万事万物不可能十全十美,我帮你节省但总归会有一定浪费,这是不可避免的。总结一下就是位段跟结构相比,可以达到相同效果且可以有效节省空间,但存在跨平台问题存在。
Tip
注意,位段机制跟栈还扯不上关系,入栈的是数据的字节,位段是在这些字节的内部空间上发挥作用,已经细节到“位”了,以及之前提到的大小端模式,大小端是连续字节数据的存放模式,也细化不到字节上。
应用场景
位段在实际生活中也有广泛的应用,比如我们网络上数据包的格式:
这就是我们在互联网上向某个对象发送信息的原理,里面最大的问题就是这个包如果直接扔到网上去,就会像拖拉机上高速,铁铁的堵车造成网络拥挤,我们就会利用位段机制进行适当缩减以减小网络的负担。
今天就到这里吧,摸了家人们。
以上就是C语言位段(位域)机制结构体的特殊实现及解析的详细内容,更多关于C语言位段位域机制结构体的资料请关注脚本之家其它相关文章!