C语言里的位域

添加时间：2013-12-7

相关阅读: 程序 C语言 C++ VC 系统

副标题#e#

　　C语言里的位域是一个比较复杂的问题，涉及的方面也比较多，关于位域的基础内容可以参考以下文章：理解C语言位域
　
　　分析代码如下：
　

#include "stdio.h"
#include "memory.h"

struct BitSeg1{
int a:4;
int b:3;
};

struct BitSeg2{
char a:4;
char b:3;
};

int main()
{
struct BitSeg1 ba1;
ba1.a=1;
ba1.b=2;
printf("第一次赋值后: a的值为:%d\tb的值为:%d\n",ba1.a,ba1.b);
ba1.a=100;
ba1.b=30;
printf("第二次赋值后: a的值为:%d\tb的值为:%d\n",ba1.a,ba1.b);
char str[]="0123";
memcpy(&ba1,str,sizeof(BitSeg1));
printf("第二次赋值后: a的值为:%d\tb的值为:%d\n",ba1.a,ba1.b);
printf("BitSeg1的字节数为: %d\n",sizeof(BitSeg1));
printf("BitSeg2的字节数为: %d\n",sizeof(BitSeg2));
return 0;
}

#p#副标题#e#

　　输出结果为：
　
　　第一次赋值后： a的值为：1 b的值为：2

第二次赋值后： a的值为：4 b的值为：-2

第二次赋值后： a的值为：0 b的值为：3

BitSeg1的字节数为： 4

BitSeg2的字节数为： 1
　
　　代码中的BigSeg1定义了两个int类型的字段，而且它们分别只占用4位和3位的空间。当BitSeg1中的a，b分别赋值为1和2时，输出的结果也如我们所料。当第二次赋值为100和30时，输出的结果却是4和-2，为什么呢？
　
　　1.赋值问题
　
　　出现上述问题，是由于赋值与位域效果共同形成的，a和b虽然都是int类型，但是在BigSeg1结构里，它们只有4位和3位为实际有效位。也就是BigSeg1中的前4位是a的，接着的3位是b的（这里没有字节的跨越问题）。执行ba1.a=100语句，其中100的二进制代码是：01100100，程序只把这100的二进制数的前面4位（已用红色字体表示）赋值给a，那么ba1中的a只是0100（b），结果当然是4咯。然后是执行b1.b=30语句，其中30的二进制代码为：00011110，同样的程序只把前3位（注意b定义有效位数是3位）赋值给b，那么ba1中的b就是110（b），结果是-2，为什么？是这样的，我们定义b为int类型，也就是有符号的整型，如果想定义为无符号整型我们必须这样写unsigned int，而有符号整型的第一位是符号位，用于表示正负的（1表示负数，0表示正数），那么对于b，程序就会把b的第一位（即1）做为符号位，即b应该是负数，而后面的是它的数值（即10（b）），注意计算机里负数是按补码的形式表示的，这种赋值下b的确是110（它是补码，按“即反加一”的法则，即十进制的-2），结果就是-2了。而刚才的a给赋值为0100（b）时，第一位是0，解释为正数。再举一例，若使ba1.b=7，那么ba1.b的值是多少呢？7的二进制是0111，前面3位直接给到b，因为是负数，读出来时按补码形式读，那么就是-1了。
　
　　总之一句话：用位为理解位域。
　
　　接下来是用memcpy对ba1进行内存copy，就更应该用位来考虑位域了。下面我们分析一下：
　
　　首先，sizeof（BitSeg1）的值是4个字节，先记住，后面会对此问题进行详细解释。
　
　　执行memcpy（&ba1，str，sizeof（BitSeg1）），把str的内容中的前面4个字节的内存里的内容复制到ba1中，我们先来看一下str的内存位信息（用16进制表示）：
　
　　0x0012ff74：30 　31 　32　33
　
　　其中0x0012ff74时str数组的地址起始位置，30，31，32，33等16进制值分别表示字符'0'，'1'，'2'，'3'，它们当然是ACII值啦。
　
　　copy之后的ba1的内存位信息如下：
　
　　0x0012ff7c：30 31 32 33
　
　　因为ba1也是占4个字节的空间的，所以不会出现内存溢出。memcpy只是把相应内存复制到了ba1上，位信息与str上的信息一样的。
　
　　现在，我们把30（H）的二进制写出来，是：00110000，ba1的a占前面4位，b占接下来的3位，直观地看，a应该是0011（b）即十进制的3，b是000（b）即十进制的0，但看输出的结果却是a=0，b=3，这又是为什么呢？其实很简单，处理器定义字节的前面4位是指该字节从右往左4位，而不是从左往右的4位，所以a应该是0000（b），b应该是011（b）。

#p#副标题#e#

　
　　2.字节对齐
　
　　回到上面留下的字节数的问题，即sizeof（BitSeg1）的结果为4个字节。按理来说，BitSeg1的有效位数是7位，但为了程序的快速运行，一个重要的手段是减少内存的读写次数，所以一样的处理器都是以字节的倍数将内存中的数据读到寄存器中，所以程序把数据以字节的形式对齐了就可以有效的减少内存的读写时间，你可想想要处理器只读内存中的7位是如何做的，一次一个位？那倒不如一次读8位。
　
　　在做字节对齐的时候也是有规则的，在32位的系统里，编译器会按类型进行字节的对齐，以它们的位宽为基准，在VC下：
　
　　char 偏移量必须为sizeof（char）即1的倍数
　
　　int 偏移量必须为sizeof（int）即4的倍数
　
　　float 偏移量必须为sizeof（float）即4的倍数
　
　　long 偏移量必须为sizeof（long）即4的倍数
　
　　double偏移量必须为sizeof（double）即8的倍数
　
　　short 偏移量必须为sizeof（short）即2的倍数
　
　　BitSeg1里的两个变量都是int类型，所以是4个字节对齐的。
　
　　而使用位域的主要目的是压缩存储，减少内存的占有量，其大致规则为：

1）如果相邻位域字段的类型相同，且其位宽之和小于类型的sizeof大小，则后面的字段将紧邻前一个字段存储，直到不能容纳为止；

2）如果相邻位域字段的类型相同，但其位宽之和大于类型的sizeof大小，则后面的字段将从新的存储单元开始，其偏移量为其类型大小的整数倍；

3）如果相邻的位域字段的类型不同，则各编译器的具体实现有差异，VC6采取不压缩方式，Dev-C++采取压缩方式；

5）整个结构体的总大小为最宽基本类型成员大小的整数倍。
　
　　再看一个例子：

C语言里的位域

C语言算法之随机数算法 [2013-12-7] C语言算法之二分覆盖 [2013-12-7] C语言：黑客学员必修课（一） [2013-12-7] C语言：黑客学员必修课（二） [2013-12-7] C程序的基本结构与简单规范 [2013-12-7] C/C++编程新手错误语录 [2013-12-7]

C语言算法之随机数算法 [2013-12-7]

C语言算法之二分覆盖 [2013-12-7]

C语言：黑客学员必修课（一） [2013-12-7]

C语言：黑客学员必修课（二） [2013-12-7]

C程序的基本结构与简单规范 [2013-12-7]

C/C++编程新手错误语录 [2013-12-7]