结构体的洞和 #pragma pack

  无情的搬砖机器= =

一、结构体中的“洞”

  结构体中的每一个模块在内存中并不是禁止排列存储的,而是上下对齐存储。这种现象叫做内存对齐。这样做的目的是为了是处理器能够更快速的进行寻址,执行速度更快。以空间换取时间。看来鱼与熊掌还是不能兼得啊。

  既然是上下对齐的,那么并不是每个模块都能准确的填满一行的内存空间。那么没有被填满的内存空间就造成了空洞。
  这样的话,在查看结构体所占的空间时,就不能把每个模块所分别占的内存空间简单的相加。因为他们中间存在空洞。

二、#pragma pack

  这是给编译器用的参数设置,有关结构体字节对齐方式设置, #pragma pack是指定数据在内存中的对齐方式。

1
2
3
4
5
6
7
#pragma pack (n)             //作用:C编译器将按照n个字节对齐。
#pragma pack () //作用:取消自定义字节对齐方式。

#pragma pack (push,1)
//作用:是指把原来对齐方式设置压栈,并设新的对齐方式设置为一个字节对齐
#pragma pack(pop)
//作用:恢复对齐状态

#pragma pack(push,1)与#pragma pack(1)的区别

  因此可见,加入push和pop可以使对齐恢复到原来状态,而不是编译器默认,可以说后者更优。但是很多时候两者差别不大,如:

1
2
3
4
#pragma pack(push)  //保存对齐状态
#pragma pack(4) //设定为4字节对齐

//相当于 #pragma pack (push,4)

具体的使用方法如下:

1
2
3
4
#pragma  pack (1)           
//结构体内容
#pragma pack ()
//作用:调整结构体的边界对齐,让其以一个字节对齐;<使结构体按1字节方式对齐>

具体例子如下:

1
2
3
4
5
6
7
#pragma pack(1)
struct sample
{
char a;
double b;
};
#pragma pack()

  注:若不用#pragma pack(1)和#pragma pack()括起来,则sample按编译器默认方式对齐(成员中size最大的那个)。即按8字节(double)对齐,则sizeof(sample)==16.成员char a占了8个字节(其中7个是空字节);若用#pragma pack(1),则sample按1字节方式对齐sizeof(sample)==9.(无空字节),比较节省空间啦。在有些场合还可使结构体更易于控制。

三、应用实例

  在网络协议编程中,经常会处理不同协议的数据报文。一种方法是通过指针偏移的方法来得到各种信息,但这样做不仅编程复杂,而且一旦协议有变化,程序修改起来也比较麻烦。

  在了解了编译器对结构空间的分配原则之后,我们完全可以利用这一特性定义自己的协议结构,通过访问结构的成员来获取各种信息。这样做,不仅简化了编程,而且即使协议发生变化,我们也只需修改协议结构的定义即可,其它程序无需修改,省时省力。下面以TCP协议首部为例,说明如何定义协议结构。其协议结构定义如下:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
#pragma pack(1) // 按照1字节方式进行对齐
struct TCPHEADER
{
short SrcPort; // 16位源端口号
short DstPort; // 16位目的端口号
int SerialNo; // 32位序列号
int AckNo; // 32位确认号
unsigned char HaderLen : 4; // 4位首部长度
unsigned char Reserved1 : 4; // 保留6位中的4位
unsigned char Reserved2 : 2; // 保留6位中的2位
unsigned char URG : 1;
unsigned char ACK : 1;
unsigned char PSH : 1;
unsigned char RST : 1;
unsigned char SYN : 1;
unsigned char FIN : 1;
short WindowSize; // 16位窗口大小
short TcpChkSum; // 16位TCP检验和
short UrgentPointer; // 16位紧急指针
};
#pragma pack()

  这样的代码编译出来的是以1个字节的方式对齐的。这样能节约内存资源,但是会在效率上有所影响。

  虽说在效率上有一定的影响,不过,如果编写的是基于协议,如网口、串口通讯的程序,最好严格按照一定的规则进行接收数据包。使用 #pragma pack(1),让数据在内存中是连续的,实现结构体通过指针偏移(没有空洞)比较好处理。

  用sizeof运算符求算某结构体所占空间时,并不是简单地将结构体中所有元素各自占的空间相加,这里涉及到内存字节对齐的问题,有时候为了内存对齐需要补齐空字节。通常写程序的时候,不需要考虑对齐问题。编译器会替我们选择适合目标平台的对齐策略。当然,我们也可以通知给编译器传递预编译指令而改变对指定数据的对齐方法。

  也就是如果用编译器的(自动)对齐策略,采用指针偏移方式的方法可能会出现一些(不同编译器,对齐不同,错位)问题。

-------------本文结束感谢您的阅读-------------