结构体对齐为什么那么重要?

原创 嵌入式软件实战派 2023-04-03 08:30
C语言结构体对齐问题,是面试必备问题。我参与招聘技术面试的时候,也喜欢问这个技术点。
这不是在面试时要装B,也不是要故意难为一下面试者,而是这个知识点比较基础,但很重要。
网上搜出来的嵌入式或C语言笔试题,很多都有这种题目,连《程序员面试宝典》也有讲解这种题目。

结构体对齐知识点考察,俨然成为编程技术岗面试笔试的一种标配。
我以前找工作被问这种题的时候就经常想,结构体对齐这个东西平常很少用,考这东西干嘛?为什么结构体对齐那么重要。
看看这个例子
    typedef struct     {        int e_int;        char e_char1;        char e_char2;    }S2;
typedef struct { char e_char1; int e_int; char e_char2; }S3;    S2 s2; S3 s3;

你觉得这俩结构体所占内存是一样大吗?其实不是!

好像也没什么啊,一不一样大对于C语言程序员有什么所谓!

也许你还还感觉不到,上段代码:

    S2 s2[1024] = {0};    S3 s3[1024] = {0};

对于32位系统,s2的大小为8K,而s3的大小为12K,一放大,就有很明显的区别了。

再举个例子:

unsigned char bytes[10]={0};int* p = (int*)&bytes[3];*p = 0x345678;
你觉得执行上面的代码会发生什么情况?Warining?只是Warning么?!
以前我也没觉得懂得这个结构体对齐或者内存对齐有多重要,直到已经从事了嵌入式开发经验不断积累,才慢慢体会到,这是一种很基础的知识,就因为这个东西不常用,而出现相关的问题是非常致命的,排查起来成本非常高。
有个小伙伴,因为一个内存对齐(结构体对齐相关知识点)问题导致的偶发性Exception问题,折腾了一个多星期。
由于项目接近尾声,出现这种问题,项目经理、老板都操心得不得了。天天不是奶茶水果,就是宵夜,把小伙伴当宝贝来哄,为的就是快速定位这个问题。
然而,他们日以继夜的排查了一个多星期,依然一脸懵逼。
直到让我参与进来支援,我通过仿真方式碰巧捕捉到了这种异常情况。问题的根本原因就是强制类型转换导致的内存对齐问题。篇幅有限,这个故事,以后慢慢细讲。
接下来先看看,结构体对齐的知识点。
结构体对齐,说不难吧,我研究了很多次,都没完全记住;说难吧,理解其原因本质,就易如破竹。
结构体对齐,其实其本质就是内存对齐。
什么以最大元素变量为单位,什么最小公倍数等等法则,通通都是让你死记硬背的,没两天就忘了。
为什么要结构体对齐,原因就是内存要对齐,原因是芯片内存的制造限制,是制造成本约束,是内存读取效率要求。
如果你上学的时候认真学习过微机原理,应该还记得,芯片的地址总线和数据总线这个概念吧。没学过微机原理也没关系,8位单片机、16位单片机和32位单片机等等,这些总得听说过吧。

这个8位、16位和32位等,指的是单片机一次处理数据的宽度,也就和数据总线相关了。
细心的小伙伴会知道,16位单片机的通用寄存器例如R0的长度是2个字节的,而32位的是4字节的。
也就是说16位单片机,单指令一次访问数据是2个字节,而32位单片机可以访问4字节。
为了提高MCU的运行效率,内存设计上,进来适应这个CPU的总线访问。以32位MCU为例,其内存一般都是每4字节(32位)为一个小单元,有时候也叫1个字(Word)。
注意:字节,这个概念长度是固定的,就是8bit;而,却不是固定的,跟CPU或系统位数有关,有时候还会出现字、双字这些概念,举例说明下:
32位计算机:1字=32位=4字节,64位计算机:1字=64位=8字节
所以,对于C语言的变量的存放和访问,都会按着这单位来,例如32位系统中,char是一个字节的,就按Byte来,int是4字节的,那么按Word来。
为什么要这样呢?
如果,一块内存在地址上随便放的,CPU有可能就会用到多条指令来访问,这就会降低效率。
对于32位系统,如下图的A可能需要2条指令访问,而B只需1条指令。

不仅单片机这样,我们常用的计算机也是这样,你看内存条,长这样的:

你以为,通过总线的方式可以随便访问一个地址吗

但是,为了提高访问速度,其设计是这样的:

这样,这个地址就必须是8的倍数。
如果你要从不对齐的内存读取数据,虽然在C语言编程上感觉不到这样的操作有什么区别,但CPU是分开多次读出来的。
这就是内存对齐了。int8(即char)是以1字节对齐,int16是以2字节对齐,而int32是以4字节对齐的,等等。
(以上案例看不懂?推荐去B站看这个视频:【Golang】这个内存对齐呀!?_哔哩哔哩_bilibili,我上面的图也是参考这个视频的。)
世界上CPU平台、系统那么多,我们怎么知道哪个类型到底有多长,是以哪种长度对齐的?

不要瞎猜,直接上代码。每个平台都不一样,请读者自行测试,以下我是基于Windows上MinGW的GCC测的。

#define BASE_TYPE_SIZE(t)   printf("%12s : %2d Byte%s\n", #t, sizeof(t), (sizeof(t))>1?"s":"")void base_type_size(void){    BASE_TYPE_SIZE(void);    BASE_TYPE_SIZE(char);    BASE_TYPE_SIZE(short);    BASE_TYPE_SIZE(int);    BASE_TYPE_SIZE(long);    BASE_TYPE_SIZE(long long);    BASE_TYPE_SIZE(float);    BASE_TYPE_SIZE(double);    BASE_TYPE_SIZE(long double);    BASE_TYPE_SIZE(void*);    BASE_TYPE_SIZE(char*);    BASE_TYPE_SIZE(int*);        typedef struct     {    }StructNull;    BASE_TYPE_SIZE(StructNull);    BASE_TYPE_SIZE(StructNull*);}

结果是:

        void :  1 Byte        char :  1 Byte       short :  2 Bytes         int :  4 Bytes        long :  4 Bytes   long long :  8 Bytes       float :  4 Bytes      double :  8 Bytes long double : 12 Bytes       void* :  4 Bytes       char* :  4 Bytes        int* :  4 Bytes  StructNull :  0 Byte StructNull* :  4 Bytes

这些内容不用记住,不同平台是不一样的,使用之前,一定要亲自测试验证下。

这里先解释下“模数”的概念:

每个特定平台上的编译器都有自己的默认“对齐系数”(也叫对齐模数)。

接着看网上流传一个表:

平台

长度/模数

char

short

int

long

float

double

long long

long double

Win-32

长度

1

2

4

4

4

8

8

8

模数

1

2

4

4

4

8

8

8

Linux-32

长度

1

2

4

4

4

8

8

12

模数

1

2

4

4

4

4

4

4

Linux-64

长度

1

2

4

8

4

8

8

16

模数

1

2

4

8

4

8

8

16

本文的的例子我用的是MinGW32的GCC来测试,你猜符合上表的哪一项?

别急,再看一个例子:

    typedef struct     {        int e_int;        double e_double;    }S11;    S11 s11;    STRUCT_E_ADDR_OFFSET(s11, e_int);    STRUCT_E_ADDR_OFFSET(s11, e_double);

结果是:

  s11 size = 16        s11.e_int addr: 0028FF18, offset:  0  s11 size = 16     s11.e_double addr: 0028FF20, offset:  8

很明显,上表没有一项完全对应得上的。简单汇总以下我测试的结果:

长度/模数

char

short

int

long

float

double

long long

long double

长度

1

2

4

4

4

8

8

12

模数

1

2

4

4

4

8

8

8

所以,再强调一下:因为环境的差异,在你参考使用之前,请自行测试一下。

其实,这个模数是可以改变的,可以用预编译命令#pragma pack(n),n=1,2,4,8,16来改变这一系数,其中的n就是你要指定的“对齐系数”。

例如

#pragma pack(1)typedef struct {    char e_char;    long double e_ld;}S14;#pragma pack()
想知道结构图元素内存如何对齐,其实非常简单。
其实,你只需知道当前你使用的这个系统的基本类型的sizeof是多少,然后根据这个大小做对齐排布。
例如,本文一开始的例子
    typedef struct     {        int e_int;        char e_char1;        char e_char2;    }S2;
typedef struct { char e_char1; int e_int; char e_char2; }S3;    S2 s2; S3 s3;

32位系统中,它们内存是这么对齐的:

简单解释下:

S2中的元素e_int是按4字节对齐的,其地址位4整数倍,而e_char1和e_char2就按1字节对齐,紧跟其后面就可以了;

而S3中的元素e_char1是按1字节对齐的,放在最前面,而e_int是按4字节对齐的,其地址位4整数倍,所以,只能找到个+4的位置,紧接着e_char2就按1字节对齐,跟其后面就可以了。

那么sizeof(s2)和sizeof(s3)各是多少怎么算?

也很简单,例如这个32位系统,为了提高执行效率,编译器会让数据访问以4字节为单位的,所以S2里有2个字节留空,即sizeof(s2)=8,而sizeof(s3)=12。

是不是很简单呢!

接着,来个复杂一点的:

    typedef struct     {        char e_char1;        short e_short;        char e_char2;        int e_int;        char e_char3;    }S4;    S4 s4;

其内存分布如下:

按上面的方法,也不难理解。e_int是不能从+5位置开始的,因为+5不是int的对齐位置,用int去访问+5位置是效率很低或者有问题的,所以它只能从+8位置开始。
再复杂一点的呢?来看看union和struct结合的例子:
    typedef struct    {        int e_int1;         union        {            char ue_chars[9];             int ue_int;        }u;        double e_double;         int e_int2;     }SU2;    SU2 su2;  
得到:

为什么这样呢?
你这样想,要时刻想着CPU访问数据的效率,如果union里的元素类型不一样,那就以最大长度的那个类型对齐了。
另外,还有结构体套着结构体的情况了:
typedef struct     {        int e_int;        char e_char;    }S1;   typedef struct     {        S1 e_s;        char e_char;    }SS1;
typedef struct { short e_short; char e_char; }S6;
typedef struct { S6 e_s; char e_char;    }SS2;   

得出结果:

得出结论:结构体内的结构体,结构体内的元素并不会和结构体外的元素合并占一个对齐单元。

只要技术上面的对齐方法,这些都不难理解。
如果你非要一些规则的话,我总结成这样:

首先,不推荐记忆这些条条框框的文字,以下内容仅供参考:

  1. 结构体的内存大小,并非其内部元素大小之和;
  2. 结构体变量的起始地址,可以被最大元素基本类型大小或者模数整除;
  3. 结构体的内存对齐,按照其内部最大元素基本类型或者模数大小对齐;
  4. 模数在不同平台值不一样,也可通过#pragma pack(n)方式去改变;
  5. 如果空间地址允许,结构体内部元素会拼凑一起放在同一个对齐空间;
  6. 结构体内有结构体变量元素,其结构体并非展开后再对齐;
  7. union和bitfield变量也遵循结构体内存对齐原则。
其实,这些都没必要去记,多思考多理解就OK了。唯一需要记得是某系统平台下的基本类型的sizeof大小,然后按照对齐原则来就可以了,就是时刻想着CPU要提升数据访问效率的。
更多的案例,很早写在《图文并茂,一文讲透C语言结构体内存对齐》这个文章里面了,感兴趣的小伙伴可以研究下。

里面涉及到很多测试源码,如果想要获取的话,可以关注公众号,回复"struct"即可获得下载链接。


嵌入式软件实战派 专注嵌入式软件开发领域知识传授,包括C语言精粹,RTOS原理与使用,MCU驱动开发,AUTOSAR搭建,软件架构方法设计等。
评论
  • 文/Leon编辑/cc孙聪颖作为全球AI领域的黑马,DeepSeek成功搅乱了中国AI大模型市场的格局。科技大厂们选择合作,接入其模型疯抢用户;而AI独角兽们则陷入两难境地,上演了“Do Or Die”的抉择。其中,有着“大模型六小虎”之称的六家AI独角兽公司(智谱AI、百川智能、月之暗面、MiniMax、阶跃星辰及零一万物),纷纷开始转型:2025年伊始,李开复的零一万物宣布转型,不再追逐超大模型,而是聚焦AI商业化应用;紧接着,消息称百川智能放弃B端金融市场,聚焦AI医疗;月之暗面开始削减K
    华尔街科技眼 2025-03-12 17:37 151浏览
  • 前言在快速迭代的科技浪潮中,汽车电子技术的飞速发展不仅重塑了行业的面貌,也对测试工具提出了更高的挑战与要求。作为汽车电子测试领域的先锋,TPT软件始终致力于为用户提供高效、精准、可靠的测试解决方案。新思科技出品的TPT软件迎来了又一次重大更新,最新版本TPT 2024.12将进一步满足汽车行业日益增长的测试需求,推动汽车电子技术的持续革新。基于当前汽车客户的实际需求与痛点,结合最新的技术趋势,对TPT软件进行了全面的优化与升级。从模型故障注入测试到服务器函数替代C代码函数,从更准确的需求链接到P
    北汇信息 2025-03-13 14:43 43浏览
  • 在追求更快、更稳的无线通信路上,传统射频架构深陷带宽-功耗-成本的“不可能三角”:带宽每翻倍,系统复杂度与功耗增幅远超线性增长。传统方案通过“分立式功放+多级变频链路+JESD204B 接口”的组合试图平衡性能与成本,却难以满足实时性严苛的超大规模 MIMO 通信等场景需求。在此背景下,AXW49 射频开发板以“直采+异构”重构射频范式:基于 AMD Zynq UltraScale+™ RFSoC Gen3XCZU49DR 芯片的 16 通道 14 位 2.5GSPS ADC 与 16
    ALINX 2025-03-13 09:27 32浏览
  • 引言汽车行业正经历一场巨变。随着电动汽车、高级驾驶辅助系统(ADAS)和自动驾驶技术的普及,电子元件面临的要求从未如此严格。在这些复杂系统的核心,存在着一个看似简单却至关重要的元件——精密电阻。贞光科技代理品牌光颉科技的电阻选型过程,特别是在精度要求高达 0.01% 的薄膜和厚膜技术之间的选择,已成为全球汽车工程师的关键决策点。当几毫欧姆的差异可能影响传感器的灵敏度或控制系统的精确性时,选择正确的电阻不仅仅是满足规格的问题——它关系到车辆在极端条件下的安全性、可靠性和性能。在这份全面指南中,我们
    贞光科技 2025-03-12 17:25 92浏览
  • 一、行业背景与用户需求随着健康消费升级,智能眼部按摩仪逐渐成为缓解眼疲劳、改善睡眠的热门产品。用户对这类设备的需求不再局限于基础按摩功能,而是追求更智能化、人性化的体验,例如:语音交互:实时反馈按摩模式、操作提示、安全提醒。环境感知:通过传感器检测佩戴状态、温度、压力等,提升安全性与舒适度。低功耗长续航:适应便携场景,延长设备使用时间。高性价比方案:在控制成本的同时实现功能多样化。针对这些需求,WTV380-8S语音芯片凭借其高性能、多传感器扩展能力及超高性价比,成为眼部按摩仪智能化升级的理想选
    广州唯创电子 2025-03-13 09:26 33浏览
  •        随着人工智能算力集群的爆发式增长,以及5.5G/6G通信技术的演进,网络数据传输速率的需求正以每年30%的速度递增。万兆以太网(10G Base-T)作为支撑下一代数据中心、高端交换机的核心组件,其性能直接决定了网络设备的稳定性与效率。然而,万兆网络变压器的技术门槛极高:回波损耗需低于-20dB(比千兆产品严格30%),耐压值需突破1500V(传统产品仅为1000V),且需在高频信号下抑制电磁干扰。全球仅有6家企业具备规模化量产能力,而美信科
    中科领创 2025-03-13 11:24 40浏览
  • 北京时间3月11日,国内领先的二手消费电子产品交易和服务平台万物新生(爱回收)集团(纽交所股票代码:RERE)发布2024财年第四季度和全年业绩报告。财报显示,2024年第四季度万物新生集团总收入48.5亿元,超出业绩指引,同比增长25.2%。单季non-GAAP经营利润1.3亿元(non-GAAP口径,即经调整口径,均不含员工股权激励费用、无形资产摊销及因收购产生的递延成本,下同),并汇报创历史新高的GAAP净利润7742万元,同比增长近27倍。总览全年,万物新生总收入同比增长25.9%达到1
    华尔街科技眼 2025-03-13 12:23 50浏览
  • 本文介绍OpenHarmony4.1系统开发板,出现打不开WiFi和蓝牙的问题排查和解决方法。触觉智能Purple Pi OH鸿蒙开发板演示,搭载了瑞芯微RK3566四核处理器,1TOPS算力NPU;Laval鸿蒙社区推荐并通过了开源鸿蒙XTS认证,成功适配OpenHarmony3.2、4.0、4.1、5.0 Release系统,SDK源码全开放!WiFi打不开缺少WiFi固件在WiFi打不开时我们可以通过使用串口工具查看WiFi打印信息:这条log主要说明了打开固件文件失败,说明了在/vend
    Industio_触觉智能 2025-03-12 14:32 53浏览
  • DeepSeek自成立之初就散发着大胆创新的气息。明明核心开发团队只有一百多人,却能以惊人的效率实现许多大厂望尘莫及的技术成果,原因不仅在于资金或硬件,而是在于扁平架构携手塑造的蜂窝创新生态。创办人梁文锋多次强调,与其与大厂竞争一时的人才风潮,不如全力培养自家的优质员工,形成不可替代的内部生态。正因这样,他对DeepSeek内部人才体系有着一套别具一格的见解。他十分重视中式教育价值,因而DeepSeek团队几乎清一色都是中国式学霸。许多人来自北大清华,或者在各种数据比赛中多次获奖,可谓百里挑一。
    优思学院 2025-03-13 12:15 47浏览
  • 本文介绍Android系统主板应用配置默认获取管理所有文件权限方法,基于触觉智能SBC3588行业主板演示,搭载了瑞芯微RK3588芯片,八核处理器,6T高算力NPU;音视频接口、通信接口等各类接口一应俱全,支持安卓Android、Linux、开源鸿蒙OpenHarmony、银河麒麟Kylin等操作系统。配置前提在配置前,建议先将应用配置成系统应用,不然配置后系统每次重启后都会弹窗提示是否获取权限。应用配置成系统应用,可参考以下链接方法:瑞芯微开发板/主板Android系统APK签名文件使用方法
    Industio_触觉智能 2025-03-12 14:34 54浏览
  • 文/杜杰编辑/cc孙聪颖‍主打影像功能的小米15 Ultra手机,成为2025开年的第一款旗舰机型。从发布节奏上来看,小米历代Ultra机型,几乎都选择在开年发布,远远早于其他厂商秋季主力机型的发布时间。这毫无疑问会掀起“Ultra旗舰大战”,今年影像手机将再次被卷上新高度。无意臆断小米是否有意“领跑”一场“军备竞赛”,但各种复杂的情绪难以掩盖。岁岁年年机不同,但将2-3年内记忆中那些关于旗舰机的发布会拼凑起来,会发现,包括小米在内,旗舰机的革新点,除了摄影参数的不同,似乎没什么明显变化。贵为旗
    华尔街科技眼 2025-03-13 12:30 60浏览
  • 2025年,科技浪潮汹涌澎湃的当下,智能数字化变革正进行得如火如荼,从去年二季度开始,触觉智能RK3562核心板上市以来,受到了火爆的关注,上百家客户选用了此方案,也获得了众多的好评与认可,为客户的降本增效提供了广阔的空间。随着原厂的更新,功能也迎来了一波重大的更新,无论是商业级(RK3562)还是工业级(RK3562J),都可支持NPU和2×CAN,不再二选一。我们触觉智能做了一个艰难又大胆的决定,为大家带来两大重磅福利,请继续往下看~福利一:RK3562核心板149元特惠再续,支持2×CAN
    Industio_触觉智能 2025-03-12 14:45 27浏览
  • 一、行业背景与需求痛点智能电子指纹锁作为智能家居的核心入口,近年来市场规模持续增长,用户对产品的功能性、安全性和设计紧凑性提出更高要求:极致空间利用率:锁体内部PCB空间有限,需高度集成化设计。语音交互需求:操作引导(如指纹识别状态、低电量提醒)、安全告警(防撬、试错报警)等语音反馈。智能化扩展能力:集成传感器以增强安全性(如温度监测、防撬检测)和用户体验。成本与可靠性平衡:在复杂环境下确保低功耗、高稳定性,同时控制硬件成本。WTV380-P(QFN32)语音芯片凭借4mm×4mm超小封装、多传
    广州唯创电子 2025-03-13 09:24 41浏览
  • 曾经听过一个“隐形经理”的故事:有家公司,新人进来后,会惊讶地发现老板几乎从不在办公室。可大家依旧各司其职,还能在关键时刻自发协作,把项目完成得滴水不漏。新员工起初以为老板是“放羊式”管理,结果去茶水间和老员工聊过才发现,这位看似“隐形”的管理者其实“无处不在”,他提前铺好了企业文化、制度和激励机制,让一切运行自如。我的观点很简单:管理者的最高境界就是——“无为而治”。也就是说,你的存在感不需要每天都凸显,但你的思路、愿景、机制早已渗透到组织血液里。为什么呢?因为真正高明的管理,不在于事必躬亲,
    优思学院 2025-03-12 18:24 81浏览
  • 在海洋监测领域,基于无人艇能够实现高效、实时、自动化的海洋数据采集,从而为海洋环境保护、资源开发等提供有力支持。其中,无人艇的控制算法训练往往需要大量高质量的数据支持。然而,海洋数据采集也面临数据噪声和误差、数据融合与协同和复杂海洋环境适应等诸多挑战,制约着无人艇技术的发展。针对这些挑战,我们探索并推出一套基于多传感器融合的海洋数据采集系统,能够高效地采集和处理海洋环境中的多维度数据,为无人艇的自主航行和控制算法训练提供高质量的数据支持。一、方案架构无人艇要在复杂海上环境中实现自主导航,尤其是完
    康谋 2025-03-13 09:53 44浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦