李浩: 再谈 volatile 关键字

Linux阅码场 2021-03-03 00:00

本文内容:volatile关键字的含义,它与barrier()和编译乱序的关系,以及内核里面READ_ONCE()、WRITE_ONCE()的实现原理。

作者简介:李浩,就职于南京富士通南大软件,熟悉 x86 架构,对内存和文件系统有些研究。

最常见的用法

如果一个变量被声明为 volatile 的,就是告诉编译器即使我们当前编译的代码不会修改这个变量,该变量对应的内存数据也可能会由于其他原因而被修改,这可能的原因有很多,比如该变量对应的内存位置是使用 memory mapped I/O 机制映射的一个外设端口,即我们本质上是在访问一个硬件寄存器,它的值的变化当然不受程序控制。

那为什么要告诉编译器这个信息呢?因为这样的话,生成汇编代码时,每次使用该变量时都会去对内存位置做一次读访问以获取最新的值。相反,如果不加 volatile,那么编译器为了效率,很可能先把该变量加载到寄存器,以后需要用时就都去读这个寄存器了,不会再去读内存,即使内存的数据变动了我们的代码也不知道,还在用寄存器里的老数据。我们常用的 ioread 函数就封装了 volatile 操作,保证能读到最新数据,具体定义可以参见 build_mmio_read

但要注意,除了这种 memory mapped I/O 以及其他少数几个特殊情况[1],如果一个变量可能被多个过程并发访问,这种情况不应该使用 volatile 关键字来保证每个过程都能看到该变量的最新值,正确的做法是使用锁来保护它,加锁成功后只需要把被保护变量从内存读一次扔到寄存器就行了,后面都用寄存器的值,这样效率高,在我们出临界区之前锁机制会保证不会有其他过程来修改此变量,所以寄存器里的数据一直是有效的。这个时候如果画蛇添足把被保护变量声明为 volatile,会阻止编译器在临界区内对该变量的读取优化,每次都要从内存读,这显然没必要。

阻止编译乱序

volatile 的另一种用法需要结合 READ_ONCE/WRITE_ONCE 这两个宏来看,内核注释里提到这两个宏有阻止编译乱序的作用。

The compiler is also forbidden from reordering successive instances ofREAD_ONCE and WRITE_ONCE

我们下文以 READ_ONCE 读取变量为例展开分析。

从内核对这个宏的定义来看,它的本质其实就是使用 volatile 关键字对变量做了类型修饰,怎么看都不像是能起到阻止乱序的作用。

#define READ_ONCE(x) \({\ compiletime_assert_rwonce_type(x); \ __READ_ONCE(x); \})#define __READ_ONCE(x) (*(const volatile __unqual_scalar_typeof(x) *)&(x))

所以我们只好试一试。

首先是一段 C 语言代码:

int a, b;int i, j;
void foo(){ a = i; b = j/16;}

使用 gcc -O2 example.c -S 生成汇编:

movl j(%rip), %edx // 读取 jmovl i(%rip), %eax // 读取 itestl %edx, %edxmovl %eax, a(%rip)leal 15(%rdx), %eaxcmovns %edx, %eaxsarl $4, %eaxmovl %eax, b(%rip)

很明显地看到 i 和 j 的读取顺序与 C 语言语句颠倒了。那么为了阻止这种优化,我们首先试下编译屏障 barrier(),看看效果如何。

#define barrier() __asm__ __volatile__("": : :"memory")
int a, b;int i, j;
void foo(){ a = i; barrier(); b = j/16;}

汇编如下:

movl i(%rip), %eax // 读取 imovl %eax, a(%rip) // 写入 a-------------------------------- 屏障在此movl j(%rip), %edx // 读取 jtestl %edx, %edxleal 15(%rdx), %eaxcmovns %edx, %eaxsarl $4, %eaxmovl %eax, b(%rip) // 写入 b

显然,barrier() 编译屏障很管用,它告诉编译器:在 barrier() 前后是两个世界,屏障前的语句不能跑到屏障后,反之亦然,也就是编译乱序不能穿透屏障。所以,读取 i 写入 a 和 读取 j 写入 b 这两组操作被屏障隔离了。

在见识了编译屏障的作用后,我们再试试 volatile 究竟有没有起到类似的作用。

#define __READ_ONCE(x) (*(const volatile int *)&(x))
int a, b;int i, j;
void foo(){ a = __READ_ONCE(i); b = __READ_ONCE(j)/16;}

汇编如下:

movl i(%rip), %eax // 读取 imovl j(%rip), %edx // 读取 jmovl %eax, a(%rip) // 写入 atestl %edx, %edxleal 15(%rdx), %eaxcmovns %edx, %eaxsarl $4, %eaxmovl %eax, b(%rip) // 写入 b

可以看到 i 和 j 的读取顺序被保证了。但是注意,volatile 毕竟不是编译屏障,不能把第一条 C 语句和第二条语句完全隔离开,所以我们用 __READ_ONCE 能保证的也只是 i 和 j 的读取顺序,其他的写入顺序或者读写之间的顺序无法被保证 (比如读取 j 和写入 a 就颠倒了)。

那编译器为何会对 volatile 有这样的约束行为呢,这是因为 C 标准做出了如下规定:

The least requirements on a conforming implementation are:
At sequence points, volatile objects are stable in the sense that previous accesses are complete and subsequent accesses have not yet occurred.
.........
The following are the sequence points described in 5.1.2.3:
The end of a full expression: an initializer (6.7.8); the expression in an expressionstatement (6.8.3); the controlling expression of a selection statement (if or switch)(6.8.4); the controlling expression of a while or do statement (6.8.5); each of theexpressions of a for statement (6.8.5.3); the expression in a return statement(6.8.6.4).

这里引出了 sequence point 的概念,简单来说就是 sequence point 之前的表达式所造成的影响不能扩散到 sequence point 之后。尤其是对于 volatile 变量来说,以一个 sequence point 为分界点,对于前面 volatile 变量的访问必须完成,且对于后面 volatile 变量的访问必须没有开始。遵照如上标准,; 就是个 sequence point,那么 a = __READ_ONCE(i) 和 b = __READ_ONCE(j)/16 之间隔着一个 sequence point,所以对 i 的访问必须放在 j 之前。

但需要注意的是,编译器只是保证 volatile 变量与 volatile 变量的读取不会被乱序,但是 non-volatile 变量和 volatile 变量的读取顺序依然是可以被乱序的。

比如我们把 j 的 __READ_ONCE 去掉:

#define __READ_ONCE(x) (*(const volatile int *)&(x))
int a, b;int i, j;
void foo(){ a = __READ_ONCE(i); b = j/16;}

产生的汇编如下:

movl j(%rip), %edx // 读取 jmovl i(%rip), %eax // 读取 itestl %edx, %edxmovl %eax, a(%rip)leal 15(%rdx), %eaxcmovns %edx, %eaxsarl $4, %eaxmovl %eax, b(%rip)

可以看到 i 和 j 的读取顺序又颠倒了。

到这里,我们就把 READ_ONCE 也即 volatile 在变量读取中的作用分析完了,它可以保证变量严格地按照代码给出的顺序去读。同理,WRITE_ONCE 则是保证了变量的写入顺序。

那么如果 READ_ONCE 和 WRITE_ONCE 两者混合使用,又会怎样呢。其实,按照 C 标准,没有特指这个保序只针对读与读或写与写,所以读写混合的顺序也会得到保证。下面举个例子:

int a, b;int i;
void foo(){ a = i/16; b = 0;}

这个函数的汇编如下:

movl $0, b(%rip) // 写入 bmovl i(%rip), %edx // 读取 itestl %edx, %edxleal 15(%rdx), %eaxcmovns %edx, %eaxsarl $4, %eaxmovl %eax, a(%rip) // 写入 a

可以看到读取 i 、写入 a、写入 b 这三者的顺序已经彻底打乱了。

我们用上 volatile

#define __READ_ONCE(x) (*(const volatile int *)&(x))#define __WRITE_ONCE(x, val) do {*(volatile typeof(x) *)&(x) = (val);} while(0)
int a, b;int i;
void foo(){ a = __READ_ONCE(i)/16; __WRITE_ONCE(b, 0);}

生成的汇编如下:

movl i(%rip), %edx // 读取 imovl $0, b(%rip) // 写入 btestl %edx, %edxleal 15(%rdx), %eaxcmovns %edx, %eaxsarl $4, %eaxmovl %eax, a(%rip) // 写入 a

可见,i 的读取和 b 的写入是严格按照 C 代码的顺序来的,说明 volatile 生效了。但是 a 的写入被放到 b 写入的后面了,这是因为 a 在被写入时没有被 volatile 修饰。如果我们把代码改成这样:

__WRITE_ONCE(a, __READ_ONCE(i)/16);__WRITE_ONCE(b, 0);

生成的汇编就会如下:

movl i(%rip), %edx // 读取 itestl %edx, %edxleal 15(%rdx), %eaxcmovns %edx, %eaxsarl $4, %eaxmovl %eax, a(%rip) // 写入 amovl $0, b(%rip) // 写入 b

可以看到现在的顺序和 C 代码完全对应了。不过其实可以写的更简单一点,因为 a 需要靠 i 算出来,有计算依赖,所以编译器会保证 i 的读取在 a 写入之前,第一行的 __READ_ONCE 可以去掉,写成下面这样效果是一样的:

__WRITE_ONCE(a, i/16);__WRITE_ONCE(b, 0);

后记

volatile 这种防止乱序的作用在 Java 中相当清晰,JVM 本身就类似于一个操作系统,Java 编译为字节码后也有指令重排导致编译乱序的问题,所以 Java 中的 volatile 关键字明确带有阻止优化的作用,这已经在 Java 开发者中成为了常识,而 C 语言中的 volatile 却稍显隐晦。

References

[1] 特殊情况: 

https://www.kernel.org/doc/html/latest/process/volatile-considered-harmful.html


更多精彩,尽在"Linux阅码场",扫描下方二维码关注

别忘了分享、点赞或者在看哦~


Linux阅码场 专业的Linux技术社区和Linux操作系统学习平台,内容涉及Linux内核,Linux内存管理,Linux进程管理,Linux文件系统和IO,Linux性能调优,Linux设备驱动以及Linux虚拟化和云计算等各方各面.
评论
  • 在过去十年中,自动驾驶和高级驾驶辅助系统(AD/ADAS)软件与硬件的快速发展对多传感器数据采集的设计需求提出了更高的要求。然而,目前仍缺乏能够高质量集成多传感器数据采集的解决方案。康谋ADTF正是应运而生,它提供了一个广受认可和广泛引用的软件框架,包含模块化的标准化应用程序和工具,旨在为ADAS功能的开发提供一站式体验。一、ADTF的关键之处!无论是奥迪、大众、宝马还是梅赛德斯-奔驰:他们都依赖我们不断发展的ADTF来开发智能驾驶辅助解决方案,直至实现自动驾驶的目标。从新功能的最初构思到批量生
    康谋 2025-01-09 10:04 55浏览
  • 光伏逆变器是一种高效的能量转换设备,它能够将光伏太阳能板(PV)产生的不稳定的直流电压转换成与市电频率同步的交流电。这种转换后的电能不仅可以回馈至商用输电网络,还能供独立电网系统使用。光伏逆变器在商业光伏储能电站和家庭独立储能系统等应用领域中得到了广泛的应用。光耦合器,以其高速信号传输、出色的共模抑制比以及单向信号传输和光电隔离的特性,在光伏逆变器中扮演着至关重要的角色。它确保了系统的安全隔离、干扰的有效隔离以及通信信号的精准传输。光耦合器的使用不仅提高了系统的稳定性和安全性,而且由于其低功耗的
    晶台光耦 2025-01-09 09:58 43浏览
  • 故障现象一辆2017款东风风神AX7车,搭载DFMA14T发动机,累计行驶里程约为13.7万km。该车冷起动后怠速运转正常,热机后怠速运转不稳,组合仪表上的发动机转速表指针上下轻微抖动。 故障诊断 用故障检测仪检测,发动机控制单元中无故障代码存储;读取发动机数据流,发现进气歧管绝对压力波动明显,有时能达到69 kPa,明显偏高,推断可能的原因有:进气系统漏气;进气歧管绝对压力传感器信号失真;发动机机械故障。首先从节气门处打烟雾,没有发现进气管周围有漏气的地方;接着拔下进气管上的两个真空
    虹科Pico汽车示波器 2025-01-08 16:51 107浏览
  • 根据环洋市场咨询(Global Info Research)项目团队最新调研,预计2030年全球中空长航时无人机产值达到9009百万美元,2024-2030年期间年复合增长率CAGR为8.0%。 环洋市场咨询机构出版了的【全球中空长航时无人机行业总体规模、主要厂商及IPO上市调研报告,2025-2031】研究全球中空长航时无人机总体规模,包括产量、产值、消费量、主要生产地区、主要生产商及市场份额,同时分析中空长航时无人机市场主要驱动因素、阻碍因素、市场机遇、挑战、新产品发布等。报告从中空长航时
    GIRtina 2025-01-09 10:35 60浏览
  • 「他明明跟我同梯进来,为什么就是升得比我快?」许多人都有这样的疑问:明明就战绩也不比隔壁同事差,升迁之路却比别人苦。其实,之间的差异就在于「领导力」。並非必须当管理者才需要「领导力」,而是散发领导力特质的人,才更容易被晓明。许多领导力和特质,都可以通过努力和学习获得,因此就算不是天生的领导者,也能成为一个具备领导魅力的人,进而被老板看见,向你伸出升迁的橘子枝。领导力是什么?领导力是一种能力或特质,甚至可以说是一种「影响力」。好的领导者通常具备影响和鼓励他人的能力,并导引他们朝着共同的目标和愿景前
    优思学院 2025-01-08 14:54 93浏览
  •  在全球能源结构加速向清洁、可再生方向转型的今天,风力发电作为一种绿色能源,已成为各国新能源发展的重要组成部分。然而,风力发电系统在复杂的环境中长时间运行,对系统的安全性、稳定性和抗干扰能力提出了极高要求。光耦(光电耦合器)作为一种电气隔离与信号传输器件,凭借其优秀的隔离保护性能和信号传输能力,已成为风力发电系统中不可或缺的关键组件。 风力发电系统对隔离与控制的需求风力发电系统中,包括发电机、变流器、变压器和控制系统等多个部分,通常工作在高压、大功率的环境中。光耦在这里扮演了
    晶台光耦 2025-01-08 16:03 84浏览
  • 一个真正的质量工程师(QE)必须将一件产品设计的“意图”与系统的可制造性、可服务性以及资源在现实中实现设计和产品的能力结合起来。所以,可以说,这确实是一种工程学科。我们常开玩笑说,质量工程师是工程领域里的「侦探」、「警察」或「律师」,守护神是"墨菲”,信奉的哲学就是「墨菲定律」。(注:墨菲定律是一种启发性原则,常被表述为:任何可能出错的事情最终都会出错。)做质量工程师的,有时会不受欢迎,也会被忽视,甚至可能遭遇主动或被动的阻碍,而一旦出了问题,责任往往就落在质量工程师的头上。虽然质量工程师并不负
    优思学院 2025-01-09 11:48 82浏览
  • 职场是人生的重要战场,既是谋生之地,也是实现个人价值的平台。然而,有些思维方式却会悄无声息地拖住你的后腿,让你原地踏步甚至退步。今天,我们就来聊聊职场中最忌讳的五种思维方式,看看自己有没有中招。1. 固步自封的思维在职场中,最可怕的事情莫过于自满于现状,拒绝学习和改变。世界在不断变化,行业的趋势、技术的革新都在要求我们与时俱进。如果你总觉得自己的方法最优,或者害怕尝试新事物,那就很容易被淘汰。与其等待机会找上门,不如主动出击,保持学习和探索的心态。加入优思学院,可以帮助你快速提升自己,与行业前沿
    优思学院 2025-01-09 15:48 47浏览
  • HDMI 2.2 规格将至,开启视听新境界2025年1月6日,HDMI Forum, Inc. 宣布即将发布HDMI规范2.2版本。新HDMI规范为规模庞大的 HDMI 生态系统带来更多选择,为创建、分发和体验理想的终端用户效果提供更先进的解决方案。新技术为电视、电影和游戏工作室等内容制作商在当前和未来提供更高质量的选择,同时实现多种分发平台。96Gbps的更高带宽和新一代 HDMI 固定比率速率传输(Fixed Rate Link)技术为各种设备应用提供更优质的音频和视频。终端用户显示器能以最
    百佳泰测试实验室 2025-01-09 17:33 55浏览
  • 在智能网联汽车中,各种通信技术如2G/3G/4G/5G、GNSS(全球导航卫星系统)、V2X(车联网通信)等在行业内被广泛使用。这些技术让汽车能够实现紧急呼叫、在线娱乐、导航等多种功能。EMC测试就是为了确保在复杂电磁环境下,汽车的通信系统仍然可以正常工作,保护驾乘者的安全。参考《QCT-基于LTE-V2X直连通信的车载信息交互系统技术要求及试验方法-1》标准10.5电磁兼容试验方法,下面将会从整车功能层面为大家解读V2X整车电磁兼容试验的过程。测试过程揭秘1. 设备准备为了进行电磁兼容试验,技
    北汇信息 2025-01-09 11:24 67浏览
  • 在当前人工智能(AI)与物联网(IoT)的快速发展趋势下,各行各业的数字转型与自动化进程正以惊人的速度持续进行。如今企业在设计与营运技术系统时所面临的挑战不仅是技术本身,更包含硬件设施、第三方软件及配件等复杂的外部因素。然而这些系统往往讲究更精密的设计与高稳定性,哪怕是任何一个小小的问题,都可能对整体业务运作造成严重影响。 POS应用环境与客户需求以本次分享的客户个案为例,该客户是一家全球领先的信息技术服务与数字解决方案提供商,遭遇到一个由他们所开发的POS机(Point of Sal
    百佳泰测试实验室 2025-01-09 17:35 54浏览
  • 1月7日-10日,2025年国际消费电子产品展览会(CES 2025)盛大举行,广和通发布Fibocom AI Stack,赋智千行百业端侧应用。Fibocom AI Stack提供集高性能模组、AI工具链、高性能推理引擎、海量模型、支持与服务一体化的端侧AI解决方案,帮助智能设备快速实现AI能力商用。为适应不同端侧场景的应用,AI Stack具备海量端侧AI模型及行业端侧模型,基于不同等级算力的芯片平台或模组,Fibocom AI Stack可将TensorFlow、PyTorch、ONNX、
    物吾悟小通 2025-01-08 18:17 53浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦