【深入理解Linux内核锁】|原子操作

原创 嵌入式艺术 2023-06-07 11:30

【深入理解Linux内核锁】三、原子操作

1、原子操作思想

原子操作(atomic operation),不可分割的操作。其通过原子变量来实现,以保证单个CPU周期内,读写该变量,不能被打断,进而判断该变量的值,来解决并发引起的互斥。

Atomic类型的函数可以在执行期间禁止中断,并保证在访问变量时的原子性。

同时,Linux内核提供了两类原子操作的接口,分别是针对整型变量的原子操作。    

2、整型变量原子操作

2.1 API接口

对于整形变量的原子操作,内核提供了一系列的 API接口

/*设置原子变量的值*/
atomic_t v = ATOMIC_INIT(0);            /* 定义原子变量v并初始化为0 */
void atomic_set(atomic_t *v, int i);    /* 设置原子变量的值为i */

/*获取原子变量的值*/
atomic_read(atomic_t *v);          /* 返回原子变量的值*/

/*原子变量的加减*/
void atomic_add(int i, atomic_t *v);      /* 原子变量增加i */
void atomic_sub(int i, atomic_t *v);      /* 原子变量减少i */

/*原子变量的自增,自减*/
void atomic_inc(atomic_t *v);    /* 原子变量增加1 */
void atomic_dec(atomic_t *v);        /* 原子变量减少1 */

/*原子变量的操作并测试*/
int atomic_inc_and_test(atomic_t *v);  /*进行对应操作后,测试原子变量值是否为0*/
int atomic_dec_and_test(atomic_t *v);
int atomic_sub_and_test(int i, atomic_t *v);

/*原子变量的操作并返回*/
int atomic_add_return(int i, atomic_t *v)/*进行对应操作后,返回新的值*/
int atomic_sub_return(int i, atomic_t *v);
int atomic_inc_return(atomic_t *v);
int atomic_dec_return(atomic_t *v);

2.2 API实现

我们下面就介绍几个稍微有代表性的接口实现

以下基于Linux内核源码4.19,刚看是看的时候,有点摸不着头脑,因为定义的地方和引用的地方较多,不太容易找到,后来才慢慢得窥门径。

2.2.1 原子变量结构体

typedef struct {
    int counter;
atomic_t;

结构体名称atomic_t

文件位置include/linux/types.h

主要作用:原子变量结构体,该结构体只包含一个整型成员变量counter,用于存储原子变量的值。

2.2.2 设置原子变量操作

2.2.2.1 ATOMIC_INIT
#define ATOMIC_INIT(i) { (i) }

函数介绍:定义了一个ATOMIC类型的变量,并初始化为给定的值。

文件位置arch/arm/include/asm/atomic.h,由include/linux/atomic.h引用

实现方法:这个宏定义比较简单,通过大括号将值包裹起来作为一个结构体,结构体的第一个成员就用就是给定的该值。

2.2.2.2 atomic_set
#define atomic_set(v,i) WRITE_ONCE(((v)->counter), (i))

#define WRITE_ONCE(x, val) \
({       \
    union { typeof(x) __val; char __c[1]; } __u = \
        { .__val = (__force typeof(x)) (val) }; \
    __write_once_size(&(x), __u.__c, sizeof(x)); \
    __u.__val;     \
})


static __always_inline void __write_once_size(volatile void *p, void *res, int size)
{
    switch (size) {
    case 1: *(volatile __u8 *)p = *(__u8 *)res; break;
    case 2: *(volatile __u16 *)p = *(__u16 *)res; break;
    case 4: *(volatile __u32 *)p = *(__u32 *)res; break;
    case 8: *(volatile __u64 *)p = *(__u64 *)res; break;
    default:
        barrier();
        __builtin_memcpy((void *)p, (const void *)res, size);
        barrier();
    }
}

函数介绍:该函数也用作初始化原子变量

文件位置:由include/linux/atomic.h引用arch/arm/include/asm/atomic.h,再引用include/linux/compiler.h

实现方式:通过调用WRITE_ONCE来实现,其中WRITE_ONCE宏实现了一些屏蔽编译器优化的技巧,确保写入操作是原子的。

  1. atomic_set调用WRITE_ONCEi的值写入原子变量(v)->counter中,WRITE_ONCE以保证操作的原子性
  2. WRITE_ONCE用来保证操作的原子性
    1. 创建union联合体,包括__val__C成员变量
    2. 定义一个__U变量,使用强制转换将参数__val转换为typeof(x)类型,传递给联合体变量__u.__val
    3. 调用__write_once_size函数,将__c的值写入到x指向的内存地址中。
    4. 函数返回__u.__val。
  3. union联合体
    1. 它的特点是存储多种数据类型的值,但是所有成员共享同一个内存空间,这样可以节省内存空间。
    2. 主要作用是将一个非字符类型的数据x强制转换为一个字符类型的数据,以字符类型数据来访问该区块的内存单元。
  4. __write_once_size函数实现了操作的原子性,核心有以下几点:
    1. 该函数在向内存写入数据时使用了volatile关键字,告诉编译器不要进行优化,每次操作都从内存中读取最新的值。
    2. 函数中的switch语句保证了对不同大小的数据类型使用不同的存储方式,可以保证内存访问的原子性。
    3. 对于默认情况,则使用了__builtin_memcpy函数进行复制,而这个函数具有原子性。
    4. barrier()函数指示CPU要完成所有之前的内存操作,以及确保执行顺序与其他指令不发生重排。

2.2.3 原子变量的加减

2.2.3.1 ATOMIC_OPS
/*
 * ARMv6 UP and SMP safe atomic ops.  We use load exclusive and
 * store exclusive to ensure that these are atomic.  We may loop
 * to ensure that the update happens.
 */


#define ATOMIC_OP(op, c_op, asm_op)     \
static inline void atomic_##op(int i, atomic_t *v)   \
{         \
    unsigned long tmp;      \
    int result;       \
                                    \
    prefetchw(&v->counter);      \
    __asm__ __volatile__("@ atomic_" #op "\n"   \
"1: ldrex %0, [%3]\n"      \
" " #asm_op " %0, %0, %4\n"     \
" strex %1, %0, [%3]\n"      \
" teq %1, #0\n"      \
" bne 1b"       \
    : "=&r" (result), "=&r" (tmp), "+Qo" (v->counter)  \
    : "r" (&v->counter), "Ir" (i)     \
    : "cc");       \
}         \

#define ATOMIC_OP_RETURN(op, c_op, asm_op)    \
static inline int atomic_##op##_return_relaxed(int i, atomic_t *v) \
{         \
    unsigned long tmp;      \
    int result;       \
                                    \
    prefetchw(&v->counter);      \
                                    \
    __asm__ __volatile__("@ atomic_" #op "_return\n"  \
"1: ldrex %0, [%3]\n"      \
" " #asm_op " %0, %0, %4\n"     \
" strex %1, %0, [%3]\n"      \
" teq %1, #0\n"      \
" bne 1b"       \
    : "=&r" (result), "=&r" (tmp), "+Qo" (v->counter)  \
    : "r" (&v->counter), "Ir" (i)     \
    : "cc");       \
                                    \
    return result;       \
}


#define ATOMIC_FETCH_OP(op, c_op, asm_op)    \
static inline int atomic_fetch_##op##_relaxed(int i, atomic_t *v) \
{         \
    unsigned long tmp;      \
    int result, val;      \
                                    \
    prefetchw(&v->counter);      \
                                    \
    __asm__ __volatile__("@ atomic_fetch_" #op "\n"   \
"1: ldrex %0, [%4]\n"      \
" " #asm_op " %1, %0, %5\n"     \
" strex %2, %1, [%4]\n"      \
" teq %2, #0\n"      \
" bne 1b"       \
    : "=&r" (result), "=&r" (val), "=&r" (tmp), "+Qo" (v->counter) \
    : "r" (&v->counter), "Ir" (i)     \
    : "cc");       \
                                    \
    return result;       \
}


#define ATOMIC_OPS(op, c_op, asm_op)     \
    ATOMIC_OP(op, c_op, asm_op)     \
    ATOMIC_OP_RETURN(op, c_op, asm_op)    \
    ATOMIC_FETCH_OP(op, c_op, asm_op)

atomic_add找半天,还找到了不同的架构下面。:(

原来内核通过各种宏定义将其操作全部管理起来,宏定义在内核中的使用也是非常广泛了。

函数作用:通过一些列宏定义,来实现原子变量的addsubandor等原子变量操作

文件位置arch/arm/include/asm/atomic.h

实现方式

我们以atomic_##op为例来介绍,其他大同小异!

#define ATOMIC_OP(op, c_op, asm_op)     \
static inline void atomic_##op(int i, atomic_t *v)   \
{         \
    unsigned long tmp;      \
    int result;       \
                                    \
    prefetchw(&v->counter);      \
    __asm__ __volatile__("@ atomic_" #op "\n"   \
"1: ldrex %0, [%3]\n"      \
" " #asm_op " %0, %0, %4\n"     \
" strex %1, %0, [%3]\n"      \
" teq %1, #0\n"      \
" bne 1b"       \
    : "=&r" (result), "=&r" (tmp), "+Qo" (v->counter)  \
    : "r" (&v->counter), "Ir" (i)     \
    : "cc");       \
}  

  1. 首先是函数名称atomic_##op,通过##来实现字符串的拼接,使函数名称可变,如atomic_addatomic_sub
  2. 调用prefetchw函数,预取数据到L1缓存,方便操作,提高程序性能,但是不要滥用。
  3. __asm__ __volatile__:表示汇编指令
  4. "@ atomic_" #op "\n":为汇编注释
  5. "1: ldrex %0, [%3]\n":将%3存储地址的数据,读入到%0地址中,ldrex为独占式的读取操作。
  6. " " #asm_op " %0, %0, %4\n"" #asm_op "表示作为宏定义传进来的参数,表示不同的操作码addsub等,操作%0%4对应的地址的值,并将结果返回到%0地址处
  7. " strex %1, %0, [%3]\n" :表示将%0地址处的值写入%3地址处,strex为独占式的写操作,写入的结果会返回到%1地址中
  8. " teq %1, #0\n":测试%1寄存器的值是否为0,如果不等于0,则执行下面的" bne 1b" 操作,跳转到1代码标签的位置,也就是ldrex前面的1的位置
  9. : "=&r" (result), "=&r" (tmp), "+Qo" (v->counter):根据汇编语法,前两个为输出操作数,第三个为输入输出操作数
  10. : "r" (&v->counter), "Ir" (i):根据汇编语法,这两个为输入操作数
  11. : "cc":表示可能会修改条件码寄存器,编译期间需要优化。

通过ldrexstrex两个独占式的操作,保证了读写的原子性。

2.2.3.2 atomic_add和atomic_sub定义
ATOMIC_OPS(add, +=, add)
ATOMIC_OPS(sub, -=, sub)

通过宏定义来实现atomic_addatomic_sub的定义,下面我们就不一一分析了,原理都是通过ARM提供的ldrex strex也就是我们常说的LoadStore指令实现读取操作,确保操作的原子性。

3、位原子操作

3.1 API接口

void set_bit(nr, void *addr);  // 设置位:设置addr地址的第nr位,所谓设置位即是将位写为1
void clear_bit(nr, void *addr);  // 清除位:清除addr地址的第nr位,所谓清除位即是将位写为0
void change_bit(nr, void *addr)// 改变位:对addr地址的第nr位进行反置。
test_bit(nr, void *addr);   // 测试位:返回addr地址的第nr位。
int test_and_set_bit(nr, void *addr);// 测试并设置位
int test_and_clear_bit(nr, void *addr)// 测试并清除位
int test_and_change_bit(nr, void *addr);// 测试并改变位

3.2 API实现

同样,我们还是简单介绍几个接口,其他核心实现原理相同

3.2.1 set_bit

#define set_bit(nr,p)   ATOMIC_BITOP(set_bit,nr,p)

#define ATOMIC_BITOP(name,nr,p)   \
    (__builtin_constant_p(nr) ? ____atomic_##name(nr, p) : _##name(nr,p))


extern void _set_bit(int nr, volatile unsigned long * p);

/*
 * These functions are the basis of our bit ops.
 *
 * First, the atomic bitops. These use native endian.
 */

static inline void ____atomic_set_bit(unsigned int bit, volatile unsigned long *p)
{
    unsigned long flags;
    unsigned long mask = BIT_MASK(bit);

    p += BIT_WORD(bit);

    raw_local_irq_save(flags);
    *p |= mask;
    raw_local_irq_restore(flags);
}

#define BIT_MASK(nr)  (1UL << ((nr) % BITS_PER_LONG))
#define BIT_WORD(nr)  ((nr) / BITS_PER_LONG)

#ifdef CONFIG_64BIT
#define BITS_PER_LONG 64
#else
#define BITS_PER_LONG 32
#endif /* CONFIG_64BIT */

函数介绍:该函数用于原子操作某个地址的某一位。

文件位置/arch/arm/include/asm/bitops.h

实现方式

  1. __builtin_constant_pGCC的一个内置函数,用来判断表达式是否为常量,如果为常量,则返回值为1
  2. ____atomic_set_bit函数中BIT_MASK,用于获取操作位的掩码,将要设置的位设置为1,其他为0
  3. BIT_WORD:确定要操作位的偏移,要偏移多少个字
  4. 通过raw_local_irq_saveraw_local_irq_restore中断屏蔽来保证位操作*p |= mask;的原子性

4、总结

该文章主要详细了解了Linux内核锁的原子操作,原子操作分为两种:整型变量的原子操作和位原子操作。

  • 整型变量的原子操作:通过ldrexstrex来实现
  • 位原子操作:通过中断屏蔽来实现。
嵌入式艺术
MEET SPRING
万物更生,新岁开启


嵌入式艺术 分享一些高级嵌入式相关知识,包括:计算机基础、操作系统、Linux驱动、Linux内核、RT-thread等,除此之外,并且会组织一些简单的训练项目,一起成长。 我的创作理念:专注分享高质量的嵌入式文章,让大家读有所得!
评论
  • By Toradex 秦海1). 简介嵌入式平台设备基于Yocto Linux 在开发后期量产前期,为了安全以及提高启动速度等考虑,希望将 ARM 处理器平台的 Debug Console 输出关闭,本文就基于 NXP i.MX8MP ARM 处理器平台来演示相关流程。 本文所示例的平台来自于 Toradex Verdin i.MX8MP 嵌入式平台。  2. 准备a). Verdin i.MX8MP ARM核心版配合Dahlia载板并
    hai.qin_651820742 2025-01-07 14:52 48浏览
  • 大模型的赋能是指利用大型机器学习模型(如深度学习模型)来增强或改进各种应用和服务。这种技术在许多领域都显示出了巨大的潜力,包括但不限于以下几个方面: 1. 企业服务:大模型可以用于构建智能客服系统、知识库问答系统等,提升企业的服务质量和运营效率。 2. 教育服务:在教育领域,大模型被应用于个性化学习、智能辅导、作业批改等,帮助教师减轻工作负担,提高教学质量。 3. 工业智能化:大模型有助于解决工业领域的复杂性和不确定性问题,尽管在认知能力方面尚未完全具备专家级的复杂决策能力。 4. 消费
    丙丁先生 2025-01-07 09:25 83浏览
  • 这篇内容主要讨论三个基本问题,硅电容是什么,为什么要使用硅电容,如何正确使用硅电容?1.  硅电容是什么首先我们需要了解电容是什么?物理学上电容的概念指的是给定电位差下自由电荷的储藏量,记为C,单位是F,指的是容纳电荷的能力,C=εS/d=ε0εrS/4πkd(真空)=Q/U。百度百科上电容器的概念指的是两个相互靠近的导体,中间夹一层不导电的绝缘介质。通过观察电容本身的定义公式中可以看到,在各个变量中比较能够改变的就是εr,S和d,也就是介质的介电常数,金属板有效相对面积以及距离。当前
    知白 2025-01-06 12:04 173浏览
  • 在智能家居领域中,Wi-Fi、蓝牙、Zigbee、Thread与Z-Wave等无线通信协议是构建短距物联局域网的关键手段,它们常在实际应用中交叉运用,以满足智能家居生态系统多样化的功能需求。然而,这些协议之间并未遵循统一的互通标准,缺乏直接的互操作性,在进行组网时需要引入额外的网关作为“翻译桥梁”,极大地增加了系统的复杂性。 同时,Apple HomeKit、SamSung SmartThings、Amazon Alexa、Google Home等主流智能家居平台为了提升市占率与消费者
    华普微HOPERF 2025-01-06 17:23 146浏览
  • 根据Global Info Research项目团队最新调研,预计2030年全球封闭式电机产值达到1425百万美元,2024-2030年期间年复合增长率CAGR为3.4%。 封闭式电机是一种电动机,其外壳设计为密闭结构,通常用于要求较高的防护等级的应用场合。封闭式电机可以有效防止外部灰尘、水分和其他污染物进入内部,从而保护电机的内部组件,延长其使用寿命。 环洋市场咨询机构出版的调研分析报告【全球封闭式电机行业总体规模、主要厂商及IPO上市调研报告,2025-2031】研究全球封闭式电机总体规
    GIRtina 2025-01-06 11:10 104浏览
  • 每日可见的315MHz和433MHz遥控模块,你能分清楚吗?众所周知,一套遥控设备主要由发射部分和接收部分组成,发射器可以将控制者的控制按键经过编码,调制到射频信号上面,然后经天线发射出无线信号。而接收器是将天线接收到的无线信号进行解码,从而得到与控制按键相对应的信号,然后再去控制相应的设备工作。当前,常见的遥控设备主要分为红外遥控与无线电遥控两大类,其主要区别为所采用的载波频率及其应用场景不一致。红外遥控设备所采用的射频信号频率一般为38kHz,通常应用在电视、投影仪等设备中;而无线电遥控设备
    华普微HOPERF 2025-01-06 15:29 131浏览
  • 本文介绍Linux系统更换开机logo方法教程,通用RK3566、RK3568、RK3588、RK3576等开发板,触觉智能RK3562开发板演示,搭载4核A53处理器,主频高达2.0GHz;内置独立1Tops算力NPU,可应用于物联网网关、平板电脑、智能家居、教育电子、工业显示与控制等行业。制作图片开机logo图片制作注意事项(1)图片必须为bmp格式;(2)图片大小不能大于4MB;(3)BMP位深最大是32,建议设置为8;(4)图片名称为logo.bmp和logo_kernel.bmp;开机
    Industio_触觉智能 2025-01-06 10:43 87浏览
  • 村田是目前全球量产硅电容的领先企业,其在2016年收购了法国IPDiA头部硅电容器公司,并于2023年6月宣布投资约100亿日元将硅电容产能提升两倍。以下内容主要来自村田官网信息整理,村田高密度硅电容器采用半导体MOS工艺开发,并使用3D结构来大幅增加电极表面,因此在给定的占位面积内增加了静电容量。村田的硅技术以嵌入非结晶基板的单片结构为基础(单层MIM和多层MIM—MIM是指金属 / 绝缘体/ 金属) 村田硅电容采用先进3D拓扑结构在100um内,使开发的有效静电容量面积相当于80个
    知白 2025-01-07 15:02 76浏览
  • 根据环洋市场咨询(Global Info Research)项目团队最新调研,预计2030年全球无人机锂电池产值达到2457百万美元,2024-2030年期间年复合增长率CAGR为9.6%。 无人机锂电池是无人机动力系统中存储并释放能量的部分。无人机使用的动力电池,大多数是锂聚合物电池,相较其他电池,锂聚合物电池具有较高的能量密度,较长寿命,同时也具有良好的放电特性和安全性。 全球无人机锂电池核心厂商有宁德新能源科技、欣旺达、鹏辉能源、深圳格瑞普和EaglePicher等,前五大厂商占有全球
    GIRtina 2025-01-07 11:02 74浏览
  • 彼得·德鲁克被誉为“现代管理学之父”,他的管理思想影响了无数企业和管理者。然而,关于他的书籍分类,一种流行的说法令人感到困惑:德鲁克一生写了39本书,其中15本是关于管理的,而其中“专门写工商企业或为企业管理者写的”只有两本——《为成果而管理》和《创新与企业家精神》。这样的表述广为流传,但深入探讨后却发现并不完全准确。让我们一起重新审视这一说法,解析其中的矛盾与根源,进而重新认识德鲁克的管理思想及其著作的真正价值。从《创新与企业家精神》看德鲁克的视角《创新与企业家精神》通常被认为是一本专为企业管
    优思学院 2025-01-06 12:03 124浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦