线程安全代码到底是怎么编写的?

嵌入式ARM 2022-05-17 12:00

相信有很多同学在面对多线程代码时都会望而生畏,认为多线程代码就像一难以驯服的怪兽,你制服不了这头怪兽它就会反过来吞噬你。

夸张了哈,总之,多线程程序有时就像一潭淤泥,走不进去退不出来。

可这是为什么呢?为什么多线程代码如此难以正确编写呢

从根源上思考

关于这个问题,本质上是有一个词语你没有透彻理解,这个词就是所谓的线程安全,thread safe。
如果你不能理解线程安全,那么给你再多的方案也是无用武之地
接下来我们了解一下什么是线程安全,怎样才能做到线程安全。
这些问题解答后,多线程这头大怪兽自然就会变成温顺的小猫咪。

可上图关小猫咪屁事!

关你什么屁事

生活中我们口头上经常说的一句话就是“关你屁事”,大家想一想,为什么我们的屁事不关别人?
原因很简单,这是我的私事啊!我的衣服、我的电脑,我的手机、我的车子、我的别墅以及私人泳池(可以没有,但不妨碍想象),我想怎么处理就怎么处理,妨碍不到别人,只属于我一个人的东西以及事情当然不关别人,即使是屁事也不关别人
我们在自己家里想吃什么吃什么,想去厕所就去厕所!因为这些都是我私有的,只有我自己使用
那么,什么时候会和其它人有交集呢?
答案就是公共场所
在公共场所下你不能像在自己家里一样想去哪就去哪,想什么时候去厕所就去厕所,为什么呢?原因很简单,因为公共场所下的饭馆、卫生间不是你家的,这是公共资源,大家都可以使用的公共资源。
如果你想去饭馆、去公共卫生间那么就必须遵守规则,这个规则就是排队,只有前一个人用完公共资源后下一个人才可以使用,而且不能同时使用,想使用就必须排队等待
上面这段话道理足够简单吧。

如果你能理解这段话,那么驯服多线程这头小怪兽就不在话下。

维护公共场所秩序

如果把你自己理解为线程的话,那么在你自己家里使用私有资源就是所谓的线程安全,原因很简单,因为你随便怎么折腾自己的东西(资源)都不会妨碍到别人
但到公共场所浪的话就不一样了,在公共场所使用的是公共资源,这时你就不能像在自己家里一样想怎么用就怎么用想什么时候用就什么时候用,公共场所必须有相应规则,这里的规则通常是排队,只有这样公共场所的秩序才不会被破坏,线程以某种不妨碍到其它线程的秩序使用共享资源就能实现线程安全。
因此我们可以看到,这里有两种情况:
  • 线程私有资源,没有线程安全问题

  • 共享资源,线程间以某种秩序使用共享资源也能实现线程安全。

本文都是围绕着上述两个核心点来讲解的,现在我们就可以正式的聊聊编程中的线程安全了。

什么是线程安全

我们说一段代码是线程安全的,当且仅当我们在多个线程中同时且多次调用的这段代码都能给出正确的结果,这样的代码我们才说是线程安全代码,Thread Safety,否则就不是线程安全代码,thread-unsafe.。
非线程安全的代码其运行结果是由掷骰子决定的。

怎么样,线程安全的定义很简单吧,也就是说你的代码不管是在单个线程还是多个线程中被执行都应该能给出正确的运行结果,这样的代码是不会出现多线程问题的,就像下面这段代码:

int func() {  int a = 1;  int b = 1;  return a + b;}

对于这样段代码,无论你用多少线程同时调用、怎么调用、什么时候调用都会返回2,这段代码就是线程安全的。

那么,我们该怎样写出线程安全的代码呢?
要回答这个问题,我们需要知道我们的代码什么时候呆在自己家里使用私有资源,什么时候去公共场所浪使用公共资源,也就是说你需要识别线程的私有资源和共享资源都有哪些,这是解决线程安全问题的核心所在。


线程私有资源

线程都有哪些私有资源呢?啊哈,我们在上一篇《线程到底共享了哪些进程资源》中详细讲解了这个问题。
线程运行的本质其实就是函数的执行,函数的执行总会有一个源头,这个源头就是所谓的入口函数,CPU从入口函数开始执行从而形成一个执行流,只不过我们人为的给执行流起一个名字,这个名字就叫线程。
既然线程运行的本质就是函数的执行,那么函数运行时信息都保存在哪里呢?
答案就是栈区,每个线程都有一个私有的栈区,因此在栈上分配的局部变量就是线程私有的,无论我们怎样使用这些局部变量都不管其它线程屁事。

线程私有的栈区就是线程自己家

线程间共享数据

除了上一节提到的剩下的区域就是公共场合了,这包括:
  • 用于动态分配内存的堆区,我们用C/C++中的malloc或者new就是在堆区上申请的内存

  • 全局区,这里存放的就是全局变量

  • 文件,我们知道线程是共享进程打开的文件

有的同学可能说,等等,在上一篇文章不是说还有代码区和动态链接库吗?
要知道这两个区域是不能被修改的,也就是说这两个区域是只读的,因此多个线程使用是没有问题的。
在刚才我们提到的堆区、数据区以及文件,这些就是所有的线程都可以共享的资源,也就是公共场所,线程在这些公共场所就不能随便浪了。
线程使用这些共享资源必须要遵守秩序,这个秩序的核心就是对共享资源的使用不能妨碍到其它线程,无论你使用各种锁也好、信号量也罢,其目的都是在维护公共场所的秩序。
知道了哪些是线程私有的,哪些是线程间共享的,接下来就简单了。
值得注意的是,关于线程安全的一切问题全部围绕着线程私有数据与线程共享数据来处理,抓住了线程私有资源和共享资源这个主要矛盾也就抓住了解决线程安全问题的核心

接下来,我们看一下在各种情况下该怎样实现线程安全。这里依然以C/C++代码为例,但是这里讲解的方法适用于任何语言,请放心,这些代码足够简单。

只使用线程私有资源

我们来看这段代码:
int func() {  int a = 1;  int b = 1;  return a + b;}
这段代码在前面提到过,无论你在多少个线程中怎么调用什么时候调用,func函数都会确定的返回2,该函数不依赖任何全局变量,不依赖任何函数参数,且使用的局部变量都是线程私有资源,这样的代码也被称为无状态函数,stateless,很显然这样的代码是线程安全的。

这样的代码请放心大胆的在多线程中使用,不会有任何问题。

有的同学可能会说,那如果我们还是使用线程私有资源,但是传入函数参数呢?

线程私有资源+函数参数

这样的代码是线程安全的吗?自己先想一想这个问题。
答案是it depends,也就是要看情况。看什么情况呢?
1、按值传参
如果你传入的参数的方式是按值传入,那么没有问题,代码依然是线程安全的:
int func(int num) {  num++;  return num;}
这这段代码无论在多少个线程中调用怎么调用什么时候调用都会正确返回参数加1后的值。
原因很简单,按值传入的这些参数是线程私有资源。


2、按引用传参
但如果是按引用传入参数,那么情况就不一样了:
int func(int* num) {  ++(*num);  return *num;}
如果调用该函数的线程传入的参数是线程私有资源,那么该函数依然是线程安全的,能正确的返回参数加1后的值。
但如果传入的参数是全局变量,就像这样:
int global_num = 1;
int func(int* num) { ++(*num); return *num;}
// 线程1void thread1() { func(&global_num);}
// 线程2void thread1() { func(&global_num);}
那此时func函数将不再是线程安全代码,因为传入的参数指向了全局变量,这个全局变量是所有线程可共享资源,这种情况下如果不改变全局变量的使用方式,那么对该全局变量的加1操作必须施加某种秩序,比如加锁。

有的同学可能会说如果我传入的不是全局变量的指针(引用)是不是就不会有问题了?
答案依然是it depends,要看情况。
即便我们传入的参数是在堆上(heap)用malloc或new出来的,依然可能会有问题,为什么?
答案很简单,因为堆上的资源也是所有线程可共享的

假如有两个线程调用func函数时传入的指针(引用)指向了同一个堆上的变量,那么该变量就变成了这两个线程的共享资源,在这种情况下func函数依然不是线程安全的。
改进也很简单,那就是每个线程调用func函数传入一个独属于该线程的资源地址,这样各个线程就不会妨碍到对方了,因此,写出线程安全代码的一大原则就是能用线程私有的资源就用私有资源,线程之间尽最大可能不去使用共享资源

如果线程不得已要使用全局资源呢?

使用全局资源

使用全局资源就一定不是线程安全代码吗?
答案还是。。有的同学可能已经猜到了,答案依然是要看情况。
如果使用的全局资源只在程序运行时初始化一次,此后所有代码对其使用都是只读的,那么没有问题,就像这样:
int global_num = 100; //初始化一次,此后没有其它代码修改其值
int func() { return global_num;}
我们看到,即使func函数使用了全局变量,但该全局变量只在运行前初始化一次,此后的代码都不会对其进行修改,那么func函数依然是线程安全的。

但是,如果我们简单修改一下func:
int global_num = 100; 
int func() { ++global_num; return global_num;}

这时,func函数就不再是线程安全的了,对全局变量的修改必须加锁保护。

线程局部存储

接下来我们再对上述func函数简单修改:
__thread int global_num = 100; 
int func() { ++global_num; return global_num;}
我们看到全局变量global_num前加了关键词__thread修饰,这时,func代码就是又是线程安全的了。
为什么呢?
其实在上一篇文章中我们讲过,被__thread关键词修饰过的变量放在了线程私有存储中,Thread Local Storage,什么意思呢?
意思是说这个变量是线程私有的全局变量:
  • global_num是全局变量

  • global_num是线程私有的

各个线程对global_num的修改不会影响到其它线程,因为是线程私有资源,因此func函数是线程安全的。

说完了局部变量、全局变量、函数参数,那么接下来就到函数返回值了。

函数返回值

这里也有两种情况,一种是函数返回的是值;另一种返回对变量的引用。
1、返回的是值
我们来看这样一段代码:
int func() {  int a = 100;  return a;}
毫无疑问,这段代码是线程安全的,无论我们怎样调用该函数都会返回确定的值100。
2、返回的是引用
我们把上述代码简单的改一改:
int* func() {  static int a = 100;  return &a;}
如果我们在多线程中调用这样的函数,那么接下来等着你的可能就是难以调试的bug以及漫漫的加班长夜。

很显然,这不是线程安全代码,产生bug的原因也很简单,你在使用该变量前其值可能已经被其它线程修改了。因为该函数使用了一个静态全局变量,只要能拿到该变量的地址那么所有线程都可以修改该变量的值,因为这是线程间的共享资源,不到万不得已不要写出上述代码,除非老板拿刀架在你脖子上。
但是,请注意,有一个特例,这种使用方法可以用来实现设计模式中的单例模式,就像这样:
class S {public:  static S& getInstance() {    static S instance;    return instance;  }private:  S() {}  // 其它省略}
为什么呢?
因为无论我们调用多少次func函数,static局部变量都只会被初始化一次,这种特性可以很方便的让我们实现单例模式。

最后让我们来看下这种情况,那就是如果我们调用一个非线程安全的函数,那么我们的函数是线程安全的吗?

调用非线程安全代码

假如一个函数A调用另一个函数B,但B不是线程安全,那么函数A是线程安全的吗?
答案依然是,要看情况。
我们看下这样一段代码,这段代码在之前讲解过:
int global_num = 0;
int func() { ++global_num; return global_num;}
我们认为func函数是非线程安全的,因为func函数使用了全局变量并对其进行了修改,但如果我们这样调用func函数:
int funcA() {  mutex l;     l.lock();  func();  l.unlock();}
虽然func函数是非线程安全的,但是我们在调用该函数前加了一把锁进行保护,那么这时funcA函数就是线程安全的了,其本质就是我们用一把锁间接的保护了全局变量。
再看这样一段代码:
int func(int *num) {  ++(*num);  return *num;}
一般我们认为func函数是非线程安全的,因为我们不知道传入的指针是不是指向了一个全局变量,但如果调用func函数的代码是这样的:
void funcA() {  int a = 100;  func(&a);}
那么这时funcA函数依然是线程安全的,因为传入的参数是线程私有的局部变量,无论多少线程调用funcA都不会干扰到其它线程。

看了各种情况下的线程安全问题,最后让我们来总结一下实现线程安全代码都有哪些措施。

如何实现线程安全

从上面各种情况的分析来看,实现线程安全无外乎围绕线程私有资源和线程共享资源这两点,你需要识别出哪些是线程私有,哪些是共享的,这是核心,然后对症下药就可以了。

  • 不使用任何全局资源,只使用线程私有资源,这种通常被称为无状态代码
  • 线程局部存储,如果要使用全局资源,是否可以声明为线程局部存储,因为这种变量虽然是全局的,但每个线程都有一个属于自己的副本,对其修改不会影响到其它线程
  • 只读,如果必须使用全局资源,那么全局资源是否可以是只读的,多线程使用只读的全局资源不会有线程安全问题。
  • 原子操作,原子操作是说其在执行过程中是不可能被其它线程打断的,像C++中的std::atomic修饰过的变量,对这类变量的操作无需传统的加锁保护,因为C++会确保在变量的修改过程中不会被打断。我们常说的各种无锁数据结构通常是在这类原子操作的基础上构建的
  • 同步互斥,到这里也就确定了你必须要以某种形式使用全局资源,那么在这种情况下公共场所的秩序必须得到维护,那么怎么维护呢?通过同步或者互斥的方式,这是一大类问题,我们将在《深入理解操作系统》系列文章中详细阐述这一问题。

总 结

怎么样,想写出线程安全的还是不简单的吧,如果本文你只能记住一句话的话,那么我希望是这句,这也是本文的核心:
实现线程安全无外乎围绕线程私有资源和线程共享资源来进行,你需要识别出哪些是线程私有,哪些是共享的,然后对症下药就可以了。
希望本文对大家编写多线程程序有帮助。
END

来源:码农的荒岛求生

版权归原作者所有,如有侵权,请联系删除。

推荐阅读
国内MCU厂商也开始卷了…
分享GitHub上几个嵌入式相关的高星开源项目
成为嵌入式高手,少不了这100多个软硬件开源项目!

→点关注,不迷路←
嵌入式ARM 关注这个时代最火的嵌入式ARM,你想知道的都在这里。
评论
  • 习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习笔记&记录学习习笔记&记学习学习笔记&记录学习学习笔记&记录学习习笔记&记录学习学习笔记&记录学习学习笔记记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记
    youyeye 2024-12-10 16:13 105浏览
  • 概述 通过前面的研究学习,已经可以在CycloneVGX器件中成功实现完整的TDC(或者说完整的TDL,即延时线),测试结果也比较满足,解决了超大BIN尺寸以及大量0尺寸BIN的问题,但是还是存在一些之前系列器件还未遇到的问题,这些问题将在本文中进行详细描述介绍。 在五代Cyclone器件内部系统时钟受限的情况下,意味着大量逻辑资源将被浪费在于实现较大长度的TDL上面。是否可以找到方法可以对此前TDL的长度进行优化呢?本文还将探讨这个问题。TDC前段BIN颗粒堵塞问题分析 将延时链在逻辑中实现后
    coyoo 2024-12-10 13:28 101浏览
  • 时源芯微——RE超标整机定位与解决详细流程一、 初步测量与问题确认使用专业的电磁辐射测量设备,对整机的辐射发射进行精确测量。确认是否存在RE超标问题,并记录超标频段和幅度。二、电缆检查与处理若存在信号电缆:步骤一:拔掉所有信号电缆,仅保留电源线,再次测量整机的辐射发射。若测量合格:判定问题出在信号电缆上,可能是电缆的共模电流导致。逐一连接信号电缆,每次连接后测量,定位具体哪根电缆或接口导致超标。对问题电缆进行处理,如加共模扼流圈、滤波器,或优化电缆布局和屏蔽。重新连接所有电缆,再次测量
    时源芯微 2024-12-11 17:11 70浏览
  • 近日,搭载紫光展锐W517芯片平台的INMO GO2由影目科技正式推出。作为全球首款专为商务场景设计的智能翻译眼镜,INMO GO2 以“快、准、稳”三大核心优势,突破传统翻译产品局限,为全球商务人士带来高效、自然、稳定的跨语言交流体验。 INMO GO2内置的W517芯片,是紫光展锐4G旗舰级智能穿戴平台,采用四核处理器,具有高性能、低功耗的优势,内置超微高集成技术,采用先进工艺,计算能力相比同档位竞品提升4倍,强大的性能提供更加多样化的应用场景。【视频见P盘链接】 依托“
    紫光展锐 2024-12-11 11:50 47浏览
  • 我的一台很多年前人家不要了的九十年代SONY台式组合音响,接手时只有CD功能不行了,因为不需要,也就没修,只使用收音机、磁带机和外接信号功能就够了。最近五年在外地,就断电闲置,没使用了。今年9月回到家里,就一个劲儿地忙着收拾家当,忙了一个多月,太多事啦!修了电气,清理了闲置不用了的电器和电子,就是一个劲儿地扔扔扔!几十年的“工匠式”收留收藏,只能断舍离,拆解不过来的了。一天,忽然感觉室内有股臭味,用鼻子的嗅觉功能朝着臭味重的方向寻找,觉得应该就是这台组合音响?怎么会呢?这无机物的东西不会腐臭吧?
    自做自受 2024-12-10 16:34 136浏览
  • 全球知名半导体制造商ROHM Co., Ltd.(以下简称“罗姆”)宣布与Taiwan Semiconductor Manufacturing Company Limited(以下简称“台积公司”)就车载氮化镓功率器件的开发和量产事宜建立战略合作伙伴关系。通过该合作关系,双方将致力于将罗姆的氮化镓器件开发技术与台积公司业界先进的GaN-on-Silicon工艺技术优势结合起来,满足市场对高耐压和高频特性优异的功率元器件日益增长的需求。氮化镓功率器件目前主要被用于AC适配器和服务器电源等消费电子和
    电子资讯报 2024-12-10 17:09 84浏览
  • 天问Block和Mixly是两个不同的编程工具,分别在单片机开发和教育编程领域有各自的应用。以下是对它们的详细比较: 基本定义 天问Block:天问Block是一个基于区块链技术的数字身份验证和数据交换平台。它的目标是为用户提供一个安全、去中心化、可信任的数字身份验证和数据交换解决方案。 Mixly:Mixly是一款由北京师范大学教育学部创客教育实验室开发的图形化编程软件,旨在为初学者提供一个易于学习和使用的Arduino编程环境。 主要功能 天问Block:支持STC全系列8位单片机,32位
    丙丁先生 2024-12-11 13:15 49浏览
  • RK3506 是瑞芯微推出的MPU产品,芯片制程为22nm,定位于轻量级、低成本解决方案。该MPU具有低功耗、外设接口丰富、实时性高的特点,适合用多种工商业场景。本文将基于RK3506的设计特点,为大家分析其应用场景。RK3506核心板主要分为三个型号,各型号间的区别如下图:​图 1  RK3506核心板处理器型号场景1:显示HMIRK3506核心板显示接口支持RGB、MIPI、QSPI输出,且支持2D图形加速,轻松运行QT、LVGL等GUI,最快3S内开
    万象奥科 2024-12-11 15:42 66浏览
  • 智能汽车可替换LED前照灯控制运行的原理涉及多个方面,包括自适应前照灯系统(AFS)的工作原理、传感器的应用、步进电机的控制以及模糊控制策略等。当下时代的智能汽车灯光控制系统通过车载网关控制单元集中控制,表现特殊点的有特斯拉,仅通过前车身控制器,整个系统就包括了灯光旋转开关、车灯变光开关、左LED前照灯总成、右LED前照灯总成、转向柱电子控制单元、CAN数据总线接口、组合仪表控制单元、车载网关控制单元等器件。变光开关、转向开关和辅助操作系统一般连为一体,开关之间通过内部线束和转向柱装置连接为多,
    lauguo2013 2024-12-10 15:53 81浏览
  • 【萤火工场CEM5826-M11测评】OLED显示雷达数据本文结合之前关于串口打印雷达监测数据的研究,进一步扩展至 OLED 屏幕显示。该项目整体分为两部分: 一、框架显示; 二、数据采集与填充显示。为了减小 MCU 负担,采用 局部刷新 的方案。1. 显示框架所需库函数 Wire.h 、Adafruit_GFX.h 、Adafruit_SSD1306.h . 代码#include #include #include #include "logo_128x64.h"#include "logo_
    无垠的广袤 2024-12-10 14:03 69浏览
  • 一、SAE J1939协议概述SAE J1939协议是由美国汽车工程师协会(SAE,Society of Automotive Engineers)定义的一种用于重型车辆和工业设备中的通信协议,主要应用于车辆和设备之间的实时数据交换。J1939基于CAN(Controller Area Network)总线技术,使用29bit的扩展标识符和扩展数据帧,CAN通信速率为250Kbps,用于车载电子控制单元(ECU)之间的通信和控制。小北同学在之前也对J1939协议做过扫盲科普【科普系列】SAE J
    北汇信息 2024-12-11 15:45 74浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦