《C++并发编程实战》读书笔记(3):内存模型和原子操作

C语言与CPP编程 2023-07-06 08:30

击上方“C语言与CPP编程”,选择“关注/置顶/星标公众号

干货福利,第一时间送达!

最近有小伙伴说没有收到当天的文章推送,这是因为微信改了推送机制,有一部分小伙伴刷不到当天的文章,一些比较实用的知识和信息,错过了就是错过了,建议大家加个星标⭐️,就能第一时间收到推送。

小伙伴们大家好,我是飞宇

前段时间润去美国的师兄开了一门C/C++的课程,友情帮忙宣传一下,感兴趣的可以看看。

今天继续更新《Effective C++》和《C++并发编程实战的读书笔记,下面是已经更新过的内容:

《C++并发编程实战》读书笔记(1):并发、线程管控

《C++并发编程实战》读书笔记(2):并发操作的同步

《Effective C++》读书笔记(1):让自己习惯C++

《Effective C++》读书笔记(2):构造/析构/赋值运算

《Effective C++》读书笔记(3):资源管理

第5章 C++内存模型和原子操作

5.1 内存模型基础

    C++标准中对象定义为某一存储范围。每个变量都是对象,每个对象都占用至少一块内存区域,若变量属于内建基本类型则仅占用一块,相邻的位域属于同一块。

    若两个线程访问同一内存区域并且没有强制服从一定的次序,当其中有非原子化访问以及写操作时,就会出现数据竞争,导致未定义行为。此场景下如果全都采用原子操作,虽然不能预防数据竞争,但可避免未定义行为。

    所有线程在某对象上的全部写操作,称为该对象的改动序列。若采用了原子操作,编译器有责任保证有效的同步,禁止某些预测执行,以做到对任一对象,所有线程对其必须形成相同的改动序列。


5.2 C++中的原子操作及其类别

    原子操作是不可分割的操作,或者完全做好或者完全没做。多数情况下需要通过原子类型实现原子操作。

    原子类型的定义位于,有些由原子指令直接实现,有些由锁来实现,无法取代互斥的同步方式从而获得性能提升。可以用成员函数is_lock_free来判断。对于原子类型上的每种操作,都可以提供额外参数,用于设定内存次序语义,具体5.3节。


5.2.1 各类原子类型

    std::atomic_flag是最简单的标准原子类型,保证无锁,表示一个布尔标志,唯一用途是充当构建单元。其对象必须由ATOMIC_FLAG_INIT初始化并置零,只支持clear、test_and_set。

class spinlock_mutex {public:    spinlock_mutex() : flag(ATOMIC_FLAG_INIT) {}    void lock() {        while (flag.test_and_set(std::memory_order_acquire));    }    void unlock() {         flag.clear(std::memory_order_release);     }private:    std::atomic_flag flag;};

    std::atomic是基于整数的最基本的原子类型,相比atomic_flag功能更齐全。它的赋值操作符直接按值而非按引用返回。

std::atomic<bool> b;bool x = b.load(std::memory_order_acquire);b.store(true);x = b.exchange(falsestd::memory_order_acq_rel);

    它还支持“比较-交换”,包括compare_exchange_weak和compare_exchange_strong:给定期望值和原子变量比较,若相等则原子变量保存另一值并返回true,否则更新期望值为原子变量的值并返回false。它接收两个内存次序参数,对应成功与失败。

    atomic<T*>支持上面atomicool>介绍的操作还支持fetch_add/fetch_sub,对存储地址进行原子化的加减,返回旧值,藉此重载了+=、-=、++、--

    整数原子类型支持的操作比上述更加齐全。


5.2.2 非成员函数原子操作

    原子操作不仅包括上述原子类型的成员函数,还包括很多非成员函数,第一个参数都是指向目标的指针。大部分是以成员函数加“atimic_”前缀来命名。

    C++标准库还提供了针对shared_ptr的非成员函数,尽管它不属于原子类型。

std::shared_ptr p;
void process_global_data(){  std::shared_ptr local = std::atomic_load(&p);  process_data(local);}
void update_global_data(){  std::shared_ptr local(new Widget);  std::atomic_store(&p, local);}

5.3 同步操作和强制次序

    内存模型关系有先行与同步。同步关系指对某变量执行原子写和原子读,且两者都有适当的标记。先行关系在单线程中指源代码中操作语句的先后,多线程中先行关系可通过同步关系传递。

    原子类型上的操作服从6种内存次序。宽松次序:memory_order_relaxed,获取-释放次序:memory_order_consume(建议不予采用)、memory_order_acquire、memory_order_release、memory_order_acq_rel,先后一致次序:memory_order_seq_cst。

    先后一致次序是最严格的内存次序,同时也是默认参数。如果程序服从该次序,就简单地把一切事件视为按先后顺序发生,所有线程所见的一切操作都必须服从相同的次序。这样最符合直觉,比较容易理解。但其他次序中,不同线程看到的同一组操作的次序和效果可能呈现差异。

    宽松次序仅要求同一线程内对相同变量的访问次序不能重排。可以将每个原子变量想象为一个记录员,记录着代表改动序列的一系列数据,记录本上每个线程都对应一个指向某一数据的用户标签,标签之间有任何影响。当线程更新数据时记录员记下最新数据并把该线程的标签移到该最新数据下;线程询问记录员数据是多少时,(不论其他线程更新了多少数据、其他标签如何移动)记录员可能将该线程的标签往下移动任意位数据,也可能不移(代表CPU缓存是否同步),然后返回标签指向的数据。

    例如一个线程先写x再写y,另一个线程先写y再写x,却可能出现图中的情况,这是因为x、y的读写在两个线程中,宽松次序对此不作规定,什么顺序都可能发生。

        获取-释放次序比宽松次序严格一些,在成对的读写线程之间起同步作用。载入对应memory_order_acquire,存储对应memory_order_release,读-改-写对应memory_order_rel(根据具体语义也可以使用前面两个次序)。

    可以考虑同一线程上的两个存储操作,下面代码中y读写的同步会强制x上的宽松操作服从一定次序。

std::atomic<bool> x, y;std::atomic<int> z;
void write_x_then_y() { x.store(true, std::memory_order_relaxed); y.store(true, std::memory_order_release);}
void read_y_then_x() { while (!y.load(std::memory_order_acquire)) ; if (x.load(std::memory_order_relaxed)) ++z;}
int main() { x = false; y = false; z = 0; std::thread a(write_x_then_y); std::thread b(read_y_then_x); a.join(); b.join(); assert(z.load() != 0);}

    针对同一个原子变量,如果先存储,再进行多个读-改-写,最后载入,其中所有存储的标记都是memory_order_release/memory_order_acq_rel或memory_order_seq_cst,而载入标记都是memory_order_acquire/memory_order_seq_cst,那么这些操作前后相扣为一个释放序列,最初的存储与最后的载入同步。

    考虑下面的例子,第8行store是最初的存储,第14行fetch_sub是读-改-写,那么一个存储两个读-改-写形成释放序列,即store与第一个fetch_sub、store与第二个fetch_sub都同步,不存在数据竞争。

void populate_queue() {    unsigned const number_of_items = 20;    queue_data.clear();    for (unsigned i = 0; i < number_of_items; ++i) {        queue_data.push_back(i);    }
count.store(number_of_items, std::memory_order_release);}
void consume_queue_items() { while (true) { int item_index; if ((item_index = count.fetch_sub(1, std::memory_order_acquire)) <= 0) { wait_for_more_items(); continue; } process(queue_data[item_index - 1]); }}
int main() { std::thread a(populate_queue); std::thread b(consume_queue_items); std::thread c(consume_queue_items); a.join(); b.join(); c.join();}

    最后,考虑用原子操作令非原子操作服从内存次序。下面的例子中两个内存屏障原子操作atomic_thread_fence之间同步,使得x先存储true再读取,最后的断言不会报错。前文我们介绍的thread/mutex/promise等等工具也都提供了同步关系,不再一一介绍。

bool x = false;std::atomic<bool> y;std::atomic<int> z;
void write_x_then_y() { x = true; std::atomic_thread_fence(std::memory_order_release); y.store(true, std::memory_order_relaxed);}
void read_y_then_x() { while (!y.load(std::memory_order_relaxed)) ; std::atomic_thread_fence(std::memory_order_acquire); if (x) ++z;}
int main() { x = false; y = false; z = 0; std::thread a(write_x_then_y); std::thread b(read_y_then_x); a.join(); b.join(); assert(z.load() != 0);}
EOF

你好,我是飞宇,本硕均于某中流985 CS就读,先后于百度搜索以及字节跳动电商等部门担任Linux C/C++后端研发工程师。

同时,我也是知乎博主@韩飞宇,日常分享C/C++、计算机学习经验、工作体会,欢迎点击此处查看我以前的学习笔记&经验&分享的资源。

我组建了一些社群一起交流,群里有大牛也有小白,如果你有意可以一起进群交流。

欢迎你添加我的微信,我拉你进技术交流群。此外,我也会经常在微信上分享一些计算机学习经验以及工作体验,还有一些内推机会

加个微信,打开另一扇窗

C语言与CPP编程 C语言/C++开发,C语言/C++基础知识,C语言/C++学习路线,C语言/C++进阶,数据结构;算法;python;计算机基础等
评论
  • 电竞鼠标应用环境与客户需求电竞行业近年来发展迅速,「鼠标延迟」已成为决定游戏体验与比赛结果的关键因素。从技术角度来看,传统鼠标的延迟大约为20毫秒,入门级电竞鼠标通常为5毫秒,而高阶电竞鼠标的延迟可降低至仅2毫秒。这些差异看似微小,但在竞技激烈的游戏中,尤其在对反应和速度要求极高的场景中,每一毫秒的优化都可能带来致胜的优势。电竞比赛的普及促使玩家更加渴望降低鼠标延迟以提升竞技表现。他们希望通过精确的测试,了解不同操作系统与设定对延迟的具体影响,并寻求最佳配置方案来获得竞技优势。这样的需求推动市场
    百佳泰测试实验室 2025-01-16 15:45 197浏览
  • 日前,商务部等部门办公厅印发《手机、平板、智能手表(手环)购新补贴实施方案》明确,个人消费者购买手机、平板、智能手表(手环)3类数码产品(单件销售价格不超过6000元),可享受购新补贴。每人每类可补贴1件,每件补贴比例为减去生产、流通环节及移动运营商所有优惠后最终销售价格的15%,每件最高不超过500元。目前,京东已经做好了承接手机、平板等数码产品国补优惠的落地准备工作,未来随着各省市关于手机、平板等品类的国补开启,京东将第一时间率先上线,满足消费者的换新升级需求。为保障国补的真实有效发放,基于
    华尔街科技眼 2025-01-17 10:44 98浏览
  • 80,000人到访的国际大展上,艾迈斯欧司朗有哪些亮点?感未来,光无限。近日,在慕尼黑electronica 2024现场,ams OSRAM通过多款创新DEMO展示,以及数场前瞻洞察分享,全面展示自身融合传感器、发射器及集成电路技术,精准捕捉并呈现环境信息的卓越能力。同时,ams OSRAM通过展会期间与客户、用户等行业人士,以及媒体朋友的深度交流,向业界传达其以光电技术为笔、以创新为墨,书写智能未来的深度思考。electronica 2024electronica 2024构建了一个高度国际
    艾迈斯欧司朗 2025-01-16 20:45 109浏览
  • 随着消费者对汽车驾乘体验的要求不断攀升,汽车照明系统作为确保道路安全、提升驾驶体验以及实现车辆与环境交互的重要组成,日益受到业界的高度重视。近日,2024 DVN(上海)国际汽车照明研讨会圆满落幕。作为照明与传感创新的全球领导者,艾迈斯欧司朗受邀参与主题演讲,并现场展示了其多项前沿技术。本届研讨会汇聚来自全球各地400余名汽车、照明、光源及Tier 2供应商的专业人士及专家共聚一堂。在研讨会第一环节中,艾迈斯欧司朗系统解决方案工程副总裁 Joachim Reill以深厚的专业素养,主持该环节多位
    艾迈斯欧司朗 2025-01-16 20:51 90浏览
  • 全球领先的光学解决方案供应商艾迈斯欧司朗(SIX:AMS)近日宣布,与汽车技术领先者法雷奥合作,采用创新的开放系统协议(OSP)技术,旨在改变汽车内饰照明方式,革新汽车行业座舱照明理念。结合艾迈斯欧司朗开创性的OSIRE® E3731i智能LED和法雷奥的动态环境照明系统,两家公司将为车辆内饰设计和功能设立一套全新标准。汽车内饰照明的作用日益凸显,座舱设计的主流趋势应满足终端用户的需求:即易于使用、个性化,并能提供符合用户生活方式的清晰信息。因此,动态环境照明带来了众多新机遇。智能LED的应用已
    艾迈斯欧司朗 2025-01-15 19:00 74浏览
  • 实用性高值得收藏!! (时源芯微)时源专注于EMC整改与服务,配备完整器件 TVS全称Transient Voltage Suppre,亦称TVS管、瞬态抑制二极管等,有单向和双向之分。单向TVS 一般应用于直流供电电路,双向TVS 应用于电压交变的电路。在直流电路的应用中,TVS被并联接入电路中。在电路处于正常运行状态时,TVS会保持截止状态,从而不对电路的正常工作产生任何影响。然而,一旦电路中出现异常的过电压,并且这个电压达到TVS的击穿阈值时,TVS的状态就会
    时源芯微 2025-01-16 14:23 130浏览
  • 百佳泰特为您整理2025年1月各大Logo的最新规格信息,本月有更新信息的logo有HDMI、Wi-Fi、Bluetooth、DisplayHDR、ClearMR、Intel EVO。HDMI®▶ 2025年1月6日,HDMI Forum, Inc. 宣布即将发布HDMI规范2.2版本。新规范将支持更高的分辨率和刷新率,并提供更多高质量选项。更快的96Gbps 带宽可满足数据密集型沉浸式和虚拟应用对传输的要求,如 AR/VR/MR、空间现实和光场显示,以及各种商业应用,如大型数字标牌、医疗成像和
    百佳泰测试实验室 2025-01-16 15:41 142浏览
  • 晶台光耦KL817和KL3053在小家电产品(如微波炉等)辅助电源中的广泛应用。具备小功率、高性能、高度集成以及低待机功耗的特点,同时支持宽输入电压范围。▲光耦在实物应用中的产品图其一次侧集成了交流电压过零检测与信号输出功能,该功能产生的过零信号可用于精确控制继电器、可控硅等器件的过零开关动作,从而有效减小开关应力,显著提升器件的使用寿命。通过高度的集成化和先进的控制技术,该电源大幅减少了所需的外围器件数量,不仅降低了系统成本和体积,还进一步增强了整体的可靠性。▲电路示意图该电路的过零检测信号由
    晶台光耦 2025-01-16 10:12 89浏览
  • 随着智慧科技的快速发展,智能显示器的生态圈应用变得越来越丰富多元,智能显示器不仅仅是传统的显示设备,透过结合人工智能(AI)和语音助理,它还可以成为家庭、办公室和商业环境中的核心互动接口。提供多元且个性化的服务,如智能家居控制、影音串流拨放、实时信息显示等,极大提升了使用体验。此外,智能家居系统的整合能力也不容小觑,透过智能装置之间的无缝连接,形成了强大的多元应用生态圈。企业也利用智能显示器进行会议展示和多方远程合作,大大提高效率和互动性。Smart Display Ecosystem示意图,作
    百佳泰测试实验室 2025-01-16 15:37 148浏览
  • 一个易用且轻量化的UI可以大大提高用户的使用效率和满意度——通过快速启动、直观操作和及时反馈,帮助用户快速上手并高效完成任务;轻量化设计则可以减少资源占用,提升启动和运行速度,增强产品竞争力。LVGL(Light and Versatile Graphics Library)是一个免费开源的图形库,专为嵌入式系统设计。它以轻量级、高效和易于使用而著称,支持多种屏幕分辨率和硬件配置,并提供了丰富的GUI组件,能够帮助开发者轻松构建出美观且功能强大的用户界面。近期,飞凌嵌入式为基于NXP i.MX9
    飞凌嵌入式 2025-01-16 13:15 158浏览
  • 近期,智能家居领域Matter标准的制定者,全球最具影响力的科技联盟之一,连接标准联盟(Connectivity Standards Alliance,简称CSA)“利好”频出,不仅为智能家居领域的设备制造商们提供了更为快速便捷的Matter认证流程,而且苹果、三星与谷歌等智能家居平台厂商都表示会接纳CSA的Matter认证体系,并计划将其整合至各自的“Works with”项目中。那么,在本轮“利好”背景下,智能家居的设备制造商们该如何捉住机会,“掘金”万亿市场呢?重认证快通道计划,为家居设备
    华普微HOPERF 2025-01-16 10:22 157浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦