许多人都听说过缓存一致性这个术语,但并不完全了解片上系统(SoC)器件,尤其是使用片上网络(NoC)的器件中的注意事项。要了解当前的问题,首先必须了解缓存在内存层次结构中的作用。

许多人都听说过缓存一致性这个术语,但并不完全了解片上系统(SoC)器件,尤其是使用片上网络(NoC)的器件中的注意事项。要了解当前的问题,首先必须了解缓存在内存层次结构中的作用。

内存层次结构中的缓存

CPU内部有相对较少的速度极高的寄存器。CPU可以在一个时钟周期内访问这些寄存器。但是,它们的存储容量很小。相比之下,访问主内存以读取或写入数据需要耗费许多时钟周期。这往往会导致CPU大部分时间处于空闲状态。

1965年,英国计算机科学家莫里斯·威尔克斯(Maurice Wilkes)提出了高速缓存和内存缓存的概念。这包括在CPU附近放置少量称为缓存的快速内存。“缓存”一词本身来自法语单词“cacher”,意为“隐藏”或“隐瞒”,其概念是利用缓存将主内存隐藏在CPU之外。涉及简单缓存的内存层次结构的高级视图如1所示。

图1:显示缓存在内存层次结构中位置的高级视图。(来源:Arteris)

这一过程的运行基于两个关键点。首先,当CPU上运行的程序涉及主内存中的一个位置时,通常会对附近的几个位置执行操作。因此,当CPU请求从主内存中获得单个数据时,系统会从附近的位置引入数据。

这种方法可确保相关数据在需要时随时可用。其次,程序通常会对相同的数据集进行大量操作。因此,将常用数据存储在最靠近CPU的缓存中是有益的。这种接近性允许更快地访问数据和处理数据。

SoC环境中的缓存

在SoC中,缓存是在高速、高功耗、低容量的SRAM中的片上实现的。同时,主存储器是在印刷电路板(PCB)上的片外实现的,通常采用低速、低功耗、高容量DRAM的形式。

为了最大限度地减少延迟,设计人员在当今的许多SoC中添加了多级缓存。这些缓存通常包括两个级别:L1和L2。L1缓存最靠近CPU,容量最小,但访问速度最快,通常在1到2个时钟周期内。L2缓存距离CPU稍远,容量更大,但访问速度较慢,通常在4到10个时钟周期之间。

多级缓存可最大限度地提高性能,同时最大限度地减少对主存储器的片外访问。访问此主存储器可能会消耗数百个时钟周期。通过使用多级缓存,可以更快地从这些缓存而不是较慢的主存储器中检索数据,从而提高整体系统的效率。

当涉及多个CPU内核时,所有这一切的复杂性都会增加。考虑一个常见的场景,集群中有四个CPU内核,标记为内核0到3,每个内核都有自己专用的L1缓存。在某些实施方案中,每个内核还有自己专用的L2缓存。在其他设计中,内核0和1共享一个L2缓存。这些不同的配置会影响数据在不同缓存级别上的存储和访问方式。

通常,单个集群中的所有处理器内核都是同构的,即它们的类型相同。然而,拥有多个处理器内核集群的情况越来越普遍。在许多情况下,不同集群中的内核是异构的,或者说是不同类型的。例如,在Arm的big.LITTLE技术中,“big”内核旨在实现最高性能,但使用频率较低。

“LITTLE”内核则对能效进行了优化,使用频率更高,但性能较低。例如,在基于Arm的智能手机中,“big”内核可能会被激活用于Zoom通话等相对不频繁的任务。相比之下,“LITTLE”内核可以处理更常见、要求不高的任务,如播放音乐和发送短信。

维护缓存一致性

在有多个具有独立缓存的处理单元共享同一主内存的系统中,共享数据可能拥有多个副本。例如,主内存中可能有一个副本,而每个处理器的本地缓存中可能有更多副本。要维护缓存的一致性,就必须在所有副本中都反映出对一份数据副本的所有更改。这可以通过用新数据更新所有副本或标记其他副本无效来实现。

缓存一致性可以在软件控制下维护。但是,软件管理的一致性非常复杂,调试起来也很困难。尽管如此,通过缓存清理等技术仍可实现一致性,即把缓存中存储的修改数据标记为脏数据,这意味着必须将其写回主内存。缓存清理可以在整个缓存或特定地址上执行,但需要耗费大量CPU周期,而且必须在持有数据副本的所有CPU上执行。

维护缓存一致性的首选方法是使用专用硬件,在软件无法察觉的情况下管理缓存。例如,与处理器集群中的内核相关联的缓存,通常包括维护缓存一致性所需的所有硬件。

用还是不用

SoC由大量称为知识产权(IP)块的功能块组成。处理器集群就是这样一个IP块。连接IP块的常见方法是使用NoC。

在许多SoC设计中,处理器集群外部不需要一致性,因此可以使用非一致性或IO一致性的AXI5或AXI5-Lite NoC,例如Arm的NI或Arteris的FlexNoC。但是,对于具有多个处理器集群、缺乏固有缓存一致性的SoC设计,或者在集成需要缓存一致性的第三方IP或自定义加速器IP时,则需要一致性NoC。这方面的例子包括使用AMBA CHI协议的Arm CMN或使用AMBA ACE和/或CHI的Arteris Ncore。

图2:在上述示例中,主系统采用了一致性NoC,而安全岛则采用了非一致性NoC。(来源:Arteris)

在整个芯片上普遍应用缓存一致性会耗费大量资源,而且对于特定组件而言也没有必要。因此,如2所示,将缓存一致性隔离到CPU集群和特定加速器IP等芯片子集,可以更有效地利用资源并降低复杂性。一致性NoC(如Ncore)在需要严格同步的应用场景中表现出色。同时,非一致性互连(如FlexNoC)则在不需要严格同步的情况下非常理想。

设计人员可以从战略上平衡特定领域对数据一致性的需求,同时在不需要严格一致性的情况下从更精简的通信通道中受益。在当今复杂的异构SoC中,一致性和非一致性互连之间的协同作用已成为一种战略优势,可提高系统的整体效率和适应性。

Arteris公司产品管理和营销副总裁Andy Nightingale拥有超过36年的高科技行业经验,其中23年在Arm公司担任各种工程和产品管理职位。

(原文刊登于EE Times姊妹网站EDN,参考链接:SoC design: When a network-on-chip meets cache coherency,由Franklin Zhao编译。)

本文为《电子工程专辑》2024年8月刊杂志文章,版权所有,禁止转载。免费杂志订阅申请点击这里

责编:Franklin
本文为EET电子工程专辑原创文章,禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
阅读全文,请先
您可能感兴趣
如果没有智能化技术,许多行业的转型将难以实现,人工智能(AI)智能技术已成为C端市场、物流、能源等多个行业不可或缺的一部分。在智能数字化转型的浪潮中,AI扮演着至关重要的角色,推动着各行各业的创新与发展。
汪洋特别提到,第十三届芯原CEO论坛五大预测之一是2028年用于端侧微调卡和推理卡的销售额将超过用于云侧的训练卡。目前,推理和端侧微调也是芯原重点关注的领域,同时也希望在这一发展趋势中寻找新的机遇。 
通信技术领域目前处于技术发展迅速、市场广阔且竞争激烈的阶段,这必然导致越来越多的企业或主动或被动地成为专利纠纷的当事方……
尽管思瑞浦在模拟混合信号设计方面拥有丰富经验,其MCU产品在市场上的表现并不理想。究其原因,是因为国内MCU领域竞争已经非常激烈,产品同质化严重,企业之间的竞争主要集中在性价比上,导致利润空间被严重压缩。
随着工艺技术的发展放缓而晶体管数量增加,芯片开发变得越来越困难。Synopsys选择了收购设计分析和仿真巨头Ansys,此后,拥有管理和优化 EDA 计算环境所需所有工具的Altair,成为了最后一个可以挑战 Ansys 而不受约束的玩家。如今,花落西门子……
具体来说,对于涉及某些先进集成电路设计或制造、超级计算机、量子计算机及其关键部件、以及特定用途的AI系统的交易,美国将采取禁止或要求通报的措施。
为了更直观地了解FinFET到GAAFET架构世代的差异,本文利用高倍率的电子显微镜影像进行深入的探讨与分析,观察其于结构微观层面上的特征...
汽车技术领域正处于关键的转折点,其未来依托于动态且适应性强的系统,并可通过软件不断提升驾驶体验。
连接标准联盟很高兴宣布 Matter 1.4 现已正式发布,可供设备制造商和生态平台开发应用。这次更新是Matter生态系统迈出的重要一步。Matter 1.4带来了一系列增强功能......
根植雄厚研发实力及物联网领域的深耕实践,汇顶科技面向新兴车载互联应用全力进击。旗下首款高可靠性、高性能车规级低功耗蓝牙SoC——GR5405,已成功通过AEC-Q100 Grade 2认证。
据36氪报道,保时捷负责采购的执行董事傅伦轲(Barbara Frenkel)向其透露,“我正在与电池、ADAS、互联、娱乐系统等方向的中国供应商接触,希望建立新的合作。”今年前三季度,保时捷在中国市
近几年,越来越多的中国电子零部件企业将目光投向海外市场,寻求“出海”机会。有一家坐落于深圳龙岗坂田的企业,在高端豪华车、工业控制上的产品成功获得了行业标杆客户的订单,出口额更是突破百万美元,成为“出海
新原型的耐用性增强意味着它可以重复拉伸超过10000次。美通社消息,全球领先的显示技术创新者LG Display宣布,推出了全球首款可拉伸显示器,其伸长率可达50%,是业内最高的伸长率。可拉伸显示器被
由前苹果和英特尔等资深人士共同创立的硅谷人工智能芯片初创公司Tenstorrent,近日宣布与日本政府达成一项重要协议。根据协议,Tenstorrent将在未来五年内,于其美国办公室为日本培训多达20
大联大控股宣布,其旗下诠鼎推出基于高通(Qualcomm)IPQ5322、QCN6422、QCN6432和QCA8386芯片的Wi-Fi 7家庭网关方案。   &nb
 会 议 预 告  活动倒计时 8 天11月20-21日 | 行家说新型显示全产业链年会近期,点莘技术、秋水半导体、纳视智能、睿励科学仪器等4家Micro LED相关企业相继完成新一轮融资,单笔金额最
11月12日,百度创始人李彦宏在百度世界2024大会上表示,智能体是AI应用最主流的形态,即将迎来爆发点,这里是李彦宏演讲完整视频。●付费专栏文章小白自媒体赚钱,年入十万不是梦:专栏介绍 丨小白自媒体
ABOUT US研鼎公司总部位于上海浦东张江高科技园区,在深圳、北京和韩国设立研发和运营。是影像测试设备与解决方案领军企业,致力于视觉测试设备和分析软件产品的研发,可为客户提供优质的影像实验室Turn
艾迈斯欧司朗今日宣布,推出新一代高性能LED——OSCONIQ® C 3030。这款尖端LED系列专为严苛的户外及体育场照明环境而设计,兼具出色的发光强度与卓越的散热效能。其支持高达
EETOP讯,据中国台湾《经济日报》报道,美国出口管制措施进一步升级,不仅传闻台积电将因遵循规定而停止向中国大陆的非消费类AI芯片客户提供7纳米制程产品,三星也同样受到限制,无法承接相关订单。(参考阅