SoC设计：当片上网络遇到缓存一致性时-电子工程专辑



 0

 收藏

 分享

扫码分享到微信好友

 扫一扫

扫码查看更多文章

许多人都听说过缓存一致性这个术语，但并不完全了解片上系统(SoC)器件，尤其是使用片上网络(NoC)的器件中的注意事项。要了解当前的问题，首先必须了解缓存在内存层次结构中的作用。

内存层次结构中的缓存

CPU内部有相对较少的速度极高的寄存器。CPU可以在一个时钟周期内访问这些寄存器。但是，它们的存储容量很小。相比之下，访问主内存以读取或写入数据需要耗费许多时钟周期。这往往会导致CPU大部分时间处于空闲状态。

1965年，英国计算机科学家莫里斯·威尔克斯(Maurice Wilkes)提出了高速缓存和内存缓存的概念。这包括在CPU附近放置少量称为缓存的快速内存。“缓存”一词本身来自法语单词“cacher”，意为“隐藏”或“隐瞒”，其概念是利用缓存将主内存隐藏在CPU之外。涉及简单缓存的内存层次结构的高级视图如图1所示。

图1：显示缓存在内存层次结构中位置的高级视图。(来源：Arteris)

这一过程的运行基于两个关键点。首先，当CPU上运行的程序涉及主内存中的一个位置时，通常会对附近的几个位置执行操作。因此，当CPU请求从主内存中获得单个数据时，系统会从附近的位置引入数据。

这种方法可确保相关数据在需要时随时可用。其次，程序通常会对相同的数据集进行大量操作。因此，将常用数据存储在最靠近CPU的缓存中是有益的。这种接近性允许更快地访问数据和处理数据。

SoC环境中的缓存

在SoC中，缓存是在高速、高功耗、低容量的SRAM中的片上实现的。同时，主存储器是在印刷电路板(PCB)上的片外实现的，通常采用低速、低功耗、高容量DRAM的形式。

为了最大限度地减少延迟，设计人员在当今的许多SoC中添加了多级缓存。这些缓存通常包括两个级别：L1和L2。L1缓存最靠近CPU，容量最小，但访问速度最快，通常在1到2个时钟周期内。L2缓存距离CPU稍远，容量更大，但访问速度较慢，通常在4到10个时钟周期之间。

多级缓存可最大限度地提高性能，同时最大限度地减少对主存储器的片外访问。访问此主存储器可能会消耗数百个时钟周期。通过使用多级缓存，可以更快地从这些缓存而不是较慢的主存储器中检索数据，从而提高整体系统的效率。

当涉及多个CPU内核时，所有这一切的复杂性都会增加。考虑一个常见的场景，集群中有四个CPU内核，标记为内核0到3，每个内核都有自己专用的L1缓存。在某些实施方案中，每个内核还有自己专用的L2缓存。在其他设计中，内核0和1共享一个L2缓存。这些不同的配置会影响数据在不同缓存级别上的存储和访问方式。

通常，单个集群中的所有处理器内核都是同构的，即它们的类型相同。然而，拥有多个处理器内核集群的情况越来越普遍。在许多情况下，不同集群中的内核是异构的，或者说是不同类型的。例如，在Arm的big.LITTLE技术中，“big”内核旨在实现最高性能，但使用频率较低。

“LITTLE”内核则对能效进行了优化，使用频率更高，但性能较低。例如，在基于Arm的智能手机中，“big”内核可能会被激活用于Zoom通话等相对不频繁的任务。相比之下，“LITTLE”内核可以处理更常见、要求不高的任务，如播放音乐和发送短信。

维护缓存一致性

在有多个具有独立缓存的处理单元共享同一主内存的系统中，共享数据可能拥有多个副本。例如，主内存中可能有一个副本，而每个处理器的本地缓存中可能有更多副本。要维护缓存的一致性，就必须在所有副本中都反映出对一份数据副本的所有更改。这可以通过用新数据更新所有副本或标记其他副本无效来实现。

缓存一致性可以在软件控制下维护。但是，软件管理的一致性非常复杂，调试起来也很困难。尽管如此，通过缓存清理等技术仍可实现一致性，即把缓存中存储的修改数据标记为脏数据，这意味着必须将其写回主内存。缓存清理可以在整个缓存或特定地址上执行，但需要耗费大量CPU周期，而且必须在持有数据副本的所有CPU上执行。

维护缓存一致性的首选方法是使用专用硬件，在软件无法察觉的情况下管理缓存。例如，与处理器集群中的内核相关联的缓存，通常包括维护缓存一致性所需的所有硬件。

用还是不用

SoC由大量称为知识产权(IP)块的功能块组成。处理器集群就是这样一个IP块。连接IP块的常见方法是使用NoC。

在许多SoC设计中，处理器集群外部不需要一致性，因此可以使用非一致性或IO一致性的AXI5或AXI5-Lite NoC，例如Arm的NI或Arteris的FlexNoC。但是，对于具有多个处理器集群、缺乏固有缓存一致性的SoC设计，或者在集成需要缓存一致性的第三方IP或自定义加速器IP时，则需要一致性NoC。这方面的例子包括使用AMBA CHI协议的Arm CMN或使用AMBA ACE和/或CHI的Arteris Ncore。

图2：在上述示例中，主系统采用了一致性NoC，而安全岛则采用了非一致性NoC。(来源：Arteris)

在整个芯片上普遍应用缓存一致性会耗费大量资源，而且对于特定组件而言也没有必要。因此，如图2所示，将缓存一致性隔离到CPU集群和特定加速器IP等芯片子集，可以更有效地利用资源并降低复杂性。一致性NoC(如Ncore)在需要严格同步的应用场景中表现出色。同时，非一致性互连(如FlexNoC)则在不需要严格同步的情况下非常理想。

设计人员可以从战略上平衡特定领域对数据一致性的需求，同时在不需要严格一致性的情况下从更精简的通信通道中受益。在当今复杂的异构SoC中，一致性和非一致性互连之间的协同作用已成为一种战略优势，可提高系统的整体效率和适应性。

Arteris公司产品管理和营销副总裁Andy Nightingale拥有超过36年的高科技行业经验，其中23年在Arm公司担任各种工程和产品管理职位。

（原文刊登于EE Times姊妹网站EDN，参考链接：SoC design: When a network-on-chip meets cache coherency，由Franklin Zhao编译。）

责编：Franklin

本文为EET电子工程专辑原创文章，禁止转载。请尊重知识产权，违者本司保留追究责任的权利。

阅读全文，请先

EDA/IP/IC设计技术文章

您可能感兴趣

【ICCAD2024】AI时代，先进数字芯片设计下的国产EDA新路径

面对AI时代带来的差异化趋势、软件应用及开发时间长、软硬件协同难、高复杂度高成本等挑战，国产EDA仍需不断探索和创新。

【ICCAD2024】EDA新势力：芯行纪以AI重塑数字实现新未来

通过机器学习技术，EDA工具可以获取更精确的模型来预测设计中存在的问题，如布线拥塞、信号干扰、热效应等，从而为用户提供更准确快速的指导，避免后期返工。

功能安全重要性日益凸显，中国也有了自己的FuSa小组

该小组汇集了国内外领先的芯片及IP、嵌入式开发工具、操作系统等厂商，形成强有力的组织，使命是通过一站式功能安全认证服务，帮助企业提升认证价值，满足IEC 61508、ISO 26262等国际功能安全认证标准，从而更高效地达成功能安全要求。

魏少军ICCAD2024演讲：中国芯片设计业要自强不息

在ICCAD 2024主峰会上，中国半导体行业协会集成电路设计分会理事长魏少军教授带来“中国芯片设计业要自强不息”主题报告演讲，深入解读了过去一年中国IC设计业的发展机遇与挑战，权威分析中国IC设计业各环节的主要数据及其背后的意义。

华为Mate 70系列实现芯片100%国产化

近日，华为终端BG CEO何刚在和紫牛基金创始合伙人张泉灵的对话中表示，华为Mate 70系列每一颗芯片都有国产的能力。此外，日前在深圳宝安中学的一场讲座中，华为终端BG 董事长余承东也自豪地宣布Mate70实现了芯片的100%国产化。

英特尔开始从外部寻找新CEO：陈立武等在候选名单上

常情况下，英特尔的CEO在65岁时退休，而现年63岁的基辛格突然被退休，让市场感到意外。为了确保平稳过渡，英特尔董事会立即着手寻找新的CEO人选……

“一碰交互，共触未来”ITMA峰会盛大开启近场交互新生态

目前，智能终端NFC功能的使用频率越来越高，面对新场景新需求，ITMA多家成员单位一起联合推动iTAP（智能无感接近式协议）标准化项目，预计25年上半年发布1.0标准，通过功能测试、兼容性测试，确保新技术产业应用。

中科院微电子所在忆阻神经-模糊硬件及应用探索方面取得新进展

中科院微电子所集成电路制造技术重点实验室刘明院士团队提出了一种基于记忆交叉阵列的符号知识表示解决方案，首次实验演示并验证了忆阻神经-模糊硬件系统在无监督、有监督和迁移学习任务中的应用……

直角照明轻触开关为复杂电子应用提供定制性和多功能性

C&K Switches EITS系列直角照明轻触开关提供表面贴装 PIP 端子和标准通孔配置，为电信、数据中心和专业音频/视频设备等广泛应用提供创新的多功能解决方案。

投身国产浪潮向上而行，英韧科技再获“中国芯”认可

项目动态|长飞先进武汉基地首批设备搬入

今日，长飞先进武汉基地建设再次迎来新进展——项目首批设备搬入仪式于光谷科学岛成功举办，长飞先进总裁陈重国及公司主要领导、嘉宾共同出席见证。对于半导体行业而言，厂房建设一般主要分为四个阶段：设备选型、设

被神秘的FS7“附体”，解读两大最新功率模块系列的“超能力”

点击蓝字关注我们安森美（onsemi）在2024年先后推出两款超强功率半导体模块新贵，IGBT模块系列——SPM31 IPM，QDual 3。值得注意的是，背后都提到采用了最新的FS7技术，主要性能

投资20亿！路芯半导体掩膜版生产项目首批工艺设备机台入厂

来源：苏州工业园区12月17日，江苏路芯半导体技术有限公司掩膜版生产项目迎来重要进展——首批工艺设备机台成功搬入。路芯半导体自2023年成立以来，专注于半导体掩膜版的研发与生产，掌握130nm至28n

18亿元！2大储能项目新动态

近期，多个储能电站项目上新。■ 乐山电力：募资2亿建200MWh储能电站12月17日晚，乐山电力（600644.SH）公告，以简易程序向特定对象发行A股股票申请已获上交所受理，募集资金总额为2亿元。发

雷曼光电与辰显光电签约，推进MicroLED商业化

‍‍12月18日，深圳雷曼光电科技股份有限公司（下称“雷曼光电”）与成都辰显光电有限公司（下称“辰显光电”）在成都正式签署战略合作协议。双方将充分发挥各自在技术创新、产品研发等方面的优势，共同推进Mi

京东方晶芯MLED项目，已完成设备搬入

12月18日，珠海京东方晶芯科技举行设备搬入仪式。插播：加入LED显示行业群，请加VX：hangjia188在10月31日，珠海京东方晶芯科技有限公司发布了Mini/Micro LED COB显示产品

柔宇显示资产降价拍卖

阿里资产显示，随着深圳柔宇显示技术有限公司（下称：“柔宇显示”）旗下资产一拍以流拍告终，二拍将于12月24日开拍，起拍价为9.8亿元。拍卖标的包括位于深圳市龙岗区的12套不动产和一批设备类资产，其中不

注意些问题，嵌入式软件代码可大幅度减少bug

扫描关注一起学嵌入式，一起学习，一起成长在嵌入式开发软件中查找和消除潜在的错误是一项艰巨的任务。通常需要英勇的努力和昂贵的工具才能从观察到的崩溃，死机或其他计划外的运行时行为追溯到根本原因。在最坏的情

高科视像、新视通等持续扩大COB产能

近期，高科视像、新视通、江苏善行智能科技等企业持续扩充COB产能。插播：加入LED显示行业群，请加VX：hangjia188■ 高科视像：MLED新型显示面板生产项目（二期）招标12月18日，山西高科

面板大厂引入AI，每年节省10亿！

LG Display 12月18日表示，为加强OLED制造竞争力，自主开发并引进了“AI（人工智能）生产体系”。“AI生产体系”是AI实时收集并分析OLED工艺制造数据的系统。LG Display表

文章评论

最新
热门

换一换

EE直播

更多>

SoC设计：当片上网络遇到缓存一致性时

内存层次结构中的缓存

SoC环境中的缓存

维护缓存一致性

用还是不用

杂志声明