CXL蓬勃发展

TechSugar 2024-09-20 08:03

(本文编译自Semiconductor Engineering)


CXL已经从众多互连标准中脱颖而出,成为将内存连接到各种处理单元以及在数据中心内共享内存资源的一种可预测方式。


Compute Express Link(CXL)建立于PCIe基础上,目前几乎所有主要芯片公司都支持该技术。它通过串行通信连接CPU、GPU、FPGA 和其他专用加速器,同时它还允许跨设备池化内存,以提高资源利用率和高效利用率。


尽管CXL经常会被拿来与英伟达的NVLink进行比较,但它们的发展道路却不尽相同。“几年前,我们都认为许多加速器都会使用CXL作为一种廉价的、简单的方式来访问主机内存,”新思科技解决方案事业部PCIe控制器IP高级技术产品经理Richard Solomon表示,“但我们没有看到太多这样的情况。人们的兴趣不如我们的预期。我们只是看到,人们对CXL作为连接内存技术的兴趣非常浓厚。”


事实上,CXL从未打算覆盖所有应用。Rambus高级产品营销经理Zaman Mollah表示:“CXL早期主要用于内存扩展,增加容量和带宽、内存重用和智能内存分层应用。这些解决方案很容易使用现有的即插即用PCIe物理接口集成。CXL将与其他类似的互连技术共存,它拥有其独特的应用场景。CXL可能无法为以GPU为中心的AI应用提供所需的带宽,但它在加速器和基于CPU的AI用例中很有用。它允许可组合的数据中心架构,并提供一种灵活且经济高效的方式来增加内存容量和带宽,同时具有可接受的延迟性。”


此外,西门子数字工业软件VIP产品线高级总监Christopher Browy表示,CXL可能会被用于主机和相干加速器之间的内存池化和共享,并通过UALink和UltraEthernet结构进行远程横向扩展。“支持CXL和UALink的交换机很可能会面世。CXL还将考虑先进的多级内存、存储级内存和缓存解决方案以及优化计算存储。现在的CXL比几年前更适用于现实应用,它将在未来最新的新兴AI和HPC连接标准中占有一席之地。CXL是最好的选择,因为它以独特的方式实现了基于内存和缓存的扩展。虽然UCIe将根据多芯片设计重新定义芯片和IP市场,但CXL是它们如何在模块和机架级别协同工作的关键。”


CXL3.1规范增加了功能,包括增强的安全性


CXL标准最初于2019年3月发布,在过去几年中经历了多次修订。CXL3.0于2022年发布,最新的CXL3.1规范于2023年11月发布。3.0版中添加了许多新功能,3.1版中则添加了一些ECN(工程变更通知),以增强新功能的功能性,以实现结构功能。


CXL有三个子协议:CXL.io、CXL.cache和CXL.memory。其中,CXL.memory引起了设计人员的极大兴趣,因为他们意识到它能为数据中心和高级AI拓扑结构实现内存扩展。内存的构建依赖于来自英特尔、AMD和基于Arm的超大规模计算平台的基于CXL2.0的处理器。


据CXL联盟称,3.1规范“改进了结构可管理性,使CXL超越了机架并实现分离内存系统。CXL3.1规范以之前的迭代为基础,优化资源利用率,根据需要创建可信计算环境,扩展内存共享和池化以避免内存滞留,并促进加速器之间的内存共享。”


CXL3.1还包含其他功能,可进一步减少CXL结构中连接的端点和主机的延迟,以及新的安全协议。Rambus硅IP产品营销高级总监Lou Ternullo表示:“这些功能包括CXL.io对等(P2P)、无序I/O(UIO)、CXL.mem P2P,以及添加可信执行环境(TEE)操作代码以扩展PCIe传输层的完整性和数据加密(IDE)支持,通过路径中的交换机和重定时器在主机和端点之间提供受保护的路径。P2P允许PCIe/CXL设备直接访问flex总线上其他PCIe/CXL设备中的内存,而无需主机处理器。UIO允许事务通过传输层,而无需管理排序规则。”


图1:TSP增强了安全性。

图源:CXL联盟


CXL3.1最大的变化是交换结构功能的改进。“现在它可以处理基于端口的路由,从而实现横向扩展部署。交换结构不受传统基于树的层次结构的约束,”Ternullo表示,“它允许主机和设备进行跨域访问,其中一台设备最多可以访问4,096台主机或其他设备。因此,设计人员可以实现大型系统或拓扑以及任意对任意通信。”


图2:CXL版本3.0和3.1扩展了协议的功能。

图源:CXL联盟


CXL3.1规范还进行了其他改进。“例如,使用全局集成内存(GIM)概念进行结构连接内存访问的主机间通信,”Rambus的Mollah说道,“CXL3.1还引入了可信安全协议以增强安全性。借助横向扩展部署功能,许多虚拟机将通过结构连接,因此安全性是一个非常重要的因素,需要加以考虑。CXL3.1中的扩展元数据功能(最多34位元数据)允许监控更多诊断数据和信息。所有这些都是横向扩展大型拓扑部署的重大突破。”


图3:新型全局集成内存(GIM)。

图源:CXL联盟


CXL联盟营销工作组联合主席、英特尔至强产品规划与营销部高级营销经理Anil Godbole解释说,按照最初的设想,CXL主要针对异构计算。CXL主要由英特尔开发。


Godbole表示:“CXL与PCIe的主要区别是一致性,因为CXL与PCIe在相同的I/O上运行。两种协议的基本PHY是相同的。但在连接时,CXL设备将作为CXL进行连接,主机将通过CXL与其通信,而PCIe设备(如果放在主板上的同一插槽中)将作为PCIe出现。当进行连接时,设备会说,‘我必须从这里使用CXL。’PCIe永远无法提供一致的内存。因此,展望未来,增加内存占用是CXL的最大用例。”


另一方面,他表示,“如果你不需要一致性,那么最好不要额外购买协议,你可以简单地将数据从一个点传递到另一个点。”


针对CXL无法与GPU配合使用的反对意见,Godbole指出,GPU需要CPU。“我们必须了解GPU是如何获得其工作负载的。最终,总是CPU开始执行神经网络工作负载。GPU没有自己的大脑,它只是一个由CPU提供数据的庞大矩阵乘法器。之前,总有人问我们能做些什么来从CPU中获取更多带宽?这是我们将在下一个规范中需要通过聚合CXL链路解决的问题。”


Cadence高级产品营销部总监Arif Khan表示,CXL如何处理内存池也受到了质疑。“从规范发布到支持1.1标准的初始OEM平台,该规范已经取得了长足的进步。尽管如此,实施者仍然对它产生了浓厚的兴趣,因为他们希望构建内存扩展器和池化设备。Levis等人在ACM论文中对内存池提出了批评,主要集中在成本、软件复杂性和实用性上。可供比较的公开数据集有限,这使得这篇文章读起来很有意思。然而,市场仍然对这个标准有需求,因为实施者正在围绕它构建解决方案。”


即使数据稀缺,内存池的经济性似乎也特别有吸引力。“未来,CXL将继续用于容量和带宽扩展,以及通过压缩内存进行内存分层,”Mollah表示,“随着每字节成本的降低,内存池用例等高级应用程序将变得更具吸引力,并允许以更低的TCO实现分散的数据中心基础设施。”


但CXL并不是唯一的选择。“随着针对特定用例的替代标准的兴起,该标准最近受到了一些质疑,”Khan表示,“自该规范首次公开发布以来的五年中,我们看到了人工智能加速器领域经历了指数级的增长。由于LLM用例在炒作周期中占据主导地位,系统正在针对这些应用进行优化。CXL一致性模型正受到目前正在构思的其他扩展标准的挑战。GPU制造商使用的专有标准已经就绪,并为这些特定应用设定了基准。无论如何,标准领域仍处于萌芽状态,市场需要一些时间来确定哪些标准最适合哪些细分市场。通常,商业动态会发挥巨大作用。”


Solomon表示,最好将CXL视为选择之一,就像内存多种产品种类来满足特定需求一样。“显然,有些应用不需要追求最快速度,尤其是考虑到其与价格和容量之间的权衡。如果回顾过去30多年来的每一种现代计算机架构,就会发现即使在缓存中也存在层次结构,因此显然存在非最快速度的内存用途,”他表示,“如果你追求极致速度,CXL可能不够快。但如果你正在构建一款快速、经济的设备,那么CXL可能是你的最佳选择。没有一种技术可以适用于所有领域。关键在于平衡。”


西门子的Browy对此表示同意。“由于CXL基于PCIe SerDes,因此具有更低的错误率、更低的延迟和相应的更低的带宽。NVLink和UALink使用以太网式SerDes会导致高错误率、高延迟和高带宽,因此在最高性能带宽受限的情况(如GPU到GPU)下,它们具有优势。在模块越来越多地基于UCIe连接的芯粒,作为通用和专用计算的基本构建块的世界中,CXL的真正优势在于需要一种强大的、低延迟方法来提供基于智能缓存的层次结构,包括现在的本地主内存、存储类内存以及不断发展的池化/共享和计算存储解决方案。这对于数据库、计算存储、通用计算、科学计算和作为GPU的人工智能(可以视为统一的智能内存)至关重要。”


图4:CXL用例和验证解决方案。

图源:西门子EDA


未来展望


Ternullo相信CXL的作用将越来越大,他预计它将继续用于内存扩展。“此外,它将进一步实现异构计算和数据中心分解,帮助最大限度地减少服务器过度配置,并实现对内存、存储、加速等的按需访问。”


展望未来,据Yole Research预测,鉴于CXL在内存利用率、管理和分解以及可组合性访问方面的潜力,到2028年其市场规模将达到160亿美元。


CXL联盟的Godbole表示,这仅仅是个开始。“去年我们在进行测试,因为这是第一次可以添加内存并将其连接到服务器。我们只有有限的SKU支持CXL,这限制了其市场应用。随着我们推出CXL,每个CPU都将具有CXL功能,因此现在它正在成为主流。”


END

TechSugar 做你身边值得信赖的科技新媒体
评论
  • 随着全球向绿色能源转型的加速,对高效、可靠和环保元件的需求从未如此强烈。在这种背景下,国产固态继电器(SSR)在实现太阳能逆变器、风力涡轮机和储能系统等关键技术方面发挥着关键作用。本文探讨了绿色能源系统背景下中国固态继电器行业的前景,并强调了2025年的前景。 1.对绿色能源解决方案日益增长的需求绿色能源系统依靠先进的电源管理技术来最大限度地提高效率并最大限度地减少损失。固态继电器以其耐用性、快速开关速度和抗机械磨损而闻名,正日益成为传统机电继电器的首选。可再生能源(尤其是太阳能和风能
    克里雅半导体科技 2025-01-10 16:18 319浏览
  • 01. 什么是过程能力分析?过程能力研究利用生产过程中初始一批产品的数据,预测制造过程是否能够稳定地生产符合规格的产品。可以把它想象成一种预测。通过历史数据的分析,推断未来是否可以依赖该工艺持续生产高质量产品。客户可能会要求将过程能力研究作为生产件批准程序 (PPAP) 的一部分。这是为了确保制造过程能够持续稳定地生产合格的产品。02. 基本概念在定义制造过程时,目标是确保生产的零件符合上下规格限 (USL 和 LSL)。过程能力衡量制造过程能多大程度上稳定地生产符合规格的产品。核心概念很简单:
    优思学院 2025-01-12 15:43 491浏览
  •   在信号处理过程中,由于信号的时域截断会导致频谱扩展泄露现象。那么导致频谱泄露发生的根本原因是什么?又该采取什么样的改善方法。本文以ADC性能指标的测试场景为例,探讨了对ADC的输出结果进行非周期截断所带来的影响及问题总结。 两个点   为了更好的分析或处理信号,实际应用时需要从频域而非时域的角度观察原信号。但物理意义上只能直接获取信号的时域信息,为了得到信号的频域信息需要利用傅里叶变换这个工具计算出原信号的频谱函数。但对于计算机来说实现这种计算需要面对两个问题: 1.
    TIAN301 2025-01-14 14:15 89浏览
  • 随着数字化的不断推进,LED显示屏行业对4K、8K等超高清画质的需求日益提升。与此同时,Mini及Micro LED技术的日益成熟,推动了间距小于1.2 Pitch的Mini、Micro LED显示屏的快速发展。这类显示屏不仅画质卓越,而且尺寸适中,通常在110至1000英寸之间,非常适合应用于电影院、监控中心、大型会议、以及电影拍摄等多种室内场景。鉴于室内LED显示屏与用户距离较近,因此对于噪音控制、体积小型化、冗余备份能力及电气安全性的要求尤为严格。为满足这一市场需求,开关电源技术推出了专为
    晶台光耦 2025-01-13 10:42 481浏览
  • 新年伊始,又到了对去年做总结,对今年做展望的时刻 不知道你在2024年初立的Flag都实现了吗? 2025年对自己又有什么新的期待呢? 2024年注定是不平凡的一年, 一年里我测评了50余块开发板, 写出了很多科普文章, 从一个小小的工作室成长为科工公司。 展望2025年, 中国香河英茂科工, 会继续深耕于,具身机器人、飞行器、物联网等方面的研发, 我觉得,要向未来学习未来, 未来是什么? 是掌握在孩子们生活中的发现,和精历, 把最好的技术带给孩子,
    丙丁先生 2025-01-11 11:35 442浏览
  • 流量传感器是实现对燃气、废气、生活用水、污水、冷却液、石油等各种流体流量精准计量的关键手段。但随着工业自动化、数字化、智能化与低碳化进程的不断加速,采用传统机械式检测方式的流量传感器已不能满足当代流体计量行业对于测量精度、测量范围、使用寿命与维护成本等方面的精细需求。流量传感器的应用场景(部分)超声波流量传感器,是一种利用超声波技术测量流体流量的新型传感器,其主要通过发射超声波信号并接收反射回来的信号,根据超声波在流体中传播的时间、幅度或相位变化等参数,间接计算流体的流量,具有非侵入式测量、高精
    华普微HOPERF 2025-01-13 14:18 459浏览
  • 随着通信技术的迅速发展,现代通信设备需要更高效、可靠且紧凑的解决方案来应对日益复杂的系统。中国自主研发和制造的国产接口芯片,正逐渐成为通信设备(从5G基站到工业通信模块)中的重要基石。这些芯片凭借卓越性能、成本效益及灵活性,满足了现代通信基础设施的多样化需求。 1. 接口芯片在通信设备中的关键作用接口芯片作为数据交互的桥梁,是通信设备中不可或缺的核心组件。它们在设备内的各种子系统之间实现无缝数据传输,支持高速数据交换、协议转换和信号调节等功能。无论是5G基站中的数据处理,还是物联网网关
    克里雅半导体科技 2025-01-10 16:20 433浏览
  • PNT、GNSS、GPS均是卫星定位和导航相关领域中的常见缩写词,他们经常会被用到,且在很多情况下会被等同使用或替换使用。我们会把定位导航功能测试叫做PNT性能测试,也会叫做GNSS性能测试。我们会把定位导航终端叫做GNSS模块,也会叫做GPS模块。但是实际上他们之间是有一些重要的区别。伴随着技术发展与越发深入,我们有必要对这三个词汇做以清晰的区分。一、什么是GPS?GPS是Global Positioning System(全球定位系统)的缩写,它是美国建立的全球卫星定位导航系统,是GNSS概
    德思特测试测量 2025-01-13 15:42 460浏览
  • ARMv8-A是ARM公司为满足新需求而重新设计的一个架构,是近20年来ARM架构变动最大的一次。以下是对ARMv8-A的详细介绍: 1. 背景介绍    ARM公司最初并未涉足PC市场,其产品主要针对功耗敏感的移动设备。     随着技术的发展和市场需求的变化,ARM开始扩展到企业设备、服务器等领域,这要求其架构能够支持更大的内存和更复杂的计算任务。 2. 架构特点    ARMv8-A引入了Execution State(执行状
    丙丁先生 2025-01-12 10:30 448浏览
  • 根据Global Info Research(环洋市场咨询)项目团队最新调研,预计2030年全球无人机电池和电源产值达到2834百万美元,2024-2030年期间年复合增长率CAGR为10.1%。 无人机电池是为无人机提供动力并使其飞行的关键。无人机使用的电池类型因无人机的大小和型号而异。一些常见的无人机电池类型包括锂聚合物(LiPo)电池、锂离子电池和镍氢(NiMH)电池。锂聚合物电池是最常用的无人机电池类型,因为其能量密度高、设计轻巧。这些电池以输出功率大、飞行时间长而著称。不过,它们需要
    GIRtina 2025-01-13 10:49 164浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦