CXL的内存缓存一致性不但允许CPU和加速器共享内存资源,还能实现部署新的内存层,帮助弥合主内存和固态硬盘存储之间的延迟差距。这些新内存层会增加带宽的容量,提供更高效率,并降低总拥有成本。这就是业界正在坚定地将CXL作为处理器、内存和加速器的高速缓存一致性互连技术的根本原因所在。

人工智能和机器学习应用的日益普及,引发了数据以指数级的态势持续增长。预计到2025年,全球每年的数据量将达到175ZB的规模。而作为全球最大数据生产国之一,中国的数据规模将有望从2022年的23.88ZB增长至2027年的76.6ZB,复合年增长率达到26.3%。

显然,包括中国在内,全球对更高性能数据中心的需求十分迫切。一是因为这种对内存带宽和容量无休止的需求给数据中心的内存系统带来了挑战,使其已成为一个关键瓶颈;二是当前的数据中心架构,正在从以服务器为计算单元向分解型架构转变。也就是说,要改变资源的池化方式,将其转化为分离式的解决方案。这样,通过完全分解,计算资源可以按需组合,满足不同工作负载的需求。

利用CXL技术重构数据中心

Rambus产品营销高级经理Zaman Mollah认为数据中心对于更高性能和更低总体拥有成本的追求正在面临三项内存挑战:首先是当前服务器内存层次结构的局限性。直连式DRAM和固态硬盘存储(SSD)之间存在三个数量级的延迟差距,当处理器耗尽直连式内存的容量时,就必须转而使用固态硬盘,这就会导致处理器需要等待。这种等待或延迟会对计算产生极大的负面影响。

其次,多核处理器内核数量的增长速度远远超过主内存通道的增长速度。这意味着一旦处理器内核超过一定数量,就会因为内存带宽不足而空置,从而无法最大化利用额外内核的优势。最后,随着加速计算的不断发展,加速器配备有自己的直连内存,内存资源利用不足或空置的问题日益严重。

Rambus产品营销高级经理Zaman Mollah

于是,为了解决传统内存架构的上述局限性,业界一直在探索新的内存接口技术和系统架构。为了持续提升性能,并满足不断演进的多样化数据中心工作负载需求,人们希望根据需要组合服务器基础架构,并根据工作负载需求进行调整。这使得技术逐渐转向异构计算架构,即利用专用加速器为CPU分担特定工作负载。

而Compute Express Link(CXL)的内存缓存一致性允许CPU和加速器共享内存资源。此外,CXL还能实现部署新的内存层,帮助弥合主内存和固态硬盘存储之间的延迟差距。这些新内存层会增加带宽的容量,提供更高效率,并降低总拥有成本。这就是业界正在坚定地将CXL作为处理器、内存和加速器的高速缓存一致性互连技术的根本原因所在。

CXL进展到了哪里?

CXL联盟于2019年成立,并推出初始的1.0和后续的1.1规范,英特尔的Shapphire Rapids处理器和AMD EPYC Genoa处理器支持该技术。在CXL 1.0/1.1规范中,CXL联盟定义了CXL.io、CXL.cache和CXL.memory三种协议,分别处理I/O、缓存一致性和内存访问。

CXL.io:这种模式可以将内存扩展到外部设备,使得数据的传输速度更快。CXL.io通过PCIe总线连接CPU和外部设备,这样CPU就可以与外部设备共享内存,并且可以直接访问外部设备的I/O资源;

CXL.cache:这种模式可以通过将内存缓存到外部设备中来提高性能。CXL.cache模式允许CPU在本地缓存中保留最常用的数据,而将不常用的数据保存在外部设备中。这样可以减少内存访问时间,提高整体系统性能;

CXL.memory:该协议使主机(例如处理器)能够使用加载/存储命令访问设备连接的内存。该模式可以将外部设备作为主内存使用,从而实现更大的内存容量。

这三个协议虽然支持三种不同的CXL设备类型,但都共同促进了计算设备之间内存资源的一致共享。

此后,该联盟持续升级其路线图,陆续更新了CXL2.0和CXL3.0/3.1规范,融入了内存池化和CXL切换的新功能。CXL2.0于2020年发布,并计划于2024年推出,以便多个CPU(主机)可以按需访问共享内存池,通过限制内存的过度配置提高内存利用效率。

最新的CXL规范是3.1,于2023年11月在Supercomputing 2023(SC23)发布,预计将在2025至2026年之间公开提供设备。CXL 3.1继续增加新功能,包括支持PCIe 6.0(速率为64GT/s),并通过Fabric Switching增加内存池来进一步扩展内存池规模。CXL2.0和3.1均支持与前几代产品的完全向后兼容。

尽管规范更新的很快,但我们也听到了行业中的一些质疑声音,例如有人士就指出,“过去三年中,不少内存和服务器SoC公司都表示支持CXL。但就产品推出而言,CXL在数据中心的扩散和应用程度似乎又较为缓慢。”

对此,Mollah回应称,“与任何新技术一样,CXL的大规模应用也需要时间。”从目前的进展来看,该技术已经得到了由150多家行业参与者组成的大型生态系统的支持,其中包括超大规模云服务商、系统OEM、平台和模块制造商、芯片制造商和IP提供商,这反过来又进一步推动了CXL的潜力。尽管CXL仍处于早期部署阶段,但CXL联盟发布的3.1规范强调了该技术的发展势头,并展示了其开创计算新时代的潜力。

生成式AI加速助推CXL落地

以ChatGPT为代表的生成式AI,和很多大型商业公司开始减少对芯片公司标准器件的使用,转而致力于构建自己的差异化、定制化芯片系统,为CXL带来了相当显著的市场新机遇。

Mollah表示,随着ChatGPT等生成式AI模型的应用不断发展,它对计算资源有着巨大的需求,尤其是在训练和推理过程中。为了继续提高性能,服务器正越来越多地转向异构计算架构,并使用专用加速器为CPU分担特定工作负载,如人工智能训练等。这些加速器可提供这些应用所需的专业计算能力,从而实现更快的处理速度和更精确的结果。CXL在这方面也发挥了关键作用,其内存缓存一致性可实现CPU和加速器之间的内存资源共享。

此外,分布式计算和训练是处理生成式AI模型所需的大量数据和计算的关键。CXL的可扩展性,特别是在内存池和共享方面,有助于解决内存和数据传输难题。随着生成式AI模型变得越来越大、越来越复杂,对可扩展内存解决方案的需求可能会增加。

对构建差异化、定制化芯片系统而言,CXL是一个旨在为各种组件,如CPU、GPU、FPGA以及内存设备,提供高速、低延迟连接的互连标准,可在这些组件之间实现高效的数据共享和通信,因此非常适用于数据中心、高性能计算和人工智能/机器学习等广泛应用。它的灵活性和对不同内存和计算设备的支持,使其成为构建高性能、可扩展和多功能计算系统的重要技术。

“CXL内存互联计划”

2021年,Rambus围绕CXL技术和生态展开了全面布局,其中最令人印象深刻的事件就是在一天内宣布完成对AnalogX和PLDA两家公司的收购,并推出面向数据中心的“CXL内存互联(CXL Memory Interconnect)计划”。

AnalogX是行业领先的高速、低功耗PHY解决方案提供商,收购增强了Rambus 系列PCIe 5.0和32G多协议PHY的SerDes技术,为其迈向PCIe 6.0和CXL 3.0奠定了基础;PLDA同样致力于通过CXL和PCIe技术,为数据中心的处理器、加速器、内存和网络设备之间提供高速互联。基于这两项收购,从物理接口到数字控制器,再到IP产品,Rambus CXL相关产品和技术路线图变得日趋完整。

Rambus方面希望能够凭借上述举措进一步推动数据中心向可分解、重组的架构转型。尤其是考虑到在人工智能应用场景之下,市场对高速GDDR以及HBM的需求非常庞大,Rambus将继续迭代PCIe产品与CXL不同标准的协议。其次,在走向下一代协议支持的过程当中,公司还将继续开发更多SerDes互联产品,以实现基于CXL的互联。

而在上述基础上形成的“CXL内存互联计划”,则意在通过内存扩展和池化解决方案推动数据中心的架构转变,支持分解和可组合的服务器架构。

Mollah透露称,三年来,通过运用企业内部在高速I/O、存储器和安全领域的专业知识,Rambus与领先的处理器、DRAM和系统OEM与云服务提供商密切合作,开发出一些列基于CXL的内存扩展和池化解决方案,例如适用于CXL 3.0和CXL 2.0的CXL 控制器IP解决方案,已经被多家客户应用于加速器和SoC中以实现CXL互联。

此外,Rambus还在SC23展示了使用公司原型CXL内存控制器芯片的CXL平台开发套件,使模块和系统制造商能够为AI基础设施和其他先进系统开发和测试基于CXL的内存扩展和池化解决方案原型,以及展示运行行业标准基准测试软件的生产服务器中的CXL内存分层功能。

Rambus CXL平台开发套件扩展卡

“CXL是十年一遇的技术力量,将革新数据中心的架构。借助CXL内存计划,Rambus正在设计解决方案,引领数据中心性能与效率的新时代。”Mollah强调说。

责编:Lefeng.shao
本文为EET电子工程专辑原创文章,禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
阅读全文,请先
您可能感兴趣
近年来,AWS还积极投资于人工智能(AI)、机器学习(ML)、大数据分析和边缘计算等前沿技术,以保持其在这些领域的竞争优势。
谷歌认为,这种独家协议可能会限制市场竞争,导致其他公司无法自由地使用OpenAI的技术,从而增加了用户面临额外成本的风险,比如数据迁移和员工培训等。
据悉,此次交易是通过马斯克亲自与英伟达CEO黄仁勋进行沟通促成的。这批GB200 AI芯片将被用于强化其旗舰级超级计算集群——Colossus(巨人)。Colossus作为xAI的技术基石,将借此机会实现计算能力的飞跃。
短期全球芯片市场数据的上调反映了 2024 年第 2 季度和第 3 季度业绩的改善,尤其是在计算领域,受AI 芯片支持的需求推动。
常情况下,英特尔的CEO在65岁时退休,而现年63岁的基辛格突然被退休,让市场感到意外。为了确保平稳过渡,英特尔董事会立即着手寻找新的CEO人选……
自1984年,意法半导体首次进入中国,成为首批在中国开展业务的半导体公司。意法半导体CEO Jean-Marc Chery日前表示,中国市场是不可或缺的,是电动汽车规模最大、最具创新性的市场,与中国本地的制造工厂达成合作,具有至关重要的作用。他还表示,意法半导体正在采用在中国市场学到的最佳实践和技术,并将其应用于西方市场,“传教士的故事结束了”。
目前,智能终端NFC功能的使用频率越来越高,面对新场景新需求,ITMA多家成员单位一起联合推动iTAP(智能无感接近式协议)标准化项目,预计25年上半年发布1.0标准,通过功能测试、兼容性测试,确保新技术产业应用。
中科院微电子所集成电路制造技术重点实验室刘明院士团队提出了一种基于记忆交叉阵列的符号知识表示解决方案,首次实验演示并验证了忆阻神经-模糊硬件系统在无监督、有监督和迁移学习任务中的应用……
C&K Switches EITS系列直角照明轻触开关提供表面贴装 PIP 端子和标准通孔配置,为电信、数据中心和专业音频/视频设备等广泛应用提供创新的多功能解决方案。
投身国产浪潮向上而行,英韧科技再获“中国芯”认可
今日,长飞先进武汉基地建设再次迎来新进展——项目首批设备搬入仪式于光谷科学岛成功举办,长飞先进总裁陈重国及公司主要领导、嘉宾共同出席见证。对于半导体行业而言,厂房建设一般主要分为四个阶段:设备选型、设
来源:苏州工业园区12月17日,江苏路芯半导体技术有限公司掩膜版生产项目迎来重要进展——首批工艺设备机台成功搬入。路芯半导体自2023年成立以来,专注于半导体掩膜版的研发与生产,掌握130nm至28n
‍‍12月18日,深圳雷曼光电科技股份有限公司(下称“雷曼光电”)与成都辰显光电有限公司(下称“辰显光电”)在成都正式签署战略合作协议。双方将充分发挥各自在技术创新、产品研发等方面的优势,共同推进Mi
12月18日,珠海京东方晶芯科技举行设备搬入仪式。插播:加入LED显示行业群,请加VX:hangjia188在10月31日,珠海京东方晶芯科技有限公司发布了Mini/Micro LED COB显示产品
来源:IT之家12 月 18 日消息,LG Display 韩国当地时间今日宣布,已将自行开发的“AI 生产系统”投入到 OLED 生产线的日常运行之中,该系统可提升 LG Display 的 OLE
“ 洞悉AI,未来触手可及。”整理 | 美股研究社在这个快速变化的时代,人工智能技术正以前所未有的速度发展,带来了广泛的机会。《AI日报》致力于挖掘和分析最新的AI概念股公司和市场趋势,为您提供深度的
阿里资产显示,随着深圳柔宇显示技术有限公司(下称:“柔宇显示”)旗下资产一拍以流拍告终,二拍将于12月24日开拍,起拍价为9.8亿元。拍卖标的包括位于深圳市龙岗区的12套不动产和一批设备类资产,其中不
在上海嘉定叶城路1688号的极越办公楼里,最显眼的位置上,写着一句话:“中国智能汽车史上,必将拥有每个极越人的名字。”本以为这句话是公司的企业愿景,未曾想这原来是命运的嘲弄。毕竟,极越用一种极其荒唐的
LG Display  12月18日表示,为加强OLED制造竞争力,自主开发并引进了“AI(人工智能)生产体系”。“AI生产体系”是AI实时收集并分析OLED工艺制造数据的系统。LG Display表
今天上午,联发科宣布新一代天玑芯片即将震撼登场,新品会在12月23日15点正式发布。据悉,这场发布会联发科将推出全新的天玑8400处理器,这颗芯片基于台积电4nm制程打造,采用Arm Cortex A