使用CXL打破内存墙!

原创 SSDFans 2024-11-25 07:05


点击蓝字
关注我们



数据处理的增加、虚拟化的广泛使用以及内存中计算的增加,使得服务器对CPU附加内存的需求呈指数级增长。人工智能、机器学习、大数据和分析等现代工作负载加剧了数据中心管理人员面临的内存挑战。训练大型语言模型(LLM),如GPT-4Llama 2PaLM 2需要大的内存容量和计算能力。


随着处理器核数的不断增加,实现更快、更复杂的计算,就需要更多的内存。CXL内存可以提供所需的扩展内存容量。最新的Intel Xeon处理器支持最新一代DDRCXL内存,为客户提供优化配置所需的灵活性,以最好地满足其工作负载需求。


此外,以每千兆美元($/Gbit)计算的DRAM成本并没有像人们预期的那样随着下一代存储节点的增加而降低。由于内存占服务器成本的50%以上,因此有很大的机会优化成本并有效地使用内存资源


作为技术创新者,英特尔在开发新的I/O、内存和存储标准方面有着成功的历史。2019年,英特尔宣布为处理器、内存扩展和加速器开发一种新的缓存/内存相干互连协议,称为CXLCXL联盟于同年成立,成员包括阿里巴巴、思科、戴尔、Meta、谷歌、惠普、华为和微软。今天,该联盟拥有250多家成员公司,并且还在继续增长。


CXL概述


PCIe类似,CXL是一种将设备连接到CPU或任何其他计算元素(如GPU)的协议。CXL也运行在与PCIe相同的物理层链路上,称为“PHY链路”。但是,CXLPCIe的不同之处在于,它支持与附加设备共享一致内存。CXL的一个用例是附加连贯内存加速器设备另一个流行的用例是简单地向服务器添加更多内存。显然,CXL在增强内存带宽和容量方面非常重要。


CXL利用PCIe的高速通信能力,显著提高CPU与连接设备(包括内存扩展模块)之间的数据传输速率。第一代CXL链路的运行速度与PCIe Gen5相同,在16通道链路上,每个方向最高可达64GB/s


内存扩展


CXL提供了一种使用CXL内存扩展器增加服务器内存容量的新方法。ASICCXL控制器管理CXL内存扩展器内附加的DRAM。它将传入的CXL命令转换为相应的DRAM/写命令。


所有主要的内存供应商都是扩展CXL生态系统的一部分,并制定了路线图,提供具有高达512 GB DDR5 DRAM内存CXL内存扩展器数据中心管理人员可以使用CXL Memory expander将其服务器内存容量扩展到数十TB,同时实现每秒数TB的内存带宽。


操作系统通常将添加的CXL内存视为第二层;本机DRAM是“近”内存,而CXL内存是“远”内存。Linux操作系统在过去几年中不断发展,以隐藏两层之间的延迟差异。这是通过使用“热/冷”页迁移技术来实现的,该技术将CXL内存中频繁访问的数据(“热页”)提升到近内存,同时将“冷”页从近内存迁移到CXL内存。在使用CXL内存扩展器时,不需要修改用户应用程序。


节省内存TCO


使用CXL添加内存的另一个好处是可以在CXL内存缓冲区后面使用更便宜的内存。美光提供128GBCXL模块,使用的是老一代DDR芯片DDR4内存。从英特尔Xeon6处理器开始,英特尔计划提供一种独特的硬件控制内存分层功能,称为英特尔Flat memory模式,它可以在两个内存层之间迁移数据,而不依赖于操作系统。


此外,CXL v2.0及更高版本提供了对持久内存的支持。这一点很重要,因为基于CXL的持久内存预计会比DRAM便宜。这种内存在选择内存供应商的路线图上。


内存带宽扩展


添加CXL内存扩展了系统总内存带宽,因为它为访问数据创建了更多通道。平均而言,x16 CXL链路的带宽是DDR5内存通道的2倍。系统的内存带宽可以使用“内存交错”进一步增加。这对于像HPCAI/ML领域带宽饥渴的工作负载来说是一个巨大的福音。


预计Linux操作系统将从v6.9版本开始提供此功能。第五代Intel Xeon处理器提供异位交错,这是一种独特的硬件控制内存交错功能。硬件控制的内存交错对于云服务提供商和OEM来说非常方便,因为他们的系统不依赖于操作系统进行内存交错。


内存池


内存池允许在计算系统内的多个设备之间共享内存资源。它使不同的加速器(如GPUFPGA和其他专用处理器)能够像访问本地内存一样访问和利用公共内存资源池(通常是DRAM)。尽管仍处于概念验证阶段,但CXL内存池将提高资源效率、节省成本、增强可扩展性和性能,并简化编程。


CXL的好处


人工智能、虚拟桌面基础设施和内存数据库等内存密集型工作负载主导着当今的计算领域,但通过添加CPU附加的DRAM来增加内存容量是非常昂贵的。CXL协议在现有的PCIe链路上运行,允许以较低的成本增加系统内存,并得到了技术公司和行业领导者联盟的广泛支持。


原文链接:

https://community.intel.com/t5/Blogs/Tech-Innovation/Data-Center/Breaking-the-Memory-Wall-with-Compute-Express-Link-CXL/post/1594848



高端微信群介绍

创业投资群


AI、IOT、芯片创始人、投资人、分析师、券商

闪存群


覆盖5000多位全球华人闪存、存储芯片精英

云计算群


全闪存、软件定义存储SDS、超融合等公有云和私有云讨论

AI芯片群


讨论AI芯片和GPU、FPGA、CPU异构计算

5G群


物联网、5G芯片讨论

第三代半导体群

氮化镓、碳化硅等化合物半导体讨论

储芯片群

DRAM、NAND、3D XPoint等各类存储介质和主控讨论

汽车电子群

MCU、电源、传感器等汽车电子讨论

光电器件群

光通信、激光器、ToF、AR、VCSEL等光电器件讨论

渠道群

存储和芯片产品报价、行情、渠道、供应链




< 长按识别二维码添加好友 >

加入上述群聊




长按并关注

带你走进万物存储、万物智能、

万物互联信息革命新时代

微信号:SSDFans



SSDFans AI+IOT+闪存,万物存储、万物智能、万物互联的闪存2.0时代即将到来,你,准备好了吗?
评论
  •  光伏及击穿,都可视之为 复合的逆过程,但是,复合、光伏与击穿,不单是进程的方向相反,偏置状态也不一样,复合的工况,是正偏,光伏是零偏,击穿与漂移则是反偏,光伏的能源是外来的,而击穿消耗的是结区自身和电源的能量,漂移的载流子是 客席载流子,须借外延层才能引入,客席载流子 不受反偏PN结的空乏区阻碍,能漂不能漂,只取决于反偏PN结是否处于外延层的「射程」范围,而穿通的成因,则是因耗尽层的过度扩张,致使跟 端子、外延层或其他空乏区 碰触,当耗尽层融通,耐压 (反向阻断能力) 即告彻底丧失,
    MrCU204 2025-01-17 11:30 182浏览
  • 临近春节,各方社交及应酬也变得多起来了,甚至一月份就排满了各式约见。有的是关系好的专业朋友的周末“恳谈会”,基本是关于2025年经济预判的话题,以及如何稳定工作等话题;但更多的预约是来自几个客户老板及副总裁们的见面,他们为今年的经济预判与企业发展焦虑而来。在聊天过程中,我发现今年的聊天有个很有意思的“点”,挺多人尤其关心我到底是怎么成长成现在的多领域风格的,还能掌握一些经济趋势的分析能力,到底学过哪些专业、在企业管过哪些具体事情?单单就这个一个月内,我就重复了数次“为什么”,再辅以我上次写的:《
    牛言喵语 2025-01-22 17:10 41浏览
  • Ubuntu20.04默认情况下为root账号自动登录,本文介绍如何取消root账号自动登录,改为通过输入账号密码登录,使用触觉智能EVB3568鸿蒙开发板演示,搭载瑞芯微RK3568,四核A55处理器,主频2.0Ghz,1T算力NPU;支持OpenHarmony5.0及Linux、Android等操作系统,接口丰富,开发评估快人一步!添加新账号1、使用adduser命令来添加新用户,用户名以industio为例,系统会提示设置密码以及其他信息,您可以根据需要填写或跳过,命令如下:root@id
    Industio_触觉智能 2025-01-17 14:14 122浏览
  • 数字隔离芯片是一种实现电气隔离功能的集成电路,在工业自动化、汽车电子、光伏储能与电力通信等领域的电气系统中发挥着至关重要的作用。其不仅可令高、低压系统之间相互独立,提高低压系统的抗干扰能力,同时还可确保高、低压系统之间的安全交互,使系统稳定工作,并避免操作者遭受来自高压系统的电击伤害。典型数字隔离芯片的简化原理图值得一提的是,数字隔离芯片历经多年发展,其应用范围已十分广泛,凡涉及到在高、低压系统之间进行信号传输的场景中基本都需要应用到此种芯片。那么,电气工程师在进行电路设计时到底该如何评估选择一
    华普微HOPERF 2025-01-20 16:50 73浏览
  •     IPC-2581是基于ODB++标准、结合PCB行业特点而指定的PCB加工文件规范。    IPC-2581旨在替代CAM350格式,成为PCB加工行业的新的工业规范。    有一些免费软件,可以查看(不可修改)IPC-2581数据文件。这些软件典型用途是工艺校核。    1. Vu2581        出品:Downstream     
    电子知识打边炉 2025-01-22 11:12 53浏览
  • 2024年是很平淡的一年,能保住饭碗就是万幸了,公司业绩不好,跳槽又不敢跳,还有一个原因就是老板对我们这些员工还是很好的,碍于人情也不能在公司困难时去雪上加霜。在工作其间遇到的大问题没有,小问题还是有不少,这里就举一两个来说一下。第一个就是,先看下下面的这个封装,你能猜出它的引脚间距是多少吗?这种排线座比较常规的是0.6mm间距(即排线是0.3mm间距)的,而这个规格也是我们用得最多的,所以我们按惯性思维来看的话,就会认为这个座子就是0.6mm间距的,这样往往就不会去细看规格书了,所以这次的运气
    wuliangu 2025-01-21 00:15 186浏览
  • 本文介绍瑞芯微开发板/主板Android配置APK默认开启性能模式方法,开启性能模式后,APK的CPU使用优先级会有所提高。触觉智能RK3562开发板演示,搭载4核A53处理器,主频高达2.0GHz;内置独立1Tops算力NPU,可应用于物联网网关、平板电脑、智能家居、教育电子、工业显示与控制等行业。源码修改修改源码根目录下文件device/rockchip/rk3562/package_performance.xml并添加以下内容,注意"+"号为添加内容,"com.tencent.mm"为AP
    Industio_触觉智能 2025-01-17 14:09 164浏览
  •  万万没想到!科幻电影中的人形机器人,正在一步步走进我们人类的日常生活中来了。1月17日,乐聚将第100台全尺寸人形机器人交付北汽越野车,再次吹响了人形机器人疯狂进厂打工的号角。无独有尔,银河通用机器人作为一家成立不到两年时间的创业公司,在短短一年多时间内推出革命性的第一代产品Galbot G1,这是一款轮式、双臂、身体可折叠的人形机器人,得到了美团战投、经纬创投、IDG资本等众多投资方的认可。作为一家成立仅仅只有两年多时间的企业,智元机器人也把机器人从梦想带进了现实。2024年8月1
    刘旷 2025-01-21 11:15 399浏览
  • 嘿,咱来聊聊RISC-V MCU技术哈。 这RISC-V MCU技术呢,简单来说就是基于一个叫RISC-V的指令集架构做出的微控制器技术。RISC-V这个啊,2010年的时候,是加州大学伯克利分校的研究团队弄出来的,目的就是想搞个新的、开放的指令集架构,能跟上现代计算的需要。到了2015年,专门成立了个RISC-V基金会,让这个架构更标准,也更好地推广开了。这几年啊,这个RISC-V的生态系统发展得可快了,好多公司和机构都加入了RISC-V International,还推出了不少RISC-V
    丙丁先生 2025-01-21 12:10 112浏览
  • 现在为止,我们已经完成了Purple Pi OH主板的串口调试和部分配件的连接,接下来,让我们趁热打铁,完成剩余配件的连接!注:配件连接前请断开主板所有供电,避免敏感电路损坏!1.1 耳机接口主板有一路OTMP 标准四节耳机座J6,具备进行音频输出及录音功能,接入耳机后声音将优先从耳机输出,如下图所示:1.21.2 相机接口MIPI CSI 接口如上图所示,支持OV5648 和OV8858 摄像头模组。接入摄像头模组后,使用系统相机软件打开相机拍照和录像,如下图所示:1.3 以太网接口主板有一路
    Industio_触觉智能 2025-01-20 11:04 150浏览
  • 高速先生成员--黄刚这不马上就要过年了嘛,高速先生就不打算给大家上难度了,整一篇简单但很实用的文章给大伙瞧瞧好了。相信这个标题一出来,尤其对于PCB设计工程师来说,心就立马凉了半截。他们辛辛苦苦进行PCB的过孔设计,高速先生居然说设计多大的过孔他们不关心!另外估计这时候就跳出很多“挑刺”的粉丝了哈,因为翻看很多以往的文章,高速先生都表达了过孔孔径对高速性能的影响是很大的哦!咋滴,今天居然说孔径不关心了?别,别急哈,听高速先生在这篇文章中娓娓道来。首先还是要对各位设计工程师的设计表示肯定,毕竟像我
    一博科技 2025-01-21 16:17 100浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦