为了解决从客户端系统到高性能服务器的广泛应用所面临的性能和功耗挑战,固态技术协会(JEDEC)于2020年7月正式发布了下一代主流内存标准DDR5 SDRAM的最终规范(JESD79-5),为全球计算机内存技术拉开了新时代的序幕。
DDR5的价值
JEDEC将DDR5描述为一种“具备革命意义”的内存架构,认为它的出现标志着整个行业即将向DDR5服务器双列直插式内存模块(DIMM)过渡。
DDR5最亮眼的部分,就是速度比已经“超级快”的DDR4还要快。与DDR4内存最高3.2Gbps的传输速度相比,全新DDR5内存的最高传输速率可达8.4Gbps。此外,DDR5也改善了DIMM的工作电压,将供电电压从DDR4的1.2V降至1.1V,进一步提升了内存的能效表现。
图1:DDR5与DDR4 DIMMs的对比
DRAM芯片密度方面,DDR4在单裸片封装(SDP)模式下仅支持最高16Gb的DRAM容量,而DDR5内存标准将这一数字提高到了64Gb。这意味着,DDR5 DIMM在SDP模式下的最高容量可达256GB,是DDR4 64Gb最大容量的4倍。同时,DDR5还支持片上纠错码、错误透明模式、封装后修复和读写CRC校验等功能,并支持最高40个单元的堆叠,从而可使其有效内存容量达到2TB。
在针脚设计上,DDR5内存将保持与DDR4相同的288个引脚数,但由于定义不同,所以不能兼容DDR4插槽。DDR5 DIMM采用了彼此独立的40位宽双通道设计(32个数据位,8个纠错码位),每个通道的突发长度从8字节(BL8)翻倍到16字节(BL16)。所以尽管数据位仍然是64位,但并发能力的提高使得内存访问效率得到了提升,而且两个通道共用寄存时钟驱动器,每侧可提供四个输出时钟,能够优化信号完整性。
此外,DDR5还带来了一种名为“同一内存块刷新(SAME-BANK Refresh)”的新特性。这一命令允许对每一组内存块中的单独内存块进行刷新,而让其他内存块保持打开状态,以继续正常操作。测试数据显示,单列DDR5模组与DDR4双列模组以3200MT/s的速度进行比较时,前者性能可以提升1.28 倍,在4800MT/s的入门级数据速率下,DDR5性能提升了高达1.87倍!
身后的推动力
市场调研机构Omdia分析指出,对DDR5的市场需求将从2020年开始逐步显现,到2022年,DDR5将占据整个DRAM市场份额的10%,2024年则将进一步扩大至43%;Yole Developpement则预测称,DDR5的广泛采用应该会从2022年的服务器市场开始,2023年,手机、笔记本电脑和PC等主流市场将开始广泛采用DDR5,出货量明显超过DDR4,两种技术间完成快速过渡。
Rambus内存互连芯片业务部门产品营销副总裁John Eble对《电子工程专辑》表示,随着CPU核心数量和计算性能的持续增加,内存带宽和容量也必须成比例地扩展,这是DDR5推出的根本动力所在。例如2000年-2019年,内存带宽从约1GB/s迅速提升至200GB/s,但与此同时,处理器核心数量也从早期的单核、双核,增加到目前一个系统中最高可以超过60个处理器核心。在这样一个存在超多核心处理器的系统中,分摊到每个处理器内核上的可用带宽是严重不足的,提升DRAM带宽的呼声日趋高涨。
Rambus内存互连芯片业务部门产品营销副总裁John Eble
他还列举了推动DDR5前进的其他因素,包括:处理器和内存希望拥有相同的内存读取粒度(64字节高速缓存行);相同或更好的可靠性、可用性和可服务性功能,例如必须支持单错误校正和双错误检测(single error correction/double error detection);保持在冷却功率范围内(~15W/DIMM),并控制好启动和内存训练的时间,以免影响预期的启动时间。
数据中心、PC与平板电脑和边缘计算,被视作DDR5最有希望得到广泛普及的三大领域。优先级方面,与先前几代产品的迭代都是优先应用于PC中不同,业界普遍认为DDR5将紧随DDR4的步伐,率先导入数据中心领域,以应对计算密集型的工作负载。但考虑到PC消费者对整机价格敏感度极高,且DDR5初期推出的价格与DDR4相比存在较高溢价,所以普及速度会相对较慢。
但John Eble并不同意“2022年能够真正全面进入DDR5时代”的说法,认为该说法过于激进——毕竟2022年已经过半,支持DDR5的处理器平台却仍然比较有限。
“目前DDR4仍然保持着强劲的势头,DDR5还处于早期的量产爬坡阶段,预计到2023年底DDR5的出货量才会超过DDR4。”John Eble说目前的实际情况是,第一个DDR5服务器已经出样,预计会在接下来的3-6个月内实现早期量产;在PC市场,英特尔Alder Lake处理器已经搭配了DDR5内存,AMD也宣布会在今年秋天支持DDR5。
扩大DDR5内存接口芯片组合
为了改进DDR5双列直插式内存模块(DIMM)的系统管理和热控制,在服务器、台式机和笔记本电脑所需的功率范围内提供更高的性能,Rambus日前推出了最新的串行检测集线器(SPD Hub)和温度传感器,为寄存器时钟驱动器(RCD)提供补充。
图2:Rambus最新的串行检测集线器(SPD Hub)和温度传感器
简单而言,SPD Hub和温度传感器都是内存模块上的关键组件,可以感知并报告用于系统配置和热管理的重要数据——SPD Hub可用于服务器和客户端模块,包括RDIMM、UDIMM和SODIMM,温度传感器则专为服务器RDIMM设计。同时,经过扩展的该DDR5解决方案组合还能够提供高达5600MT/s的数据传输速率。
John Eble表示,两款产品的推出与当前服务器的设计趋势高度吻合,即高数据传输效率带来的复杂性进一步提高,服务器对于热管理和信号完整性管理提出了新的要求。以当前非常典型的双插槽服务器为例,在该设计中,每个插口都拥有一组DIMMs和PCIe插槽,可以填充SSD、网卡、加速器等;底板管理控制器可以通过各种接口与主板的所有组件进行通信;最后,还配置一系列的风扇来管理散热和温度。在此基础上,我们来探讨额外的DDR5功能是如何被用来加强电源传输系统的管理和遥测,从而改善整体服务设计和性能的。
系统管理总线在初始化时被大量使用,以发现接入的DIMMs,并执行早期的内存通道校准。可以看到,过去使用的I2C运行频率约为1MHz,而DDR5平台采用I3C总线,运行频率可达10MHz,是之前的10倍。
为了支持这种高速率,DDR5 DIMM架构通过引入I3C SPD Hub,将总线隔离到控制器一侧的单个DIMM上与主机进行通信。在目标端点,它可以与模块上其他具有I3C接口的芯片进行通信,包括RCD、PMIC和独立的热传感器。除了减少初始化时间,总线速度的提高也将支持更高的轮询率和实时控制。此外,该集线器还包括串行存在检测集线器,存储了DIMM的非易失性配置信息,并具备热传感器。
图3:系统管理总线运行速度加快10倍
现在,让我们把注意力转向两侧的独立温度传感器芯片,它们通过I3C接口连接到I3C集线器,这为每个DIMM提供了三个空间数据点,可收集服务器中与温度情况相关的大量信息。服务器/CPU能够使用该功能管理风扇速度/噪声、DRAM刷新率来提高性能或保留时间,并且可以作为限制带宽的“最后一招”节流带宽,以减少热量。
图4:服务器内部温度空间遥测
“通过提供更完整的DDR5 DIMM芯片组设计,用户不但能够实现更好的、更有效率的内部验证,在质量方面也得到了进一步的保障,无论是服务器还是消费级市场都将因此获益。”John Eble说。