HBM4 延续 HBM 系列采用垂直堆栈 DRAM 晶粒的设计特点,但频宽、能源效率与设计弹性相较前一代 HBM3 有显著升级。首先,HBM4 支援最高 8 Gb/s 的传输速度,搭配 2048 位元界面,总频宽可达 2 TB/s;每个堆栈中的独立通道数从 HBM3 的 16 条倍增至 HBM4 的 32 条。
电源效率方面,JESD270-4 支援供应商专用的 VDDQ(0.7V、0.75V、0.8V 或 0.9V)与 VDDC(1.0V 或1.05V),有助于在不同系统需求下降低耗电量、提升能源效率。
HBM4 同时维持对现有 HBM3 控制器的兼容性,让单一控制器可同时支援 HBM3 与 HBM4 存储器,简化导入流程,提升系统设计的弹性。此外,HBM4导入「定向刷新管理」(DRFM)机制,加强对 Rowhammer 攻击问题的防护,并提升可靠性、可用性与可维修性(RAS)功能。
容量部分,HBM4 支援从 4 层、8层、12 层和 16 层的 DRAM 堆栈配置,搭配 24Gb 或 32Gb 的 DRAM 芯片,每个堆栈的容量最高可达64GB。
值得注意的是,HBM4 架构上的一项显著改变,是将指令总线(command bus)与资料总线(data bus)分离,以提升并行度并降低延迟。此设计目的是在多通道操作环境中提升效能,这类情境在 AI 与高效能运算(HPC)应用中特别常见。此外,HBM4 也导入全新的实体界面与讯号完整性改进,以支援更快的资料传输速率与更高的通道效率。
三星、美光、SK 海力士预期在不久的将来会展示支援 HBM4 的相关产品,三星计划在 2025 年启动量产,满足来自 AI 芯片商与超大规模资料中心(hyperscalers)的需求。随着 AI 模型与 HPC 应用对运算资源的需求日益提高,存储器系统需要提供更大的频宽与更高的容量,而 HBM4 标准为新一代存储器技术提供明确的规格基础,有助于应对未来在资料吞吐与处理效能上的挑战。