混合内存立方体(HMC)与高带宽内存(HBM)之间的竞争,乍看之下就像反映着Beta和VHS时代的规格对峙战。不过,这两大领域之间的一个明显区别在于:HMC还活得好好的!
HMC使用一种称为“硅穿孔”(TSV)的垂直管道途径,以电气连接单个芯片的堆栈,让高性能逻辑与DRAM芯片结合在一起,从而使内存模块的结构就像立方体一样,而不是平放在主板上。相较于DDR技术,HMC架构能以较低功耗实现更高的性能。
这项技术的发展是以混合内存立方体联盟(Hybrid Memory Cube Consortium;HMCC)为主导,成员包括主要的内存制造商,如美光(Micron)、海力士(SK Hynix)和三星(Samsung),以及像是Altera、Arm、IBM、微软(Microsoft)、Open-Silicon和赛灵思(Xilinx)等开发商。
然而,尽管英特尔(Intel)、Altera和Xilinx等供货商已经将HMC技术整合于其产品和架构中,但HMC的发展一直未能像HBM那样真正地起飞,甚至都已经发展到3.0版了。其他像是一些先进的高性能运算和数据科学应用,包括巨型电波望远镜数组计划SKA以及富士通(Fujitsu)等公司的高性能运算(HPC)解决方案等,也导入了这一技术规格。
美光科技就是最早并强力支持该技术的业者之一。美光先进运算解决方案副总裁Steve Pawlowski说,该公司目前销售搭载HMC 2.0的FPGA模块,但相较于恪遵HMC协议,其关注重点更在于该架构如何满足特定用例对于高带宽内存的需求,包括人工智能(AI)¬¬——这是最初在构想HMC时还未真正存在的应用。Pawlowski:“哪些应用能让我们取得以低功耗实现极高带宽的最大优势?同时又能为客户提供更具成本效益的封装解决方案?”
Pawlowski表示,美光科技持续进行其‘pathfinding programs’研发计划来探索HMC的潜力,而不只是对于最初规格的更新,同时还将推动其他高带宽内存技术的进展——包括扩展GDDR到传统绘图市场之外和极端性能等应用,以及后来居上而使HMC黯然失色的HBM技术。
Pawlowski说,从性能的角度来看,HMC当然是不错的解决方案,但是客户也期待更大的容量支持。因此,“在带宽与容量的权衡时可能会稍偏向于容量。”
然而,新兴的AI工作负载更着重于带宽,因此,HMC架构在这方面更具有发展潜力。
同时,美光并利用其主机内存缓冲(HMB)功能,推出兼容于JEDEC标准的产品。其HBM2E产品组合目前处于工程样本阶段,提供包括8GB和16GB产品选择;此外,该公司还致力于在参考平台上验证其HBM2E。
由于三星等公司的努力,HBM在过去几年来逐渐展现稳步成长。例如三星最近发布了称为‘ Flashbolt’的第三代16GB HBM2E,在HBM2E封装上的缓冲芯片顶部垂直堆栈8层10nm级(1y) 16Gb DRAM芯片,使其前一代的‘ Aquabolt’容量提高了一倍。其HBM2E封装以40,000多个TSV微凸块排列方式互连,同时提供3.2Gbps的数据传输速度,每堆栈内存带宽为410Gbps。
作为一项开放标准,HBM持续进展以满足高带宽的需求。例如三星最近宣布其最新HBM2E,称为‘ Flashbolt’。
(来源:Samsung)
三星半导体高速内存资深营销经理Tien Shiah表示,HBM2E非常适于HPC和先进的绘图系统,以及AI驱动的数据分析。“HBM显然已经成为AI的首选内存。”他说,部份原因在于HBM已经是业界标准,而HMC尚未成为标准,还需要IP等合作伙伴来共同发展生态系统。即使这两种技术都使用TSV,但其关键的技术差异之一在于HMC使用串行接口,而HBM则使用并行接口。
由于HMC并不是开放标准,该技术可能会有不一样的专有应用风格。Objective Analysis首席分析师Jim Handy表示,HBM则是开放标准,任何人都可用于开发产品,而且也开始在超大规模业者与AI应用中探索更多需求,而不仅仅是最初的HPC和高阶绘图系统。“HBM带来了比DDR更高速的连接方式。”
而让HMC和HBM高阶内存得以实现的关键在于采用了TSV,但这一技术也使得制造成本大幅增加。Handy说,即使AI和超大规模业者开启了HBM需求之门,相对而言仍算是小量制造。“这并不至于让您期待大量普及,因为它仍然是一种价格非常昂贵的解决方案。”
Shiah还表示,HBM将永远都会是高价类的内存,因为它的制造成本更高。 “但是随着量更大以及更多应用导入,我认为还是有机会看到规模经济。”
三星自2016年推出Flarebolt迭代以及接着在2018年推出第二代HBM2——即Aquabolt以来,一直在稳定地逐步改善其HBM产品。Shiah说:“以我们最新的HBM2E产品来看,其速度基本上可以提高到75%,并较上一代产品的容量增加了1倍。”此外,HBM可说是目前最快的DRAM形式,对于为AI和机器学习应用寻找理想解决方案的客户而言极具吸引力。此外,自动驾驶应用也着眼于导入这项技术,以支持所需的实时决策。
尽管有许多新兴内存一直在探索新的用例,但是没有什么比DRAM更快的了,即使是3D Xpoint¬¬——如今它可以作为Intel Optane DIMM来使用,即DRAM一般使用方式。Shiah说:“无疑地,HBM的带宽吞吐量是无与伦比的。”
因此,HMC看起来还活得好好的,而且对于最初构思HMC时并不存在的应用而言,如今的HMC架构可能更具意义。Pawlowski表示,HMC可说是超前其时代发展的卓越技术典范,但还需要建立生态系统才能使其被广泛采用。
编译:Susan Hong 责编:Yvonne Geng
(参考原文:HBM Flourishes, But HMC Lives,by Gary Hilson)