从云端运算与物联网(IoT)到越来越多的智能手机和智能车辆,为了满足各式各样的新应用需求,内存业者正面对前所未有的压力。此外,还有人工智能(AI)和机器学习(ML),也正成为Google、Facebook和Amazon等全球主要的“超大规模业者”(hyperscaler)开发下一代平台的重要组成部份。
编按:这些全球数一数二的业界巨擘曾经颠覆业务并改写产业生态,如今正开始重塑半导体产业。他们究竟正进行哪些前所未有的计划?为什么?又将带来什么样的结果?
他们都在期待广大的电子产业和内存制造商带来大量创新,无论是进一步改善DRAM和NAND flash等现有内存,还是推动整合新材料的新型内存实现商用化,使其成为新运算架构的部份内存组件。但是,就算他们的口袋再深,也没有哪一家公司可能投资制造设备来自行制造内存组件,更不可能支付高价购买。
因此,如果DRAM仍然可用,他们就不会为了每台装置多付5美元去购买新型内存。
Objective Analysis首席分析师Jim Handy表示,这些超大规模业者所具有的影响力是前所未有的;他所能想到历史上最接近的情况是苹果(Apple)在15到20年前所拥有的“庞大”购买力。然而,Apple仅着眼于对传统运算架构进行些微改动——例如只是换了一个接脚,而且这一变化并未产生额外费用。“他们更倾向于采用现有的计算机架构,然后以更一种优质或更友善的方式提供给客户。”
相形之下,超大规模业者则致力于寻求一系列或大规模的架构变化。Handy说,“他们的动机实际上是非常不同的,因为他们着眼于需要花费多少钱来买东西,然后也会考虑它得消耗多大的功率才能执行。”超大规模业者期望产业来解决这个问题,他们并不打算自己挺身而出以及支付新资本设备的费用。
JEDEC更新高带宽内存(HBM)的规格,以满足AI应用的要求,但其制造成本仍相当高(来源:JEDEC)
美光科技(Micron Technology)先进运算解决方案副总裁Stephen Pawlowski表示,没有一家超大规模业者会想自行制造内存,尤其是DRAM,除了其挥发性之外,他们也无法提供可媲美像DRAM一样的可靠性、速度和耐用性。同时,NAND和一些较新的储存级内存在材料方面更复杂,而且要了解它们如何在温度、多个周期和不同工作负载下运作也不容易。因此并不至于让Micron等内存制造商面对什么威胁。“使用这些组件需要投资大量的创造力和人才,”他说:“简言之,为了提高容量以及性能效率,我们需要为内存和储存子系统做些什么呢?协同合作似乎会更好。”
Pawlowski认为超大规模业者取代了OEM自2000年代中期起所扮演的角色。他说,OEM持续推动创新让储存更接近CPU,而超大规模业者则试图以一种前所未有的方式推动网络带宽,这意味着必须消耗大量电力才能移动数据。“当我们着眼于如何提高数据中心的效率时,务必做到确保让运算系统与内存储存子系统之间的信息传输达到尽可能的低延迟。”
Globalfoundries嵌入式内存资深总监Martin Mason表示,人们对于在数据中心的运算密集型应用中部署MRAM和ReRAM十分感兴趣,包括在服务器集群实现主流的AI处理——其关键挑战就在于功耗和内存带宽。“你将会在此领域开始看到新型内存技术的部署。我认为现阶段还没有任何一种技术可真正被商业开发,但MRAM和RRAM都被视为可在该应用中取代SRAM的高密度内存技术。”
Martin表示,这一趋势反映了超大规模业者过去五年来的发展,“他们从以软件为主导的公司转变得越来越垂直整合导向,包括所提供的企业基础设施解决方案,以及更进一步在其解决方案中增加了芯片开发。”他们认为芯片开发可望在两方面促进其发展,首先是实现与所有商品化企业硬件的差异化,其次则是经济规模。透过垂直整合并将其设计直接带到代工厂,他们最终得到了一种更具成本效益的解决方案,可以更快且更经济地扩展。
这些超大规模业者超越软件开发的最佳典范就是Google为其AI工作负载开发的Tensor处理单元(TPU),应用材料(Applied Materials)先进制程技术开发总经理Mahendra Pakala表示,这一类的处理器技术通常来自像英特尔(Intel)这样的公司。而今,这些超大规模业者开始使用现有的一些技术来实现其AI加速器,“但是,一旦你开始设计和建构自家的加速器,就会看到不足之处。”他认为加速器也将推动新兴内存的采用,以及因应其需求的整体内存开发蓝图。
应用材料公司将其Endura平台从单一制程系统发展为整合制程系统,作为新兴内存材料工程基础的一部份(来源:Applied Materials)
高带宽内存2.0 (HBM2)是在AI应用中备受关注的现有内存之一,传统上用于高阶绘图和高性能运算。但Pakala指出,虽然在制造方面业已成熟,但HBM2技术仍然相当昂贵。他说,从新型内存来看,3D XPoint形式的PCRAM以及MRAN都已经可以看到一些应用了。“我们确实看到这二项技术日趋成熟,重点开始摆在降低每位成本。同时,也确实出现了降价的途径。”
Applied Materials认为材料工程是持续前进的基础。因此,为了满足包括AI等新兴用例,必须以更具成本效益的方式制造PCRAM、ReRAM和MRAM。例如,该公司最新的Endura平台重点在于让这些新内存的关键新材料能够以原子级的精确度进行沉积。最新发布的300mm MRAM量产系统由整合于超高真空环境的9个特殊晶圆处理反应室组成,每个反应室可分别沉积多达5种材料。
尽管代工厂正大力探索如何在基于新兴内存的装置上与超大规模业者合作,但是,Handy并未看到超大规模应用显著推动对其需求,因为超大规模业者宁愿花更少的费用或使用以DRAM和flash制造的复杂设置。Globalfoundries的Mason也认同超大规模业者更倾向于走务实路线,致力于让当今的方案可行并寻求最佳的渐进式发展。但是,如果价格合适,那么也可能出现大逆转,让他们愿意投资于开发真正具有突破性的产品。他说:“我认为在他们之中已经有业者看到重大突破发生中。”
Handy说,这些超大规模业者使用内存的目的在于希望持续遵循摩尔定律,让未来的界限进一步拓展。“为此,内存公司必须持续其资本支出,但如果资本支出变得太大,或者如果他们试图更快速地扩展,那么不但无法降低成本,还可能进一步堆高成本!”
编译:Susan Hong
(参考原文:Memory Makers and Foundries Step Up to Hyperscale Demands,by Gary Hilson)