AI需求飙升,HBM选项也不断增加

TechSugar 2024-12-02 08:03

(本文编译自Semiconductor Engineering)


随着先进AI加速器、图形处理单元及高性能计算应用的蓬勃发展,所需处理的数据量正以前所未有的速度激增,这一趋势直接推动了高带宽内存(HBM)销量的急剧攀升。


由于在研发和优化诸如ChatGPT等大型语言模型上投入的巨大人力与财力,HBM库存现已告急,供不应求。HBM凭借其卓越性能,成为了存储构建这些庞大模型所需海量数据的首选内存方案。然而,旨在通过增加更多层以提高密度的改进措施,以及SRAM扩展所面临的物理限制,进一步加剧了HBM供应紧张的局面。


Rambus公司高级副总裁兼硅IP业务总经理Neeraj Paliwal指出:“大语言模型(LLM)的参数规模现已突破万亿大关,并还在持续增长。克服内存带宽与容量的瓶颈,对于满足AI训练与推理过程中日益严苛的实时性能需求而言,显得至关重要。”


这一强劲的发展势头,很大程度上得益于先进封装技术的兴起。在诸多应用场景中,先进封装技术能够提供相较于传统平面系统级芯片(SoC)更短、更强且更强大的数据传输路径。在最近的财报电话会议上,ASE投资者关系负责人Ken Hsiang强调:“先进封装技术正迎来蓬勃发展期。无论是人工智能、网络技术,还是其他前沿研发领域,对我们先进互连技术及其各类形态的需求均呈现出极为旺盛的态势。”


在此背景下,HBM技术恰好契合了这一需求趋势。三星半导体副总裁兼DRAM产品规划负责人Indong Kim在近期演讲中指出:“HBM架构正迎来一场革命性的浪潮,即定制化HBM。随着AI基础设施的迅速扩张,对极致效率与横向扩展能力的需求日益迫切。我们与核心客户达成共识,认为基于HBM的AI定制化方案将是迈向这一目标的关键一步。在AI解决方案中,功耗、性能与面积(PPA)是核心考量因素,而定制化将在这些方面展现出巨大的价值。”


然而,在过去,高昂的经济成本一直是制约HBM广泛应用的重大障碍。硅中介层成本不菲,同时在前端线(FEOL)晶圆厂中处理大量硅通孔(TSV)亦是一笔不小的开支。ASE工程和技术营销高级总监Lihong Cao指出:“随着高性能计算(HPC)、人工智能及机器学习需求的激增,中介层尺寸显著增大。高成本无疑是2.5D硅中介层TSV技术面临的主要挑战。”


尽管这在一定程度上限制了HBM在大众市场的普及度,但在对成本敏感度较低的应用领域,如数据中心,其需求依然强劲。HBM所提供的带宽优势,是其他任何内存技术都难以企及的,而采用微凸块与TSV(硅通孔)技术的2.5D集成方案,已成为业界公认的标准。


客户对于性能的追求永无止境,这正是HBM制造商不断探索改进凸块结构、凸块下及成型材料的原因所在。同时,从8层到12层,再到16层的DRAM模块升级,使得数据处理速度达到了前所未有的高度。HBM3E模块的数据处理速率已高达每秒4.8TB(基于HBM3标准),并有望在HBM4上实现每秒1TB的惊人速度。HBM4实现这一飞跃的关键策略之一,便是将数据线数量从HBM3的1024条翻倍至2048条。


目前,全球仅有三家公司能够生产HBM内存模块,它们分别是美光、三星和SK海力士。尽管这三家公司都采用了硅通孔与微凸块技术,以确保DRAM堆栈与配套设备能够可靠地集成到先进封装中,但它们在实现这一目标的具体方法上却各有千秋。三星与美光在每个凸块层上都使用了非导电薄膜(NCF)与热压键合(TCB)技术,而SK海力士则继续沿用倒装芯片大规模回流工艺的模塑底部填充(MR-MUF)方案,该方案仅需一步即可将堆栈密封于高导电性模塑材料中。


HBM中的垂直连接是通过铜TSV与堆叠DRAM芯片之间的缩放微凸块来实现的,而下部缓冲器/逻辑芯片则为每个DRAM提供了数据路径。可靠性问题在很大程度上取决于回流、键合及模具背面研磨过程中的热机械应力。为了识别潜在问题,需要进行高温工作寿命(HTOL)、温度和湿度偏差(THB)以及温度循环测试。同时,还需结合预处理与无偏湿度和应力测试(uHAST),以确定各层之间的粘附水平。


此外,还需进行其他一系列测试,以确保在长期使用过程中不会出现微凸块短路、金属桥接或芯片与微凸块之间界面分层等问题。混合键合技术被视为HBM4代产品微凸块的一种潜在替代方案,但前提是必须克服良率方面的挑战。


图1:HBM堆栈可实现最大数据吞吐量。

来源:Rambus


另一项正在研发中的技术革新聚焦于3D DRAM设备,它借鉴了3D NAND的设计理念,实现了存储单元的翻转。三星的Kim先生指出:“3D DRAM堆叠技术将显著削减功耗并减小占用面积,同时有效消除中介层可能引发的性能瓶颈。通过将内存控制器从系统级芯片(SoC)迁移至基础裸片,我们能够为AI功能空出更多的逻辑空间。我们深信,定制化HBM将引领性能和效率迈向全新高度。内存与代工能力的深度融合将加速产品上市时间,并为大规模部署提供品质卓越的产品。”


图2:三星的DRAM路线图和创新。

来源:Semiconductor Engineering/MemCon 2024


总体趋势是倾向于将逻辑组件更靠近内存部署,旨在实现更多在内存内部或周边的数据处理,而非将数据远距离传输至一个或多个处理单元。然而,从系统设计的角度来看,这一目标的实现远比听起来更为错综复杂。


“我们正置身于一个激动人心的时代。随着人工智能的蓬勃发展,HBM已成为不可或缺的关键要素。各大内存制造商正争分夺秒,力求率先推出下一代HBM产品,”Lam Research公司先进封装技术总监CheePing Lee如是说道。


下一代产品即为HBM4,目前JEDEC正紧锣密鼓地制定这一模块的相关标准。与此同时,JEDEC还将HBM3E标准的最大内存模块厚度从720微米扩展至775微米,这一调整依然能够容纳40µm厚的芯片。HBM标准详细规定了每针传输速率、每堆栈最大芯片数量、最大封装容量(以GB为单位)以及带宽等关键参数。遵循此类标准,能够极大地简化设计与流程,从而加速HBM产品的市场化进程——目前每两年即有一次更新换代。即将出台的HBM4标准将定义24Gb和32Gb层,以及4层、8层、12层和16层高TSV堆栈。


HBM的演变


高带宽存储器的研发历程可追溯至2008年,彼时是为了应对计算存储器领域日益严峻的功耗增长与空间占用的挑战。据三星的Sungmock Ha及其团队所述,“在当时的技术背景下,GDDR5作为具有高带宽的DRAM,其带宽被限定在28GB/s(即7Gbps/引脚乘以32个输入/输出端口)”。然而,技术的车轮滚滚向前,HBM Gen2的诞生标志着一次重大飞跃,它通过不降低频率至2.4Gbps,反而将I/O端口数量增至1,024个,成功实现了307.2GB/s的带宽突破。


随后,随着HBM2E的推出,采用了先进的17纳米高k金属栅极技术,进一步将每引脚的传输速率提升至3.6Gbps,带宽也随之跃升至460.8GB/s的新高度。现在,HBM3再次引领革新,引入了前所未有的每引脚6.4Gbps的传输速率,并辅以8至12个芯片的堆叠设计,相较于上一代,带宽性能实现了约两倍的增长。


但这仅仅是HBM技术持续演进故事的一个章节。HBM始终致力于优化性能,不断拓宽其应用场景与处理能力,为多元化的计算需求开辟了广阔的道路。


大规模回流焊技术是当前最为成熟且最具成本效益的焊接解决方案。“鉴于安装所需的巨额资本支出与相对较低的成本比,只要条件允许,大规模回流焊几乎总是被优先考虑,”Amkor公司工程与技术营销副总裁Curtis Zwenger强调道。“该技术持续提供一种经济实惠且高效的方式,用于将芯片与高端模块连接到封装基板上。然而,随着性能要求的不断提升,以及异构集成模块与高级基板解决方案空间的日益扩大,一个直接的后果便是异构集成模块与基板的翘曲程度加剧。为了应对这一挑战,热压技术和R-LAB(反向激光辅助键合)作为传统大规模回流焊的工艺升级,展现出了在处理更高程度翘曲方面的卓越能力,无论是在异构集成模块层面还是在封装层面。”


微凸块金属化技术经过精心优化,旨在进一步提升其可靠性。若微凸块与焊盘之间的连接采用传统的回流工艺,并辅以助焊剂和底部填充材料,这在细间距应用中尤为常见,但底部填充空洞的捕获以及助焊剂残留物可能会成为凸块间夹层形成的诱因。为了有效规避这些问题,预涂非导电膜(NCF)技术应运而生,它能够在一步键合工艺中同时替代助焊剂、底部填充及键合步骤,从而彻底消除了底部填充空洞捕获与助焊剂残留物的隐患。


三星在其12层HBM3E产品中创新性地运用了热压粘合技术,采用了薄型非导电膜(NCF),据官方宣称,其高度规格与8层堆栈不相上下,却实现了高达1,280GB/s的带宽与36GB的惊人容量。NCF主要由环氧树脂构成,并融入了固化剂及其他功能性添加剂。这一技术有望在高堆叠情况下发挥更大的优势,特别是在当前业界正积极寻求解决方案以缓解芯片变薄所带来的翘曲问题时。三星在每一代产品的迭代中,都会精细调整NCF材料的厚度,其关键在于确保凸块周围底部填充区域的完全填充(为凸块提供必要的缓冲),同时促进焊料的流畅流动,避免任何空隙的产生。


SK海力士则在其HBM2E系列中首次从NCF-TCB转向了大规模回流模塑底部填充技术。这种导电模具材料是与材料供应商携手研发的,可能采用了独特的注射工艺。凭借这一技术,SK海力士通过其大规模回流工艺展示了出色的晶体管结温控制。


在HBM中,DRAM堆栈被巧妙地安置在缓冲芯片之上。随着各大厂商致力于在基础芯片上集成更多逻辑功能以降低功耗,同时确保每个DRAM核心与处理器的有效连接,缓冲芯片的功能日益丰富。整个制造流程包括将每个芯片精准地拾取并放置在载体晶圆上,随后进行焊料回流,形成最终的堆栈结构。经过背面研磨、清洁及切割等精细工序后,产品得以完成。值得一提的是,台积电与SK海力士已宣布,该代工厂将为内存制造商提供这一关键的基础芯片。


新思科技研发总监Sutirtha Kabir指出:“逻辑存储器始终是人们关注的焦点。尽管这一领域的研究历史悠久,但未来依然充满可能。然而,每种解决方案都不可避免地会遇到功耗与热的双重挑战,这两者紧密相关,互为影响。特别是热应力,它不仅仅局限于组装层级,而是会对整个系统产生直接影响。考虑到可能会采用混合键合或极细间距键合技术,热问题对机械应力的具体影响更是值得深入探讨。”


此外,基础逻辑产生的热量还会在逻辑芯片与DRAM芯片之间的接口处诱发热机械应力。鉴于HBM模块通常紧邻处理器布置,逻辑芯片产生的热量无可避免地会传导至内存模块。“我们的数据揭示了一个现象:当主机芯片温度升高2°C时,HBM端的温度将至少攀升5°C-10°C,”SK海力士高级技术经理Younsoo Kim补充道。


NCF TCB工艺同样面临着其他挑战。在高温高压条件下进行的热压键合,可能会引发2.5D组装中的一系列问题,如凸块与底层镍垫之间的金属桥接或界面分层。而且,TCB工艺本身的产量相对较低。


对于任何形式的多芯片堆叠而言,翘曲问题往往与表面材料的膨胀系数(TCE)不匹配息息相关,这种不匹配会在加工和使用过程中的温度循环中产生应力。应力通常集中在几个关键部位,包括基础裸片与第一个内存芯片之间,以及微凸块层级。虽然通过产品仿真模型可以在一定程度上解决这些问题,但有时问题产生的全面影响只有在实际产品中才能得到充分展现。


结语


AI应用的顺畅运行高度依赖于多个DRAM芯片、穿透硅通孔(TSV)、集成了基本逻辑功能(可能包含内存驱动器)的芯片,以及多达100个去耦电容器的精确组装与封装。与图形处理器、CPU或其他类型处理器的结合,是一项精密策划的组装工程,要求所有组件必须无缝协作,以确保系统的高产出与可靠性。


随着行业从HBM3向HBM4的迈进,制造高性能DRAM堆栈的工艺无疑将变得更加错综复杂。然而,供应商与芯片制造商并未止步,他们正积极探寻成本效益更高的替代方案,旨在进一步扩大这些高速且不可或缺的内存芯片堆栈的市场应用。


END

TechSugar 做你身边值得信赖的科技新媒体
评论
  • 村田是目前全球量产硅电容的领先企业,其在2016年收购了法国IPDiA头部硅电容器公司,并于2023年6月宣布投资约100亿日元将硅电容产能提升两倍。以下内容主要来自村田官网信息整理,村田高密度硅电容器采用半导体MOS工艺开发,并使用3D结构来大幅增加电极表面,因此在给定的占位面积内增加了静电容量。村田的硅技术以嵌入非结晶基板的单片结构为基础(单层MIM和多层MIM—MIM是指金属 / 绝缘体/ 金属) 村田硅电容采用先进3D拓扑结构在100um内,使开发的有效静电容量面积相当于80个
    知白 2025-01-07 15:02 66浏览
  • 自动化已成为现代制造业的基石,而驱动隔离器作为关键组件,在提升效率、精度和可靠性方面起到了不可或缺的作用。随着工业技术不断革新,驱动隔离器正助力自动化生产设备适应新兴趋势,并推动行业未来的发展。本文将探讨自动化的核心趋势及驱动隔离器在其中的重要角色。自动化领域的新兴趋势智能工厂的崛起智能工厂已成为自动化生产的新标杆。通过结合物联网(IoT)、人工智能(AI)和机器学习(ML),智能工厂实现了实时监控和动态决策。驱动隔离器在其中至关重要,它确保了传感器、执行器和控制单元之间的信号完整性,同时提供高
    腾恩科技-彭工 2025-01-03 16:28 170浏览
  • 根据Global Info Research项目团队最新调研,预计2030年全球封闭式电机产值达到1425百万美元,2024-2030年期间年复合增长率CAGR为3.4%。 封闭式电机是一种电动机,其外壳设计为密闭结构,通常用于要求较高的防护等级的应用场合。封闭式电机可以有效防止外部灰尘、水分和其他污染物进入内部,从而保护电机的内部组件,延长其使用寿命。 环洋市场咨询机构出版的调研分析报告【全球封闭式电机行业总体规模、主要厂商及IPO上市调研报告,2025-2031】研究全球封闭式电机总体规
    GIRtina 2025-01-06 11:10 103浏览
  • 每日可见的315MHz和433MHz遥控模块,你能分清楚吗?众所周知,一套遥控设备主要由发射部分和接收部分组成,发射器可以将控制者的控制按键经过编码,调制到射频信号上面,然后经天线发射出无线信号。而接收器是将天线接收到的无线信号进行解码,从而得到与控制按键相对应的信号,然后再去控制相应的设备工作。当前,常见的遥控设备主要分为红外遥控与无线电遥控两大类,其主要区别为所采用的载波频率及其应用场景不一致。红外遥控设备所采用的射频信号频率一般为38kHz,通常应用在电视、投影仪等设备中;而无线电遥控设备
    华普微HOPERF 2025-01-06 15:29 125浏览
  • 彼得·德鲁克被誉为“现代管理学之父”,他的管理思想影响了无数企业和管理者。然而,关于他的书籍分类,一种流行的说法令人感到困惑:德鲁克一生写了39本书,其中15本是关于管理的,而其中“专门写工商企业或为企业管理者写的”只有两本——《为成果而管理》和《创新与企业家精神》。这样的表述广为流传,但深入探讨后却发现并不完全准确。让我们一起重新审视这一说法,解析其中的矛盾与根源,进而重新认识德鲁克的管理思想及其著作的真正价值。从《创新与企业家精神》看德鲁克的视角《创新与企业家精神》通常被认为是一本专为企业管
    优思学院 2025-01-06 12:03 113浏览
  • 大模型的赋能是指利用大型机器学习模型(如深度学习模型)来增强或改进各种应用和服务。这种技术在许多领域都显示出了巨大的潜力,包括但不限于以下几个方面: 1. 企业服务:大模型可以用于构建智能客服系统、知识库问答系统等,提升企业的服务质量和运营效率。 2. 教育服务:在教育领域,大模型被应用于个性化学习、智能辅导、作业批改等,帮助教师减轻工作负担,提高教学质量。 3. 工业智能化:大模型有助于解决工业领域的复杂性和不确定性问题,尽管在认知能力方面尚未完全具备专家级的复杂决策能力。 4. 消费
    丙丁先生 2025-01-07 09:25 80浏览
  • 这篇内容主要讨论三个基本问题,硅电容是什么,为什么要使用硅电容,如何正确使用硅电容?1.  硅电容是什么首先我们需要了解电容是什么?物理学上电容的概念指的是给定电位差下自由电荷的储藏量,记为C,单位是F,指的是容纳电荷的能力,C=εS/d=ε0εrS/4πkd(真空)=Q/U。百度百科上电容器的概念指的是两个相互靠近的导体,中间夹一层不导电的绝缘介质。通过观察电容本身的定义公式中可以看到,在各个变量中比较能够改变的就是εr,S和d,也就是介质的介电常数,金属板有效相对面积以及距离。当前
    知白 2025-01-06 12:04 167浏览
  • 本文介绍Linux系统更换开机logo方法教程,通用RK3566、RK3568、RK3588、RK3576等开发板,触觉智能RK3562开发板演示,搭载4核A53处理器,主频高达2.0GHz;内置独立1Tops算力NPU,可应用于物联网网关、平板电脑、智能家居、教育电子、工业显示与控制等行业。制作图片开机logo图片制作注意事项(1)图片必须为bmp格式;(2)图片大小不能大于4MB;(3)BMP位深最大是32,建议设置为8;(4)图片名称为logo.bmp和logo_kernel.bmp;开机
    Industio_触觉智能 2025-01-06 10:43 87浏览
  •     为控制片内设备并且查询其工作状态,MCU内部总是有一组特殊功能寄存器(SFR,Special Function Register)。    使用Eclipse环境调试MCU程序时,可以利用 Peripheral Registers Viewer来查看SFR。这个小工具是怎样知道某个型号的MCU有怎样的寄存器定义呢?它使用一种描述性的文本文件——SVD文件。这个文件存储在下面红色字体的路径下。    例:南京沁恒  &n
    电子知识打边炉 2025-01-04 20:04 98浏览
  • By Toradex 秦海1). 简介嵌入式平台设备基于Yocto Linux 在开发后期量产前期,为了安全以及提高启动速度等考虑,希望将 ARM 处理器平台的 Debug Console 输出关闭,本文就基于 NXP i.MX8MP ARM 处理器平台来演示相关流程。 本文所示例的平台来自于 Toradex Verdin i.MX8MP 嵌入式平台。  2. 准备a). Verdin i.MX8MP ARM核心版配合Dahlia载板并
    hai.qin_651820742 2025-01-07 14:52 40浏览
  • PLC组态方式主要有三种,每种都有其独特的特点和适用场景。下面来简单说说: 1. 硬件组态   定义:硬件组态指的是选择适合的PLC型号、I/O模块、通信模块等硬件组件,并按照实际需求进行连接和配置。    灵活性:这种方式允许用户根据项目需求自由搭配硬件组件,具有较高的灵活性。    成本:可能需要额外的硬件购买成本,适用于对系统性能和扩展性有较高要求的场合。 2. 软件组态   定义:软件组态主要是通过PLC
    丙丁先生 2025-01-06 09:23 83浏览
  • 在智能家居领域中,Wi-Fi、蓝牙、Zigbee、Thread与Z-Wave等无线通信协议是构建短距物联局域网的关键手段,它们常在实际应用中交叉运用,以满足智能家居生态系统多样化的功能需求。然而,这些协议之间并未遵循统一的互通标准,缺乏直接的互操作性,在进行组网时需要引入额外的网关作为“翻译桥梁”,极大地增加了系统的复杂性。 同时,Apple HomeKit、SamSung SmartThings、Amazon Alexa、Google Home等主流智能家居平台为了提升市占率与消费者
    华普微HOPERF 2025-01-06 17:23 141浏览
  • 随着市场需求不断的变化,各行各业对CPU的要求越来越高,特别是近几年流行的 AIOT,为了有更好的用户体验,CPU的算力就要求更高了。今天为大家推荐由米尔基于瑞芯微RK3576处理器推出的MYC-LR3576核心板及开发板。关于RK3576处理器国产CPU,是这些年的骄傲,华为手机全国产化,国人一片呼声,再也不用卡脖子了。RK3576处理器,就是一款由国产是厂商瑞芯微,今年第二季推出的全新通用型的高性能SOC芯片,这款CPU到底有多么的高性能,下面看看它的几个特性:8核心6 TOPS超强算力双千
    米尔电子嵌入式 2025-01-03 17:04 55浏览
  • 根据环洋市场咨询(Global Info Research)项目团队最新调研,预计2030年全球无人机锂电池产值达到2457百万美元,2024-2030年期间年复合增长率CAGR为9.6%。 无人机锂电池是无人机动力系统中存储并释放能量的部分。无人机使用的动力电池,大多数是锂聚合物电池,相较其他电池,锂聚合物电池具有较高的能量密度,较长寿命,同时也具有良好的放电特性和安全性。 全球无人机锂电池核心厂商有宁德新能源科技、欣旺达、鹏辉能源、深圳格瑞普和EaglePicher等,前五大厂商占有全球
    GIRtina 2025-01-07 11:02 63浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦