HBM是一种可以实现高带宽的高附加值DRAM产品,适用于超级计算机、AI加速器等对性能要求较高的计算系统。过去八年来,HBM产品带宽增加了七倍,目前已接近1TB/秒的里程碑节点,而本文将着重探讨如何通过卓越的设计工艺来提高产品性能或创造速度优势。

高带宽存储器(HBM, High Bandwidth Memory)是一种可以实现高带宽的高附加值DRAM产品,适用于超级计算机、AI加速器等对性能要求较高的计算系统。随着计算技术的发展,机器学习的应用日渐广泛,而机器学习的基础是自20世纪80年代以来一直作为研究热点的神经网络模型。作为速度最快的DRAM产品,HBM在克服计算技术的局限性方面发挥着关键的作用。

HBM的高带宽离不开各种基础技术和先进设计工艺的支持。由于HBM是在3D结构中将一个逻辑die与4-16个DRAM die堆叠在一起,因此开发过程极为复杂。鉴于技术上的复杂性,HBM是公认最能够展示厂商技术实力的旗舰产品。

从2015年推出HBM1到2021年10月开发业界第一款HBM3 DRAM,SK海力士一直是HBM行业的领军企业。SK海力士的HBM产品大获成功的首要因素是产品特性,具体而言,产品设计在保证市场竞争力方面发挥了重要作用。SK海力士HBM设计团队负责将产品规格落实到实际电路中,同时开发配套的产品架构和设计技术,以确保准确实现产品功能、高性能和低功耗特性。得益于对产品的全面了解,HBM设计团队还在未来产品规划及规格定义方面发挥着至关重要的作用。此外,HBM设计团队会聆听客户反馈,并围绕问题展开分析。

产品特性通常分为三类:性能、功耗和面积,即PPA (Power, Performance, Area)。本文着重探讨如何通过卓越的设计工艺来提高产品性能或创造速度优势。如前所述,HBM支持高带宽,而带宽指的是在特定单位时间内可以传输的数据量。由于具有高带宽的特性,HBM主要应用于高性能计算场景。

通过机器学习解决偏移问题

过去八年来,HBM产品带宽增加了七倍,目前已接近1TB/秒的里程碑节点。鉴于同期内其他产品的带宽仅增加两到三倍,我们有理由将HBM产品的快速发展归功于存储器制造商之间激烈的竞争。

<图1: ISSCC上发表的HBM相关文章的趋势 >

存储器带宽指单位时间内可以传输的数据量,要想增加带宽,最简单的方法是增加数据传输线路的数量。事实上,每个HBM由多达1024个数据引脚组成,HBM内部的数据传输路径随着每一代产品的发展而显著增长,如图2所示。

<图 2: 各代HBM产品的数据传输路径配置>

但是,芯片的尺寸限制了传输路径的增加。因为增加的不仅是数据传输线路,还有使用每条传输线路的传输/接收电路。此外,随着传输线路的增加,等量匹配每条传输线路长度和配置的难度加大,使得运行速度无法提升。 

传输线路之间的时序差异就是我们所说的偏移。为了减少偏移,每条传输线路的总长度和电子元件应采用相似的设计。然而,HBM有数千条内部传输线路,逐一匹配几乎是不可能的任务。为此,SK海力士引入了机器学习。强化学习(Reinforcement learning)技术可以在每条传输线路上附加多余的传输路径,无需工程师手动作业,即可精确地优化偏移问题,由此减少整个传输路径间的偏移。

<图3: 基于机器学习技术的信号线路优化>

图3显示了这一优化过程。一些90度弯曲的线路具有不同的特性,因此必须通过增加红色附加线的方式来减少偏移(Skew)。与初始的随机解决方案(如图3左侧所示)相比,强化学习技术的使用可以带来最优结果(如右图所示)。通过这种方法,偏移从100皮秒(100ps)缩短至70皮秒(70ps),降幅达30%。

通过PVT感知时序优化来提高速度

即使偏移问题得到优化,各种信号之间相对时序关系的匹配仍然是一个难题。例如,每32个数据信号对应一个时钟信号(clock signal)*,如果需要由时钟信号来控制数据信号,那么时钟信号必须采用与数据信号不同的电路。电路配置的差异也会导致关系的变化,具体取决于工艺、电压、温度(PVT)的变化。无论何种情况下,时钟都必须位于数据的特定时序部分。但是,随着运行速度的提升,时序部分会减少,由此增加了设计复杂度。

* 时钟信号(clock signal):在同步数字电路中,时钟信号在高位和低位状态之间振荡,并且像节拍器一样用于协调数字电路的动作。

为了解决这一问题,SK海力士采用PVT感知时序优化技术来检测HBM3中的PVT变化,以找到最佳时序。这项技术可以确定单元电路的哪一个分级与精确循环的外部时钟输入具有相同的周期,并基于该数据自动优化主时序裕量电路(timing margin circuit)中的电路配置。如图4所示,随着PVT的变化,时钟时序通常会将时钟移动到一侧,而PVT感知时序优化技术可以在任何情况下让时钟始终保持在中心位置,以此来提高速度。

<图4:PVT感知时序优化技术>

为了增加作为HBM关键性能指标的带宽,SK海力士正在开发一系列设计技术,包括数据路径优化、基于机器学习的信号线路优化、PVT感知时序优化技术以及全新工艺技术等。基础die与典型DRAM工艺的不同之处在于基础die没有单元,利用这一特性,我们正在开发HBM优化工艺技术以及用于3D堆栈的先进封装技术。

通过上述一系列努力,SK海力士实现了HBM的快速发展。然而,为了满足客户不断增加的期望,打破现有框架进行新技术开发势在必行。此外,SK海力士还在与HBM生态系统中的参与者(客户、代工厂和IP公司等)通力合作,以提升生态系统等级。商业模式的转变同样是大势所趋。作为HBM领军企业,SK海力士将致力于在计算技术领域不断取得进步,全力实现HBM的长期发展。

责编:Lefeng.shao
阅读全文,请先
您可能感兴趣
Rambus的HBM4控制器IP还具备多种先进的特性集,旨在帮助设计人员应对下一代AI加速器及图形处理单元(GPU)等应用中的复杂需求。这些特性使得Rambus在HBMIP领域继续保持市场领导地位,并进一步扩展其生态系统支持。
HBM4作为第六代HBM芯片,不仅在能效上较现有型号提升40%,延迟也降低了10%,成为各大芯片厂商竞相追逐的焦点。
随着支持AI的应用程序的普及以及6400MT/s或更高速度成为主流,PC内存性能要求不断提高,使用CKD的系统数量将伴随时间的推移呈现显著增长的态势。
SK海力士29日宣布,全球首次成功开发出采用第六代10纳米级(1c)工艺的16Gb(Gigabit,千兆比特)DDR5 DRAM。由此,公司向世界展现了10纳米出头的超微细化存储工艺技术。
美光科技计划收购友达光电旗下的两家工厂,将主要用于扩充先进封装与高带宽内存(HBM)生产线。美光科技表示,此次收购的厂房将主要用于前段晶圆测试,以支持其在台中和桃园的DRAM生产扩张。
铠侠此次上市的主要目的是为了满足AI热潮对其芯片需求的增长。随着AI技术的快速发展,对高性能存储芯片的需求显著增加,铠侠希望通过上市来筹集资金,以进一步扩大其在NAND Flash市场的市场份额和技术研发能力。
• 得益于西欧、关键亚洲市场和拉丁美洲市场的增长,以及中国品牌的持续领先,全球折叠屏手机出货量在2024年第二季度同比增长了48%。 • 荣耀凭借其在西欧特别强劲的表现,成为最大的贡献者,成为该地区排名第一的品牌。 • 摩托罗拉的Razr 40系列在北美和拉丁美洲表现良好,为其手机厂商的出货量贡献了三位数的同比增长。 • 我们预计,头部中国手机品牌厂商的不断增加将至少在短期内抑制三星Z6系列在第三季度的发布。
AI技术的发展极大地推动了对先进封装技术的需求,在高密度,高速度,高带宽这“三高”方面提出了严苛的要求。
奕斯伟计算2024首届开发者伙伴大会以“绿色、开放、融合”为主题,从技术创新、产品应用、生态建设等方面,向开发者、行业伙伴等相关方发出开放合作倡议,加速RISC-V在各行各业的深度融合和应用落地,共同推动RISC-V新一代数字基础设施生态创新和产业发展。
2024年 Canalys 中国云计算渠道领导力矩阵冠军厂商分别是:阿里云、华为云和亚马逊云科技(AWS)
点击蓝字 关注我们德州仪器全球团队坚持克服挑战,为电源模块开发新的 MagPack™ 封装技术,这是一项将帮助推动电源设计未来的突破性技术。  ■ ■ ■作为一名经验丰富的马拉松运动员,Kenji K
文|德福很多去成都旅游的朋友都有个疑惑——为什么在成都官方的城市标志上看不到熊猫,而是一个圆环?其实这个“圆环”大有来头,它被唤作太阳神鸟,2001年出土于大名鼎鼎的金沙遗址,距今已有三千余年历史。0
‍‍Mobileye 将终止内部激光雷达开发Mobileye 宣布终止用于自动驾驶的激光雷达的开发,并裁员 100 人。Mobileye 认为,下一代 FMCW 激光雷达对可脱眼的自动驾驶来说必要性没
文|萝吉今年下半年开始,国内新能源市场正式跨过50%历史性节点,且份额依然在快速增长——7月渗透率破50%,8月份破55%……在这一片勃勃生机万物竞发的景象下,新能源市场占比最高的纯电车型,却在下半年
周二,捷普科技(Jabil)官员与印度泰米尔纳德邦代表团在泰米尔纳德邦首席部长MK Stalin的见证下,签署了一份备忘录。MK Stalin正在美国进行为期17天的访问,旨在吸引新的投资。MK St
天眼查信息显示,天津三星电子有限公司经营状态9月6日由存续变更为注销,注销原因是经营期限届满。该公司成立于1993年4月,法定代表人为YUN JONGCHUL(尹钟撤),注册资本约1.93亿美元,
会议预告向世界展示中国最具创新力、领导力和品牌化的产品与技术!9月27号,“第6届国际移动机器人集成应用大会暨复合机器人峰会”将在上海举行,敬请关注!逐个击破现有痛难点。文|新战略半导体行业高标准、灵
近日A股上市公司陆续完成2024年上半年业绩披露,其中24家SiC概念股上半年合计营收同比增长14.58%至1148.65亿元,研发费用同步增长7.22%至69.16亿元。尤为值得注意的是,天岳先进、
点击蓝字 关注我们准确的图像深度和细节对于安保摄像头、人脸识别设备和机器视觉设备至关重要,可以提供更真实且高保真的观看体验。为在具体应用中达到这一效果,需要具备某些图像传感器功能,其中之一就是自适应局
随着汽车智能化升级进入深水区,车载ECU(域)以及软件复杂度呈现指数级上升趋势。尤其是多域、跨域和未来的中央电子架构的普及,以及5G/V2X等车云通信的增强,如何保障整车的信息与网络安全,以及防范外部