支持9.6Gbps的数据传输速率,意味着相比HBM3 Gen1 6.4Gbps的性能,最新HBM3内存控制器的总内存吞吐量超过了1.2TB/s,这对生成式AI、以及其他要求苛刻的数据中心工作负载来说,无疑是个好消息。

根据OpenAI的数据,自 2012年以来,最大规模的AI训练所使用的计算量以每年10倍的速度增长。以OpenAI的ChatGPT为例,2022年11月发布的GPT-3使用1750亿个参数构建,而2023年3月发布的GPT-4就使用了超过1.5万亿个参数。

Rambus接口IP产品管理和营销副总裁Joe Salvador认为AI训练数据集增长的原因来自以下三方面:AI模型日益复杂大量在线数据被生成并用于训练随着AI被应用于新的领域,人们对 AI准确性和稳健性的期望持续升高,当以上趋势转化为对内存的需求时,实际上就意味着更高的带宽和更高的容量,高带宽内存(HBM)在这样的背景下一跃成为当前半导体行业的“顶流”,AI训练硬件的首选,其实并不令人感到意外。

Rambus接口IP产品管理和营销副总裁Joe Salvator

HBM新的性能里程碑

众所周知,AI行业目前最常见的两大主流应用分别是AI训练和AI推理。对于AI训练来说,它需要建立一个模型,并提供大量数据,从而让它能够进行分析和掌握其中包含的信息;而AI推理则是通过已经训练好的AI模型去实时运行新的数据,做出相应的预测,并产生相应的结果。

显而易见,AI训练和AI推理分属不同的应用领域,它们对于处理器、内存等硬件的需求也不一样——AI训练需要大量优质数据和较长的计算周期,是HBM最常被使用的领域;而AI推理是速度更快、能效更高的应用,绝大部分情况下GDDR/LPDDR等内存类型就可满足。当然,在一些混合交叉使用的情况下,也有部分用户会在AI推理中使用HBM技术。

HBM技术于2013年推出,是一种高性能2.5D/3D堆栈DRAM构架,包含了中介层、处理器和内存堆栈,数据传输速率大概可以达到1Gbps左右。此后,该技术标准差不多每隔2-3年就会更新一代,使得此后每一代产品的带宽和最高数据传输速率记录被不断刷新。鉴于同期内其他产品的带宽仅增加两到三倍,我们有理由将HBM产品的快速发展归功于存储器制造商之间激烈的竞争。

日前,为了增强AI/ML训练、生成式AI、以及其他要求苛刻的数据中心工作负载,Rambus最新推出了可提供高达9.6Gbps性能的HBM3内存控制器IP。相比HBM3 Gen1 6.4Gbps的数据速率,Rambus HBM3内存控制器的数据速率提高了50%,总内存吞吐量超过1.2TB/s。即便是面对当前主流的8.4Gbps传输速率,也是具备明显优势的。

Rambus HBM3控制器模块图

Rambus HBM3控制器不仅仅作为独立的产品推出,而是一整套完整的、经过验证的解决方案,能够跟SK海力士、美光、三星等比较常见的HBM3以及相关的内存模组进行匹配。此外,Rambus也与西门子旗下公司Avery 在验证IP方面展开合作,支持HBM3内存模块BFM(活动和监控模式)、主机内存控制器BFM和HBM3 PHY BFM等功能。

不过,需要指出的是,即便英伟达H200宣称已采用了HBM3E,几家主流内存厂商也都发布了HBM3E内存,但从标准规格的角度来说,目前所说的HBM3E还不是正式的行业标准,而是9.6Gbps的HBM3。至于后续HBM4的规格和标准,目前业界有许多预测,但都还处于研究阶段。

设计挑战犹存

HBM内存控制器的设计面临诸多挑战。首先是对于总体架构设计的复杂度和了解程度,毕竟要在高性能、低功耗和低成本之间找到平衡点,不是一件容易的事情。其次,要考虑与主流内存厂商产品组件、物理层的兼容性和性能验证,就必须共同构建相应的测试环境和验证环节,客户的子系统设计才更容易成功。同时,在架构设计时还要预留一定的自定义配置空间,允许客户根据不同需求来选择相应的控制器。

Salvador在接受本刊采访时指出,尽管不断演进的HBM技术对于数据通路的宽度基本上是相同的要求,但是其他方面还是有很多不同的需求,例如PHY对于制程工艺有明确的需求,而控制器则是可以支持多个不同的制程工艺。

而在谈及当前限制HBM发展的两大主要原因:一是中介层,二是2.5D/3D堆叠带来的复杂性和制造成本的增加话题时,他强调称,目前整个行业都在努力推动相关成本的下降,但比起成本下降的缓慢,我们更应该看到市场对于更加快速、更加高能效内存的需求永远得不到满足的现实状态,“很多应用场景所需要的内存带宽和吞吐量都是越快越好、越高越好”。

今年9月,Rambus将PHY IP业务出售给了Cadence公司,以便能够更加专注于芯片和数字IP业务。Salvador对此回应称,出售前Rambus的PHY业务发展的非常好,但控制器IP是提供给包括Cadence以及其他PHY IP合作伙伴的。当把PHY业务出售之后,就可以更好地与其他PHY合作伙伴合作,因为彼此间已经不构成直接的竞争关系。

“控制器IP可以跟客户所选择的PHY进行很好的结合,并且能够通过大量的测试和验证确保一次流片成功,这对于客户来说是很大的价值。”Salvador说HBM未来的应用领域将不限于在数据中心、高性能计算方面,比如现在已经有一些显卡在使用HBM内存,也有可能会进入汽车行业,尽管目前还没有看到哪家公司推出经过验证的车规级芯片使用HBM内存,但前景可期。

责编:Lefeng.shao
本文为EET电子工程专辑原创文章,禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
阅读全文,请先
您可能感兴趣
A某现年50多岁,居住在安徽省合肥市,被逮捕前在一家中国芯片公司工作,与妻子和两个女儿共同生活。去年12月,合肥市国家安全局的调查人员将A某从家中带走,并在当地酒店隔离调查了5个多月……
随着AI和HPC芯片需求的不断增加,半导体产业在不断挑战性能极限的同时,也面对着传统封装技术的限制。为了延续摩尔定律,先进封装成为满足这些新兴应用需求的核心策略。
众所周知,FD-SOI工艺停留在22nm已经很久了,直到意法半导体和三星联合推出18FDS才打破了这一沉寂。除此之外,目前有明确进一步发展更先进工艺的,只有格罗方德的12FDX(12nm),但还未推出。在到达22nm之后,FD-SOI工艺是否有必要继续推进到12nm呢?
·结合并收入为17.5731万亿韩元,营业利润为7.03万亿韩元,净利润为5.7534万亿韩元……季度业绩创历史新高;·凭借公司面向AI的存储器全球领先技术实力,扩大高附加值产品的销售,实现最大规模的季度业绩;·适用于AI服务器的存储器需求持续表现强势,第三季度DRAM总销售额中HBM比重达到30%,第四季度预计高达40%;·“公司明年也将引领面向AI的存储器市场……确保业务的稳定性和盈利以夯实长期发展的基础”
SK海力士推出的路线图显示,该公司将继续主导人工智能不可或缺的高带宽内存的生产。业内专家告诉笔者,该公司相对于竞争对手三星和美光的领先地位将面临更激烈的竞争。
AI技术使存储和内存开始与系统架构进行更紧密的集成和优化;其次,能效成为了设计时考虑的关键因素之一。
微电子和软件技术的快速发展正在深刻地改变车载娱乐中控和安全系统设计,重新定义驾驶体验。
本系列文章从数字芯片设计项目技术总监的角度出发,介绍了如何将芯片的产品定义与设计和验证规划进行结合,详细讲述了在FPGA上使用硅知识产权(IP)内核来开发ASIC原型项目时,必须认真考虑的一些问题。
在即将到来的慕尼黑国际电子元器件博览会(electronica 2024)上,英飞凌科技股份公司将展示其创新的解决方案如何推动全球低碳化和数字化进程,充分展现半导体产品如何为实现净零经济铺平道路,并释放人工智能的全部潜力。
vivo旗下品牌iQOO正式发布了年度性能旗舰iQOO 13,除了高通骁龙8芯片、vivo自研的电竞芯片Q2外,最值得一提的是还采用了汇顶科技提供的多项创新技术,包括超声波指纹识别、新一代屏下光线传感器以及智能音频放大器与软件方案。
国芯网[原:中国半导体论坛] 振兴国产半导体产业!   不拘中国、放眼世界!关注世界半导体论坛↓↓↓10月31日消息,据报道,一名在华韩国人A某因涉嫌违反《中华人民共和国反间谍法》被逮捕!我外交部29
GIPHY平台于2023年被Shutterstock收购,每天触达超过10亿用户。美通社消息,作为全球最大的GIF和贴纸库,GIPHY与领先的移动短视频平台TikTok达成合作,旨在通过人工智能技术驱
论坛信息名称:2024先进封装技术与材料论坛时间:2024年12月26日地点:江苏苏州联合主办:亚化咨询日程安排12月25日16:00~20:00   会议注册12月26日09:00~12:00   
10月30日,据多家媒体报道,大运集团旗下高端新能源品牌远航汽车被自家员工曝出人员流失较为严重、延迟发放工资等情况。有自称是远航汽车研发部人士表示,底盘研发部门人员流失速度快,目前仅剩十余名员工坚守岗
10月29日,诺基亚与惠普宣布签署了一项多年专利授权协议,允许惠普公司在其设备中使用诺基亚的视频技术。诺基亚一年前曾表示,已在美国对惠普提起法律诉讼,指控惠普未经授权使用诺基亚专利的视频相关技术,但本
国芯网[原:中国半导体论坛] 振兴国产半导体产业!   不拘中国、放眼世界!关注世界半导体论坛↓↓↓10月31日消息,据外媒报道,英特尔CEO基辛格上任3年,搞砸了和台积电的关系,在公司处于困境的时刻
2024年10月标准动态英文标准发布IPC-7095E BGA 设计与组装工艺的实施适用行业:1. PCB Fabricator/Manufacturer2. EMS/Assembly/Contrac
东芝电子元件今日宣布,开始提供适用于3相直流无刷电机的栅极驱动[1]IC——“TB9084FTG”的工程样品。这款器件可用于驱动包括车身系统应用[2]、电动泵以及电机发电机[3]在内的关键车载功能。该
在人工智能、安全和互连不断发展的时代,我们为您准备了FPGA创新的最前沿资讯,助您进一步提升系统设计和开发水平。您可以在莱迪思开发者大会上探索相关趋势、挑战和机遇,发现最新的低功耗FPGA解决方案!莱
本文来源:智能通信定位圈01蜂窝物联网行业寡头效应正加剧表:历年蜂窝物联网模组Top5企业在全球范围内的市场份额(按出货量)数据来源:Counterpoint Research在总的出货量上,2022