随着AI推理越来越多地向边缘设备进行集成和转移,我们会把数据传输量大幅减少、边缘设备性能提升、延迟下降等优势迁移到边缘端,在这一过程中,凭借高带宽和低时延的特性,GDDR开始崭露头角。

市场对于数据的需求是无止境的,哪怕是一些增长已经开始放缓的市场,对数据的需求依旧是上升的。更不要提当下非常火爆的ChatGPT等人工智能相关的应用程序,它们的增长速度和对数据的需求更是十分惊人,例如ChatGPT-3就是以1750 亿个参数在进行训练。这些人工智能应用的快速发展,对处理器与带宽提出了更高的要求和标准。

“一直以来,业界始终存在着一个非常重要的误区,就是尽管算力的增长非常显著,但带宽上的进步却无法改善。也就是说,在现有高算力的基础之上,很多GPU资源并没有得到充分利用,从而造成了现在的困境。”Rambus IP核产品营销高级总监Frank Ferro说。

Rambus IP核产品营销高级总监Frank Ferro

GDDR/DDR/HBM/GDDRX,怎么选?

AI应用由两类任务组成:训练和推理,每类任务都有自己的要求——训练需要录入大量数据来进行分析,属于大算力、高耗时场景;推理层对算力的需求会有大幅下降,但对成本和功耗更加敏感。随着AI推理越来越多地向边缘设备进行集成和转移,我们会把数据传输量大幅减少、边缘设备性能提升、延迟下降等优势迁移到边缘端,在这一过程中,凭借高带宽和低时延的特性,GDDR开始崭露头角。

众所周知,GDDR内存最初是为了满足游戏机和PC的高性能图形计算需求而开发的,但现在越来越多的出现在了数据中心和网络应用中,Frank Ferro认为,GDDR的应用依旧会在整个图形领域继续获得良好的发展,但之所以会出现这样的转变,是因为GDDR有着优秀的数据传输速率,适用于很多边缘侧AI推理场景和网络应用。相比之下,如果选用DDR设备,无论是数量、成本还是功耗,都会面临巨大挑战。

以DDR4为例,尽管它的成本相对较低,但3.2Gb/s的运行速度也“令人抓狂”,而GDDR几年前就已经能够实现16Gb/s的带宽,是DDR4的3-4倍。此外,两者在容量密度、功耗等方面也存在着显著差异。所以,简单而言,如果将带宽视作主要标准和最重要的衡量因素,GDDR毫无疑问是最好的选择;但如果从存储密度和成本敏感性角度来看,DDR是更好的选择。

GDDR6在加速器上的高性能内存用例

在谈及HBM和GDDR6的应用差异时,Frank Ferro说如果把HBM用在AI推理上,尽管HBM能够提供800Gb带宽,但它超过了AI推理本身所需要的400-500Gb带宽,而且会使成本增加3-4倍,更适合AI训练这种需要更大带宽和更低延迟的应用场景。对于需要更大容量、更高带宽的AI推理场景,GDDR6是更合适的选择。

他同时否认了Rambus会开发GDDR6X相关技术或产品的说法。“GDDR6和GDDR6X都是行业非常优秀的技术,性能都可以达到非常高的水平,但前者是JEDEC标准,后者现在还是专利保护的技术,更多是以具体的客户需求为导向,这并不符合我们的初衷。”Frank Ferro强调说。

内存是未来AI性能的关键

为了能够向人工智能/机器学习(AI/ML)、图形和网络应用提供高成本效益、高带宽的内存性能,Rambus公司日前宣布推出24Gb/s GDDR6 PHY产品,能够为每个GDDR6内存设备带来96GB/s的带宽。除此之外,Rambus GDDR6 PHY还经过了全方位的优化,并可与Rambus GDDR6数字控制器IP相结合,形成完整的GDDR6内存接口子系统解决方案。

Frank Ferro将Rambus GDDR6 PHY IP的主要特点归结为以下五个方面:

  • 提供最高可达24Gb/s的数据传输速率,最大带宽为96GB/s;
  • 可与Rambus GDDR6数字控制器IP组合成完整的内存子系统解决方案,用户可在此基础上直接对子系统进行定制化开发;
  • 具有LabStation™开发环境,能够快速建立系统,进行特性分析和调试
  • 建立在Rambus 30年的领先高速信号完整性、电源完整性(SI/PI)专业知识基础上,可提供系统级信号完整性;
  • 提供参考设计以及对封装和PCB的支持;

在实际应用中,PHY物理层通过两个16位插槽与DRAM直接相连,另外一侧则是DFI接口与内存控制器进行连接,确保控制器直接接入整个系统的逻辑控制。之所以采用双读写通道,Frank Ferro解释说,进入GDDR6时代后,采用16位双读写通道已经成为趋势,32位的数据宽度能显著增加数据的传输速度和传输效率。同时,GDDR6内存还有8个这样的双读写通道,总共加起来可以实现256位的数据传输宽度,可以带来非常大的数据传输速率和系统效率提升,功耗管理上也可以获得进一步的优化。

此外,他还特别强调了clamshell模式——在该模式试下,每信道可支持两个GDDR6设备,从而使整个系统容量直接翻倍。“一般来说,AI推理应用对带宽的需求保持在200-500Gb/s范围内,而每一个GDDR6设备的带宽都可以达到96Gb/s,因此将4-5个GDDR6设备组合在一起,就可以轻松满足500Gb/s及以下的带宽需求。“Frank Ferro说。

责编:Lefeng.shao
本文为EET电子工程专辑原创文章,禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
  • 加油
您可能感兴趣
全球前十大高产机构中,9家为中国机构(如中国科学院、清华大学等)。其中,中国科学院以 2018-2023 年期间发布的 14,387 篇文章位居榜首。
这一新指导政策不仅反映了中国在芯片产业中减少对外依赖的战略意图,也体现了RISC-V架构在中国芯片产业中的重要地位和发展潜力。
这一成果不仅将芯片上的时间调控速度提升了 100 倍,时钟频率突破100GHz,还为未来智能计算、6G 通信、空天遥感等一系列现实应用的性能提升提供了强大支持。
在外观和部分组件方面,iPhone 16e 延续了 iPhone 14 的设计。它的外壳与 iPhone 14 相似,就连 Face ID 模组也完全一样……
此次风波始于2月28日,部分自媒体在小红书、微信公众号等平台发布《芯片界最大投资机构之一北京办公室关门》等文章,声称中芯聚源“北京办公室已关闭”、“上海团队人心涣散”、“仅剩最后一期基金”等……
此次调整被视为芯华章迈向规模化发展的关键一步,旨在应对半导体EDA市场日益激烈的竞争与技术挑战。
TEL宣布自2025年3月1日起,现任TEL中国区地区总部——东电电子(上海)有限公司高级执行副总经理赤池昌二正式升任为集团副总裁,同时兼任东电电子(上海)有限公司总裁和东电光电半导体设备(昆山)有限公司总裁。
预计在2025年,以下七大关键趋势将塑造物联网的格局。
领域新成果领域新成果4月必逛电子展!AI、人形机器人、低空飞行、汽车、新能源、半导体六大热门新赛道,来NEPCON China 2025一展全看,速登记!
本次股东大会将采取线上和线下相结合的混合形式召开,股东们可选择现场出席或线上参会。
今日光电     有人说,20世纪是电的世纪,21世纪是光的世纪;知光解电,再小的个体都可以被赋能。追光逐电,光引未来...欢迎来到今日光电!----追光逐电 光引未来----图1 采用自上而下方法实
今日光电     有人说,20世纪是电的世纪,21世纪是光的世纪;知光解电,再小的个体都可以被赋能。追光逐电,光引未来...欢迎来到今日光电!----追光逐电 光引未来----编者荐语特征提取是计算机
DeepSeek的崛起不仅是技术革新,更是一场从“机器语言”到“人类语言”的范式革命,推动了AGI时代到来。各个行业的应用场景不断拓展,为企业数字化发展带来了新机遇,同时也面临诸多挑战。不同企业在落地
国际电子商情讯,昨日(3月3日)晚间,TCL科技发布公告称,拟以115.62亿元收购深圳市华星光电半导体显示技术有限公司(以下简称深圳华星半导体)21.5311%股权。A股市场又一起百亿并购2025年
市值一夜蒸发2900亿”作者|王磊编辑|秦章勇特斯拉陷入一个怪圈。马斯克的权力越来越大,但特斯拉的股价却跌得越来越惨。就在昨天,特斯拉股价又下跌了4.43%,一天之内蒸发406亿美元,约合人民币295
从上表可知,2024年前三季度全球40强PCB企业总营收约416.7亿美元,同比增长7.6%。其中,营收排名第一位的是臻鼎科技(36.05亿美元),排名第2~5位的分别是欣兴电子(26.85亿美元)、
‍‍近几年,随着Mini/Micro LED技术的高速发展,LED产业呈现几大发展趋势,如LED显示间距持续缩小、LED芯片持续微缩化、产品、工艺制造环节更为集成,以及RGB 封装与COB 降本需求迫
据报道,小米集团总裁卢伟冰在西班牙巴塞隆纳的全球发表会上表示,小米汽车计划于2027年进军海外市场。小米的立足之本在于深耕本土市场,作为一家中国车企,唯有在国内市场站稳脚跟,方能谈及海外扩张。因此,小
如果说华为代表了国产手机芯片的最高水平,那么紫光展锐无疑就是国产中低端芯片最大的依持了。3月3日,巴塞罗那MWC世界移动通信大会上,紫光展锐正式发布手机芯片T8300。据了解,T8300采用的是6nm
 点击上方蓝字➞右上「· · ·」设为星标➞更新不错过★2025 年 3 月 12 日至 14 日  连续 3 晚 19:00 - 20:30德州仪器电力全开 为您带来 “高效 DC-DC 转换器的设