GTC2025大会本次市场关注点包括:
1、B300/GB300:Semianalysis预测B300基于N4P工艺,算力较B200提升50%;搭载12层HBM3e,提供最高288G内存和8TB/s带宽。
2、NVL288:英伟达将推出NVL144&NVL288作为下一代超节点创新产品,且在散热和超节点通信方面或采用UBB+OAM、正交背板连接等新系统设计。
3、CPO:英伟达将与台积电合作推出基于COwOS封装的CPO交换芯片,CPO交换机有助于解决传统可插拔光模块在带宽、延迟和能耗的瓶颈。
4、电源设计:面对单机柜功率向MW级迈进的趋势,英伟达或逐步引入400V/800V HVDC技术,并在GB300导入超级电容+锂电BBU以瞬时功率补偿,未来还有望推出集成PDU、PSU、超级电容、BBU的power rack将成为英伟达数据中心重要的基础单元。
- 内存速度是原版的1.5倍
- 单个Ultra芯片提供与Blackwell相同的20 petaflops AI性能
- 内存从192GB增加到288GB HBM3e
- DGX GB300 "Superpod"集群拥有300TB内存(原来是240TB)
人工智能已经取得了巨大的飞跃——推理和代理人工智能需要更高数量的计算性能。我们为这一刻设计了Blackwell Ultra——它是一个单一的多功能平台,可以轻松高效地进行预训练、后训练和推理人工智能推理。
未来产品路线图:从Blackwell到Vera Rubin再到Feynman
黄仁勋详细介绍了NVIDIA未来几年的产品路线图,这是NVIDIA首次如此清晰地展示其长期技术发展计划,让客户和合作伙伴能够提前规划他们的AI基础设施投资。
黄仁勋首先介绍了当前已在生产中的Blackwell架构,然后宣布了即将在2025年下半年发布的Blackwell Ultra、2026年下半年推出的Vera Rubin以及2027年下半年的Rubin Ultra。
1. Blackwell Ultra (2025年下半年)
黄仁勋表示:"在2025年下半年,我们将轻松过渡到升级版。所以我们有Blackwell Ultra,NVLink 72。它的实验室是原来的1.5倍。它有一个用于注意力的新指令。它的内存是原来的1.5倍。所有这些内存都可用于KB缓存等。它的网络带宽是原来的2倍。"
2. Vera Rubin (2026年下半年)
这一架构以发现暗物质的天文学家Vera Rubin命名。黄仁勋在现场特别致敬了Rubin的贡献,她的孙子们也出席了演讲。Vera Rubin架构将带来全新的CPU、GPU、网络和内存技术,NVLink数量增加到144。
"Vera Rubin有两个主要组件:一个称为Vera的CPU和一个称为Rubin的新GPU设计,具有NVLink 144。Vera是NVIDIA的首款定制CPU设计,它基于名为Olympus的核心设计。与Vera搭配使用时,Rubin可以在进行推理时实现每秒50千万亿次浮点运算,比Blackwell每秒20千万亿次浮点运算的速度高出一倍多。Rubin还可以支持高达288 GB的快速内存。"
黄仁勋还澄清了一个命名上的变化:"Blackwell实际上是两个独立的芯片组装在一起作为一个芯片工作。从Rubin开始,当将两个或多个芯片结合成一个单一芯片时,它会将这些芯片称为独立的GPU。"
3. Rubin Ultra (2027年下半年)
这是一个更加惊人的规格,将提供NVLink 576极端扩展能力,每个机架600千瓦,拥有250万个部件,计算能力达到15 exaFLOPS(是Blackwell的15倍),内存带宽达到4.6 petabytes/s(4,600 terabytes/s)。
"这是14倍更多的计算力,15 exaflops。从一个exaflop,正如我前面提到的,现在是15个exaflops扩展的exaflops。它是300,什么,4.6 petabytes,所以是4,600 terabytes每秒的扩展带宽。我不是指聚合带宽,我是指扩展带宽。当然,还有全新的NVLink开关和CX9。"
黄仁勋通过一个直观的对比展示了从Hopper到Blackwell再到Rubin架构的性能提升:Hopper是1x,Blackwell是68x,Rubin是900x。在TCO(总拥有成本)方面,Rubin将极大地降低成本,提高能效比。
最后,黄仁勋还透露,NVIDIA继Rubin之后的下一代芯片将以物理学家Richard Feynman的名字命名,进一步强调了NVIDIA对科学和创新的致敬。不过黄仁勋没有透露更多细节。我们只知道Nvidia计划于2028年的某个时候将它推向市场,取代Rubin Vera。
下载链接:
8、《3+份技术系列基础知识详解(星球版)》
《245+份DeepSeek技术报告合集》
《42篇半导体行业深度报告&图谱(合集)
亚太芯谷科技研究院:2024年AI大算力芯片技术发展与产业趋势
本号资料全部上传至知识星球,更多内容请登录智能计算芯知识(知识星球)星球下载全部资料。
免责申明:本号聚焦相关技术分享,内容观点不代表本号立场,可追溯内容均注明来源,发布文章若存在版权等问题,请留言联系删除,谢谢。
温馨提示:
请搜索“AI_Architect”或“扫码”关注公众号实时掌握深度技术分享,点击“阅读原文”获取更多原创技术干货。