英伟达三年AI芯片路线:从Blackwell到VeraRubin再到Feynman

智能计算芯世界 2025-03-20 07:59

图片
黄仁勋在演讲开始时,回顾了AI在过去十年的快速演进历程。他指出,人工智能的发展经历了几个关键阶段首先是感知AI(包括计算机视觉和语音识别),然后是生成式AI,现在已进入代理AI(agentic AI)阶段,而物理AI和机器人技术正成为下一个重要浪潮。
Blackwell架构已全面量产,这一架构代表了计算设计的根本性转变。他展示了从HGX架构到全新的Grace Blackwell NVLink 72架构的转变过程,这是一次真正的计算革命。

GTC2025大会本次市场关注点包括:

1、B300/GB300:Semianalysis预测B300基于N4P工艺,算力较B200提升50%;搭载12层HBM3e,提供最高288G内存和8TB/s带宽。

2、NVL288:英伟达将推出NVL144&NVL288作为下一代超节点创新产品,且在散热和超节点通信方面或采用UBB+OAM、正交背板连接等新系统设计。

3、CPO:英伟达将与台积电合作推出基于COwOS封装的CPO交换芯片,CPO交换机有助于解决传统可插拔光模块在带宽、延迟和能耗的瓶颈。

4、电源设计:面对单机柜功率向MW级迈进的趋势,英伟达或逐步引入400V/800V HVDC技术,并在GB300导入超级电容+锂电BBU以瞬时功率补偿,未来还有望推出集成PDU、PSU、超级电容、BBU的power rack将成为英伟达数据中心重要的基础单元。

本文所有资料都已上传至“智能计算芯知识”星球。如“《245+份DeepSeek技术报告合集》”,“《100+份AI芯片技术修炼合集》”,“《12+份Manus技术报告合集》”,加入星球获取严选精华技术报告,提供打包下载,内容持续更新...
Blackwell架构采用了分离式NVLink交换机设计。在过去的架构中,NVLink开关嵌入在主板上,而在新架构中,他们将NVLink系统分离出来并放置在机箱中央,有18个这样的开关分布在9个不同的开关托盘中。计算节点现在完全液冷,这使得所有计算节点可以压缩到一个机架中,每个机架包含约600,000个组件,重3,000磅,有约5,000根电缆(总长约两英里),集成成一个超级计算机。
图片


黄仁勋正式宣布了Blackwell Ultra的到来,这是Blackwell架构的增强版本。NVIDIA Blackwell Ultra增强了训练和测试时间扩展推理(在推理过程中应用更多计算以提高准确性的艺术),使世界各地的组织能够加速AI推理、代理AI和物理AI等应用。
Blackwell Ultra将推出两个版本:一个配备两个与NVIDIA Arm CPU配对的芯片,称为GB300;另一个版本仅配备GPU,称为B300。它还将推出带有八个GPU的单个服务器刀片版本,以及一个包含72个Blackwell芯片的机架版本。
具体来说,Blackwell Ultra NVL72平台将于2025年下半年上市,它具有如下特点:

- 带宽是原版Blackwell的两倍

- 内存速度是原版的1.5倍

- 单个Ultra芯片提供与Blackwell相同的20 petaflops AI性能

- 内存从192GB增加到288GB HBM3e

- DGX GB300 "Superpod"集群拥有300TB内存(原来是240TB)

人工智能已经取得了巨大的飞跃——推理和代理人工智能需要更高数量的计算性能。我们为这一刻设计了Blackwell Ultra——它是一个单一的多功能平台,可以轻松高效地进行预训练、后训练和推理人工智能推理。

未来产品路线图:从Blackwell到Vera Rubin再到Feynman

黄仁勋详细介绍了NVIDIA未来几年的产品路线图,这是NVIDIA首次如此清晰地展示其长期技术发展计划,让客户和合作伙伴能够提前规划他们的AI基础设施投资。

黄仁勋首先介绍了当前已在生产中的Blackwell架构,然后宣布了即将在2025年下半年发布的Blackwell Ultra、2026年下半年推出的Vera Rubin以及2027年下半年的Rubin Ultra。

1. Blackwell Ultra (2025年下半年)

黄仁勋表示:"在2025年下半年,我们将轻松过渡到升级版。所以我们有Blackwell Ultra,NVLink 72。它的实验室是原来的1.5倍。它有一个用于注意力的新指令。它的内存是原来的1.5倍。所有这些内存都可用于KB缓存等。它的网络带宽是原来的2倍。"

2. Vera Rubin (2026年下半年)

这一架构以发现暗物质的天文学家Vera Rubin命名。黄仁勋在现场特别致敬了Rubin的贡献,她的孙子们也出席了演讲。Vera Rubin架构将带来全新的CPU、GPU、网络和内存技术,NVLink数量增加到144。

图片

"Vera Rubin有两个主要组件:一个称为Vera的CPU和一个称为Rubin的新GPU设计,具有NVLink 144。Vera是NVIDIA的首款定制CPU设计,它基于名为Olympus的核心设计。与Vera搭配使用时,Rubin可以在进行推理时实现每秒50千万亿次浮点运算,比Blackwell每秒20千万亿次浮点运算的速度高出一倍多。Rubin还可以支持高达288 GB的快速内存。"

黄仁勋还澄清了一个命名上的变化:"Blackwell实际上是两个独立的芯片组装在一起作为一个芯片工作。从Rubin开始,当将两个或多个芯片结合成一个单一芯片时,它会将这些芯片称为独立的GPU。"

3. Rubin Ultra (2027年下半年)

这是一个更加惊人的规格,将提供NVLink 576极端扩展能力,每个机架600千瓦,拥有250万个部件,计算能力达到15 exaFLOPS(是Blackwell的15倍),内存带宽达到4.6 petabytes/s(4,600 terabytes/s)。

图片


"这是14倍更多的计算力,15 exaflops。从一个exaflop,正如我前面提到的,现在是15个exaflops扩展的exaflops。它是300,什么,4.6 petabytes,所以是4,600 terabytes每秒的扩展带宽。我不是指聚合带宽,我是指扩展带宽。当然,还有全新的NVLink开关和CX9。"

黄仁勋通过一个直观的对比展示了从Hopper到Blackwell再到Rubin架构的性能提升:Hopper是1x,Blackwell是68x,Rubin是900x。在TCO(总拥有成本)方面,Rubin将极大地降低成本,提高能效比。

最后,黄仁勋还透露,NVIDIA继Rubin之后的下一代芯片将以物理学家Richard Feynman的名字命名,进一步强调了NVIDIA对科学和创新的致敬。不过黄仁勋没有透露更多细节。我们只知道Nvidia计划于2028年的某个时候将它推向市场,取代Rubin Vera。

下载链接:

重磅合集
1、《70+篇半导体行业“研究框架”合集》
2、《56+份智能网卡和DPU合集
3、《14份半导体“AI的iPhone时刻”系列合集》
4、《21份走进“芯”时代系列深度报告合集》
5、800+份重磅ChatGPT专业报告
6、《92份GPU技术及白皮书汇总》
7、《11+份AI的裂变时刻系列报告》

8、《3+份技术系列基础知识详解(星球版)》

《100+份AI芯片技术修炼合集》

《245+份DeepSeek技术报告合集》

《42篇半导体行业深度报告&图谱(合集)

亚太芯谷科技研究院:2024年AI大算力芯片技术发展与产业趋势

SSD闪存技术基础知识全解(知识星球版)
服务器基础知识全解(知识星球版)
存储系统基础知识全解(知识星球版)
2025新技术前瞻专题系列合集
《科技龙头巡礼专题:华为技术合集》
1、科技龙头巡礼专题(一):如何看待华为盘古大模型5.0? 
2、科技龙头巡礼专题(二):华为欧拉五问五答 
3、科技龙头巡礼专题(三):国产算力AI芯片专题,一文读懂华为昇腾310芯片

本号资料全部上传至知识星球,更多内容请登录智能计算芯知识(知识星球)星球下载全部资料。


图片

免责申明:本号聚焦相关技术分享,内容观点不代表本号立场,可追溯内容均注明来源,发布文章若存在版权等问题,请留言联系删除,谢谢。



温馨提示:

请搜索AI_Architect”或“扫码关注公众号实时掌握深度技术分享,点击阅读原文获取更多原创技术干货


图片
图片

智能计算芯世界 聚焦人工智能、芯片设计、异构计算、高性能计算等领域专业知识分享.
评论 (0)
  • 家电“以旧换新”政策的覆盖范围已从传统的八大类家电(冰箱、洗衣机、电视、空调、电脑、热水器、家用灶具、吸油烟机)扩展至各地根据本地特色和需求定制的“8+N”新品类。这一政策的补贴再叠加各大电商平台的优惠,家电销售规模显著增长,消费潜力得到进一步释放。晶尊微方案为升级换代的智能家电提供了高效且稳定的触摸感应和水位检测功能,使得操作更加便捷和可靠!主要体现在:水位检测1健康家电:养生壶、温奶器、加湿器的缺水保护安全2清洁电器:洗地机、扫地机器人的低液位和溢液提醒3宠物家电:宠物饮水机的缺水提醒/满水
    ICMAN 2025-03-20 15:23 106浏览
  • 近日,保定飞凌嵌入式技术有限公司(以下简称“飞凌嵌入式”)携手瑞芯微电子股份有限公司(以下简称“瑞芯微”)正式加入2025年全国大学生嵌入式芯片与系统设计竞赛(以下简称“嵌入式大赛”),并在应用赛道中设立专属赛题。本次嵌入式大赛,双方选用基于瑞芯微RK3588芯片设计的ELF 2开发板作为参赛平台,旨在通过此次合作,促进产教融合,共同推动嵌入式系统创新人才的培养。全国大学生嵌入式芯片与系统设计竞赛是一项A类电子设计竞赛,同时也是被教育部列入白名单的赛事,由中国电子学会主办,是学生保研、求职的公认
    飞凌嵌入式 2025-03-20 11:53 62浏览
  • 如同任何对我们工作方式的改变,新的工作方式必然会遇到许多必须面对的挑战。如果不解决组织在实施精益六西格玛过程中面临的障碍以及如何克服它们的问题,那么关于精益六西格玛的讨论就不算完整。以下列举了组织在成功实施精益六西格玛时常见的几个障碍,以及克服它们的方法:1)对精益六西格玛方法论缺乏理解。抵触情绪通常源于对精益六西格玛方法论的不了解,以及不相信它能真正发挥作用。这种情况在所有层级的人员中都会出现,包括管理层。虽然教育培训可以帮助改善这一问题,但成功的项目往往是打消疑虑的最佳方式。归根结底,这是一
    优思学院 2025-03-20 12:35 78浏览
  •         在当今电子设备高度集成的时代,电路保护显得尤为重要。TVS管(瞬态电压抑制二极管)和压敏电阻作为一种高效的电路保护器件,被广泛应用于各种电子设备中,用以吸收突波,抑制瞬态过电压,从而保护后续电路免受损坏。而箝位电压,作为TVS管和压敏电阻的核心参数之一,直接关系到其保护性能的优劣。箝位电压的定义        箝位电压指瞬态保护器件(如TVS二极管、压敏电阻)在遭遇过压时,将电路电压限制在安全范围内的
    广电计量 2025-03-20 14:05 71浏览
  • 流感季急诊室外彻夜排起的长队,手机屏幕里不断闪烁的重症数据,深夜此起彼伏的剧烈咳嗽声——当病毒以更狡猾的姿态席卷全球,守护健康的战争早已从医院前移到每个人的身上。在医学界公认的「72小时黄金预警期」里,可穿戴设备闪烁的光芒正穿透皮肤组织,持续捕捉血氧浓度、心率变异性和体温波动数据。这不是科幻电影的末日警报,而是光电传感器发出的生命预警,当体温监测精度精确到±0.0℃,当动态血氧检测突破运动伪影干扰……科技正在重新定义健康监护的时空边界。从智能手表到耳机,再到智能戒指和智能衣物,这些小巧的设备通过
    艾迈斯欧司朗 2025-03-20 15:45 129浏览
  • 为有效降低人为疏失导致交通事故发生的发生率,各大汽车制造厂及系统厂近年来持续开发「先进驾驶辅助系统」ADAS, Advanced Driver Assistance Systems。在众多车辆安全辅助系统之中,「紧急刹车辅助系统」功能(AEB, Autonomous Emergency Braking)对于行车安全性的提升便有着相当大的帮助。AEB透过镜头影像模块与毫米波雷达感测前方目标,可在发生碰撞前警示或自动刹车以降低车辆损伤以及乘员伤害。面临的挑战以本次分享的客户个案为例,该车厂客户预计在
    百佳泰测试实验室 2025-03-20 15:07 71浏览
  • PCIe 5.0应用环境逐步成形,潜在风险却蠢蠢欲动?随着人工智能、云端运算蓬勃发展,系统对于高速数据传输的需求不断上升,PCI Express(PCIe)成为服务器应用最广的传输技术,尤其在高效能运算HPC(High Performance Computing)及AI服务器几乎皆导入了最新的PCIe 5.0规格,使得数据传输的双向吞吐量达到了128GB/s,让这两类的服务器能够发挥最大的效能。不过随着PCIe 5.0的频率达到16GHz,PCB板因为高频而导致讯号衰减加剧的特性,使得厂商面临很
    百佳泰测试实验室 2025-03-20 13:47 69浏览
  • 全球领先的光学解决方案供应商艾迈斯欧司朗(SIX:AMS)近日宣布,凭借AS1163独立智能驱动器(SAID)成为中国领先的智能集成系统产品汽车制造商宁波福尔达智能科技股份有限公司(“福尔达”)环境动态照明应用的关键供应商。此次合作标志着汽车技术发展的一个重要时刻,充分展现了AS1163在优化动态照明应用系统成本方面的多功能性和先进性能。该产品支持传感器集成,拥有专为车顶照明设计的超薄外形,并能提升车内照明系统的性能。AS1163是一款先进的智能LED驱动器,能够与开放系统协议(OSP)网络无缝
    艾迈斯欧司朗 2025-03-20 14:26 73浏览
  • 贞光科技代理的品牌-光颉科技高精密薄膜电阻凭借0.01%的超高精度,在AI服务器电源模块中实现了精确电压分配、优化功率因数和减少热损耗,显著提升系统能效和可靠性。在当今的数字时代,人工智能(AI)服务器已成为数据中心的核心。随着AI应用的激增,服务器的性能和能效需求也在不断提高。电源模块作为服务器的关键组件,其性能直接影响整个系统的效率和可靠性。本文将探讨光颉科技高精密薄膜电阻,特别是其0.01%的精度,如何在AI服务器电源模块中提升能效。电源模块在AI服务器中的重要性电源模块负责将输入电源转换
    贞光科技 2025-03-20 16:55 112浏览
  • 本文内容来自微信公众号【工程师进阶笔记】,以工程师的第一视角分析了飞凌嵌入式OK3506J-S开发板的产品优势,感谢原作者温老师的专业分享。前两周,有一位老朋友联系我,他想找人开发一款数据采集器,用来采集工业现场的设备数据,并且可以根据不同的业务场景,通过不同的接口把这些数据分发出去。我把他提的需求总结了一下,这款产品方案大概有以下功能接口,妥妥地一款工业网关,在网上也能找到很多类似的产品方案,为啥他不直接买来用?再跟朋友深入地聊了一下,他之所以联系我,是因为看到我在公众号介绍过一款由飞凌嵌入式
    飞凌嵌入式 2025-03-20 11:51 102浏览
我要评论
0
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦