英伟达芯片路线图分析:RubinGPU、RubinUltra及Feynman架构

原创 汽车电子设计 2025-03-22 07:30
芝能智芯出品

英伟达GTC 25大会上,黄教主公布了2026-2027年的数据中心GPU路线图,在AI和高性能计算领域的雄心。


Blackwell B200刚刚全面投产,Blackwell Ultra预计于2025年下半年推出。


● 英伟达已规划了后续两代产品:2026年的Rubin GPU和2027年的Rubin Ultra,并透露了以物理学家理查德·费曼(Feynman)命名的新架构。


◎ Rubin GPU推理速度将达到50 petaflops(每秒千万亿次浮点运算),内存提升至288 GB,性能是Blackwell的2.5倍;


◎ 而Rubin Ultra的性能将是GB300 NVL72的14倍,英伟达通过快速迭代和尖端技术(如NVLink和HBM4)巩固市场领导地位的战略。



Part 1

Blackwell Ultra:

挤牙膏还是过渡之作?


英伟达在去年的GTC 2024上发布了Blackwell架构,并推出了GB200芯片,今年将这一系列正式命名为Blackwell Ultra。


与此前传言的GB300不同,Blackwell Ultra本质上是Blackwell的内存升级版,基于台积电N4P(5nm)工艺的双芯片架构(Blackwell GPU + Grace CPU),搭配12层堆叠的HBM3e内存,显存容量提升至288 GB,带宽达1.8 TB/s,延续第五代NVLink技术。


从技术角度看,Blackwell Ultra在FP4精度下的算力达到15 petaflops,结合Attention Acceleration机制,其推理性能比Hopper架构的H100提升2.5倍。



这一升级显得较为保守,Blackwell Ultra并未带来全新架构,通过内存和微调优化现有设计。


这种“挤牙膏”式的迭代是不是有点像之前的Intel,英伟达是否在为Rubin等更具颠覆性的产品蓄力,而将Blackwell Ultra定位为市场过渡产品?其核心改进在于满足当前AI推理需求的内存带宽提升,而非底层架构的革命性突破。



Blackwell Ultra NVL72机柜进一步佐证了这一定位,一款专为“AI推理时代”定制的产品,包含18个计算托盘(72颗Blackwell Ultra GPU + 36颗Grace CPU),总显存20 TB,带宽576 TB/s,配备9个NVLink交换机托盘(节点间带宽130 TB/s)


机柜整合了72张CX-8网卡(14.4 TB/s带宽)、Quantum-X800 InfiniBand和Spectrum-X 800G以太网卡,以及18张BlueField-3 DPU,优化了延迟和多租户支持。


应用场景包括AI代理、机器人训练和物理仿真等,其推理性能比GB200 NVL72提升1.5倍,比Hopper架构的DGX机柜高出50倍。以6710亿参数的DeepSeek-R1模型为例,H100需1.5分钟完成推理(100 tokens/秒),而Blackwell Ultra NVL72仅需15秒(1000 tokens/秒)


Blackwell Ultra NVL72预计于2025年下半年上市,目标客户包括服务器厂商(思科、戴尔、HPE等)、云服务商(AWS、Google Cloud、Azure等)和算力租赁商(CoreWeave、Lambda等)


这种广泛的市场覆盖显示出强劲需求,但其增量式升级表明英伟达在为Rubin铺路,同时利用Blackwell Ultra维持生态系统粘性。



Part 2

Rubin及未来:

真正的下一代飞跃


如果说Blackwell Ultra是战术性过渡,那么2026年的Rubin GPU则是英伟达的战略重拳。以天文学家Vera Rubin命名的这款GPU,推理速度将达50 petaflops(比Blackwell的20 petaflops高出一倍多),配备288 GB HBM4内存。


基于Rubin的Vera Rubin NVL144机柜(72颗Grace CPU + 144颗Rubin GPU)将提供3.6 exaflops(FP4推理)和1.2 exaflops(FP8训练)的算力,是Blackwell Ultra NVL72的3.3倍。


到2027年,Rubin Ultra NVL576将进一步提升至15 exaflops(FP4)和5 exaflops(FP8),性能是Blackwell Ultra NVL72的14倍。这些数据表明,英伟达正全力抢占AI计算的制高点。



● Rubin的突破依赖三大支柱:


◎ 首先,HBM4内存(NVL144带宽13 TB/s)解决了大规模AI模型的内存瓶颈;


◎ 其次,第六代NVLink和CX9网卡提升了多GPU集群的互联效率;


◎ 最后,Rubin可能采用更先进的制程(如3nm),优化功耗和性能。黄仁勋提到的NVLink革新暗示Rubin将在多芯片设计上更进一步,延续Blackwell的双芯片经验。


Rubin Ultra NVL576以576颗GPU的配置瞄准超大规模AI部署,例如万亿参数模型的生成式AI和物理仿真,其15 exaflops推理能力可将复杂任务压缩至秒级。


而后续的Feynman架构(以理查德·费曼命名)则预示着英伟达的长远布局,可能探索量子计算或光互联等前沿技术。


● 基于Blackwell Ultra的DGX Super POD提供即插即用的“AI超算工厂”,分为两种配置:


◎ 包含576颗Blackwell Ultra GPU和288颗Grace CPU(11.5 exaflops FP4);


◎ 采用B300 GPU的风冷设计,适用于企业数据中心。


Equinix的液冷/风冷支持增强了其灵活性,但其依赖Blackwell Ultra使其更像过渡性产品,难以与Rubin匹敌,市场影响深远。


Rubin和Rubin Ultra将加剧与AMD(Instinct MI300)和英特尔(Gaudi、Ponte Vecchio)的竞争,后者在算力和生态成熟度上仍落后。


云服务商和AI初创企业将受益于Rubin的可扩展性,但高昂成本可能拉大巨头与中小玩家的差距。Rubin对推理的重视也顺应了AI从训练向部署的行业趋势。


小结


英伟达的2026-2027路线图以Rubin、Rubin Ultra和Feynman架构为核心,巩固了其在AI芯片领域的领导地位。


Blackwell Ultra虽是过渡性产品,却通过内存和推理优化满足当前需求,为Rubin的登场铺平道路。Rubin GPU的50 petaflops推理能力和HBM4技术标志着代际飞跃,而Rubin Ultra NVL576的15 exaflops性能则重新定义了AI计算的边界。


Feynman的预告则进一步彰显了英伟达的雄心。快速迭代可能让客户疲于升级,执行延迟也可能被对手利用。提前公布Rubin和Feynman,不仅激励了投资者和开发者,也向竞争对手施压。


汽车电子设计 本公众号是博主和汽车电子的行业的工程师们一起交流、探讨、思考的小结,以作为技术交流和沟通的桥梁
评论 (0)
  • 你是不是也有在公共场合被偷看手机或笔电的经验呢?科技时代下,不少现代人的各式机密数据都在手机、平板或是笔电等可携式的3C产品上处理,若是经常性地需要在公共场合使用,不管是工作上的机密文件,或是重要的个人信息等,民众都有防窃防盗意识,为了避免他人窥探内容,都会选择使用「防窥保护贴片」,以防止数据外泄。现今市面上「防窥保护贴」、「防窥片」、「屏幕防窥膜」等产品就是这种目的下产物 (以下简称防窥片)!防窥片功能与常见问题解析首先,防窥片最主要的功能就是用来防止他人窥视屏幕上的隐私信息,它是利用百叶窗的
    百佳泰测试实验室 2025-04-30 13:28 417浏览
  • 浪潮之上:智能时代的觉醒    近日参加了一场课题的答辩,这是医疗人工智能揭榜挂帅的国家项目的地区考场,参与者众多,围绕着医疗健康的主题,八仙过海各显神通,百花齐放。   中国大地正在发生着激动人心的场景:深圳前海深港人工智能算力中心高速运转的液冷服务器,武汉马路上自动驾驶出租车穿行的智慧道路,机器人参与北京的马拉松竞赛。从中央到地方,人工智能相关政策和消息如雨后春笋般不断出台,数字中国的建设图景正在智能浪潮中徐徐展开,战略布局如同围棋
    广州铁金刚 2025-04-30 15:24 238浏览
  • 贞光科技代理品牌紫光国芯的车规级LPDDR4内存正成为智能驾驶舱的核心选择。在汽车电子国产化浪潮中,其产品以宽温域稳定工作能力、优异电磁兼容性和超长使用寿命赢得市场认可。紫光国芯不仅确保供应链安全可控,还提供专业本地技术支持。面向未来,紫光国芯正研发LPDDR5车规级产品,将以更高带宽、更低功耗支持汽车智能化发展。随着智能网联汽车的迅猛发展,智能驾驶舱作为人机交互的核心载体,对处理器和存储器的性能与可靠性提出了更高要求。在汽车电子国产化浪潮中,贞光科技代理品牌紫光国芯的车规级LPDDR4内存凭借
    贞光科技 2025-04-28 16:52 292浏览
  • 网约车,真的“饱和”了?近日,网约车市场的 “饱和” 话题再度引发热议。多地陆续发布网约车风险预警,提醒从业者谨慎入局,这背后究竟隐藏着怎样的市场现状呢?从数据来看,网约车市场的“过剩”现象已愈发明显。以东莞为例,截至2024年12月底,全市网约车数量超过5.77万辆,考取网约车驾驶员证的人数更是超过13.48万人。随着司机数量的不断攀升,订单量却未能同步增长,导致单车日均接单量和营收双双下降。2024年下半年,东莞网约出租车单车日均订单量约10.5单,而单车日均营收也不容乐
    用户1742991715177 2025-04-29 18:28 249浏览
  • 文/郭楚妤编辑/cc孙聪颖‍越来越多的企业开始蚕食动力电池市场,行业“去宁王化”态势逐渐明显。随着这种趋势的加强,打开新的市场对于宁德时代而言至关重要。“我们不希望被定义为电池的制造者,而是希望把自己称作新能源产业的开拓者。”4月21日,在宁德时代举行的“超级科技日”发布会上,宁德时代掌门人曾毓群如是说。随着宁德时代核心新品骁遥双核电池的发布,其搭载的“电电增程”技术也走进业界视野。除此之外,经过近3年试水,宁德时代在换电业务上重资加码。曾毓群认为换电是一个重资产、高投入、长周期的产业,涉及的利
    华尔街科技眼 2025-04-28 21:55 184浏览
  • 一、gao效冷却与控温机制‌1、‌冷媒流动设计‌采用低压液氮(或液氦)通过毛细管路导入蒸发器,蒸汽喷射至样品腔实现快速冷却,冷却效率高(室温至80K约20分钟,至4.2K约30分钟)。通过控温仪动态调节蒸发器加热功率,结合温度传感器(如PT100铂电阻或Cernox磁场不敏感传感器),实现±0.01K的高精度温度稳定性。2、‌宽温区覆盖与扩展性‌标准温区为80K-325K,通过降压选件可将下限延伸至65K(液氮模式)或4K(液氦模式)。可选配475K高温模块,满足材料在ji端温度下的性能测试需求
    锦正茂科技 2025-04-30 13:08 315浏览
  • 随着电子元器件的快速发展,导致各种常见的贴片电阻元器件也越来越小,给我们分辨也就变得越来越难,下面就由smt贴片加工厂_安徽英特丽就来告诉大家如何分辨的SMT贴片元器件。先来看看贴片电感和贴片电容的区分:(1)看颜色(黑色)——一般黑色都是贴片电感。贴片电容只有勇于精密设备中的贴片钽电容才是黑色的,其他普通贴片电容基本都不是黑色的。(2)看型号标码——贴片电感以L开头,贴片电容以C开头。从外形是圆形初步判断应为电感,测量两端电阻为零点几欧,则为电感。(3)检测——贴片电感一般阻值小,更没有“充放
    贴片加工小安 2025-04-29 14:59 259浏览
  • 在CAN总线分析软件领域,当CANoe不再是唯一选择时,虹科PCAN-Explorer 6软件成为了一个有竞争力的解决方案。在现代工业控制和汽车领域,CAN总线分析软件的重要性不言而喻。随着技术的进步和市场需求的多样化,单一的解决方案已无法满足所有用户的需求。正是在这样的背景下,虹科PCAN-Explorer 6软件以其独特的模块化设计和灵活的功能扩展,为CAN总线分析领域带来了新的选择和可能性。本文将深入探讨虹科PCAN-Explorer 6软件如何以其创新的模块化插件策略,提供定制化的功能选
    虹科汽车智能互联 2025-04-28 16:00 214浏览
  • 文/Leon编辑/cc孙聪颖‍2023年,厨电行业在相对平稳的市场环境中迎来温和复苏,看似为行业增长积蓄势能。带着对市场向好的预期,2024 年初,老板电器副董事长兼总经理任富佳为企业定下双位数增长目标。然而现实与预期相悖,过去一年,这家老牌厨电企业不仅未能达成业绩目标,曾提出的“三年再造一个老板电器”愿景,也因市场下行压力面临落空风险。作为“企二代”管理者,任富佳在掌舵企业穿越市场周期的过程中,正面临着前所未有的挑战。4月29日,老板电器(002508.SZ)发布了2024年年度报告及2025
    华尔街科技眼 2025-04-30 12:40 242浏览
  • 在智能硬件设备趋向微型化的背景下,语音芯片方案厂商针对小体积设备开发了多款超小型语音芯片方案,其中WTV系列和WT2003H系列凭借其QFN封装设计、高性能与高集成度,成为微型设备语音方案的理想选择。以下从封装特性、功能优势及典型应用场景三个方面进行详细介绍。一、超小体积封装:QFN技术的核心优势WTV系列与WT2003H系列均提供QFN封装(如QFN32,尺寸为4×4mm),这种封装形式具有以下特点:体积紧凑:QFN封装通过减少引脚间距和优化内部结构,显著缩小芯片体积,适用于智能门铃、穿戴设备
    广州唯创电子 2025-04-30 09:02 291浏览
我要评论
0
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦