1TBHBM4e超海量内存!NVIDIA两大全新GPU架构、12款新卡集体来袭

原创 硬件世界 2025-03-20 00:08

NVIDIA Blackwell架构虽然在加速卡、游戏卡上都遭遇诸多波折,但这并不影响NVIDIA对于未来的宏伟规划,不但公布了下一代Rubin架构的具体产品规划,还首次宣布了再下一代架构“Feynman”。

NVIDIA公布2026-2028年两大GPU架构:搭配1TB HBM4e内存

Feynman就是理查德·费曼,美籍犹太裔人,20世纪最伟大的物理学家之一,诺贝尔物理学奖获得者,在量子电动力学、量子计算、纳米技术等领域都有开创性的成就,还撰写了《费曼物理学讲义》、提出了“费曼学习法”,1986年挑战者号航天飞机爆炸失事的根本原因也是他查明的。

NVIDIA公布2026-2028年两大GPU架构:搭配1TB HBM4e内存

NVIDIA这次一共宣布了三款产品,首先是“Blackwell Ultra GB300 NV72”,今年下半年发布,每个节点配备两颗升级版的Blackwell GPU、一颗Grace CPU,搭配多达288GB HBM3e高带宽内存,Dense FP4性能高达15PFlops(每秒1.5亿亿次)。

整台服务器一共72个节点,也就是144颗GPU、72颗CPU、20TB HBM3e、40TB DDR5内存,比上代增加50%,CX8互连带宽14.4TB/s,增加100%。

整机的Dense FP4推理性高达1.1EFlops(每秒110亿亿次),FP8训练性能高达0.36EFlps(36亿亿次),还有新的注意力指令。

NVIDIA表示,联想、戴尔、超微等合作伙伴预计将从2025年下半年开始推出基于Blackwell Ultra的各类服务器。

NVIDIA公布2026-2028年两大GPU架构:搭配1TB HBM4e内存

2026年下半年,我们将迎来全新的Rubin架构,首发服务器产品为“Vera Rubin NV144”,每个节点两颗Rubin GPU搭配一颗全新的Vera CPU。

其中,Rubin GPU搭配288GB容量的下一代HBM4内存,FP4浮点性能跃升到50PFlops(每秒5亿亿次)。

Vera CPU则包含88个自研Arm架构核心,首次支持多线程而达到176线程,彼此之间通过1.8TB/s带宽的NVLink-C2C总线连接在一起。

整台服务器一共144个节点,也就是288颗GPU、144颗CPU、41.5TB HBM4内存(带宽13TB/s),还有75TB的系统内存,NVLink6带宽达260TB/s,CX9总线带宽达28.8TB/s。

FP4推理性能来到3.6EFlops(每秒360亿亿次),FP8训练性能则是1.2EFlops(每秒120亿亿次)。

NVIDIA公布2026-2028年两大GPU架构:搭配1TB HBM4e内存

2027年下半年,我们将看到升级版的“Rubin Ultra NV576”,每个节点包含四颗Rubin GPU、一颗Vera GPU,并升级1TB HBM4e内存,FP4浮点性能高达100PFlops(10亿亿次)。

整机一共多达576个节点,也就是拥有2304颗Rubin GPU、576颗Vera CPU、576TB HBM5e(带宽4.6PB/s),还有365TB系统内存。

NVLink互连总线升级到第七代NVLink7,带宽惊人的1.5PB/s,另外CX9总线带宽115.2TB/s。

FP4推理性能高达15EFlops(每秒1500亿亿次),FP8训练性能5EFlops(每秒500亿亿次)。

NVIDIA公布2026-2028年两大GPU架构:搭配1TB HBM4e内存

至于新的Feynman架构,将在2028年首次登场,搭配下一代HBM内存(HBM5?),但具体细节暂未披露。

NVIDIA公布2026-2028年两大GPU架构:搭配1TB HBM4e内存

NVIDIA CEO黄仁勋还宣布,NVIDIA今年已经向美国四大云服务提供商售出了超过300万块Blackwell AI GPU。

要知道,这一数字还仅涵盖了美国四大云服务提供商,并没有包括其他AI企业或初创公司。

与上一代Hopper架构相比,Blackwell的销售量几乎增长了三倍,这表明AI硬件的需求正在快速增长。

NVIDIA今年已售超300万块Blackwell AI GPU!怪不得RTX 50这么缺货

黄仁勋表示,AI计算正处于一个“转折点”,未来对硬件的需求将迅速增长。

NVIDIA预计,到2027年,数据中心的建设成本将达到1万亿美元以上,这几乎是当前水平的四倍。

虽然Blackwell系列遇到了如产量和发货延迟等问题,但该架构仍然得到了行业的广泛采用,随着新产品线如Blackwell Ultra和Vera Rubin的推出,NVIDIA预计其计算收入将大幅增长。

NVIDIA今年已售超300万块Blackwell AI GPU!怪不得RTX 50这么缺货

不过在消费级显卡方面,RTX 50系列发布已久,先后推出四款型号,但是缺货、涨价情况依旧普遍存在。

新品刚上市缺货是很正常的事情,毕竟产能需要爬坡,但是RTX 50系列这次格外严重,RTX 5070系列甚至延期发布了都未能缓解。

NVIDIA今年已售超300万块Blackwell AI GPU!怪不得RTX 50这么缺货

除了数据中心和游戏,GPU显卡还有一个重要的细分领域,那就是图形工作站。

NVIDIA正式发布了基于Blackwell架构的新一代工作站专业显卡,涵盖桌面台式机、笔记本、数据中心,一共有多达12款不同型号,并首次在型号命名中加入了PRO字样。

桌面上一共五款,旗舰级的是RTX PRO 6000,分为工作站版、Max版两个不同版本,都基于GB202核心,有多达24064个CUDA核心,搭配512-bit 96GB GDDR7 ECC显存(单颗容量3GB),等效频率28GHz,规模远超RTX 5090,热设计功耗分别为600W、300W。

NVIDIA发布12款Blackwell RTX PRO专业显卡:最高96GB大显存、600W高功耗

其中,RTX PRO 6000工作站版标称单精度浮点性能125TFlops,算下来核心频率2.6GHz采用开放式双风扇散热,也是全系列唯一这样设计的。

NVIDIA发布12款Blackwell RTX PRO专业显卡:最高96GB大显存、600W高功耗

NVIDIA发布12款Blackwell RTX PRO专业显卡:最高96GB大显存、600W高功耗

Max-Q版本则略微降低至2.5GHz,并改成了单风扇涡轮式散热,更适合多卡部署。

NVIDIA发布12款Blackwell RTX PRO专业显卡:最高96GB大显存、600W高功耗

NVIDIA发布12款Blackwell RTX PRO专业显卡:最高96GB大显存、600W高功耗

RTX PRO 5000也是GB202核心,配备14080个CUDA核心(和上代RTX 5880 ADA一模一样)、384-bit 48GB GDDR7 ECC显存(容量没变只是升级类型),功耗300W。

RTX PRO 4500改成了GB203核心,提供10496个CUDA核心,略微少于RTX 5080,比上代RTX 4500 ADA增加了37%之多,而显存有256-bit 32GB GDDR7 ECC,两倍于RTX 5080,比上代增加50%,但功耗仅为200W。

RTX PRO 4000同样是GB203核心,8960个CUDA核心,192-bit 24GB GDDR7 ECC显存,比上代分别增加46%、20%,功耗只有140W。

另外,所有型号都标配四个DisplayPort 2.1b输出接口,没有HDMI。

这样的提升幅度,让挤牙膏的桌面级RTX 50系列情何以堪!

RTX PRO 6000还有个服务器版本,无风扇被动散热,适合密集服务器部署,使用系统级散热。

NVIDIA发布12款Blackwell RTX PRO专业显卡:最高96GB大显存、600W高功耗

移动版型号最多有六款,分别叫做RTX PRO 5000、4000、3000、2000、1000、500,但暂未公布具体规格。

NVIDIA发布12款Blackwell RTX PRO专业显卡:最高96GB大显存、600W高功耗

当然啦,NVIDIA也没有完全忘记游戏玩家,发布了全新的GeForce 572.83正式版显卡驱动,支持新显卡、新游戏,还为多达61款游戏加入了DLSS Override驱动级支持。

但是,这次没有提及前几个版本驱动反复尝试解决的黑屏问题。

新驱动正式支持即将发布的RTX 5090、RTX 5080、RTX 5070 Ti笔记本,本月底开始陆续发布上市。

支持优化两款新游戏《半条命2 RTXD EMO》、《InZOl》,前者和《战锤40K:暗潮》都已加入DLSS 4,而后者首次落地了NVIDIA ACE数字人。

NVIDIA572.83驱动发布:61款游戏加入DLSS、未提及黑屏

NVIDIA还针对多达61款游戏,提供了驱动级的DLSSOverride支持,可一键开启,它们分别是:

寂静之地:前路

阿金机器人

救护车生活:救护员模拟

刺客信条:影袭

星轨

法蒂玛阿姨

汽车经销商模拟器:序章-早期岁月

阿尔科诺斯特密码:邪恶觉醒

欺诈2

无序:解谜游戏冒险

异星指令:自治殖民地模拟器

直接接触

龙裔:被放逐者

地牢传承

星战前夜:边境

永恒空间2

最终幻想VII:重生

最终幻想XVI

芬兰小屋模拟器

索利斯堡

芬克融合

地平线:零之曙光完全版

灵动:复刻版

侏罗纪世界:进化2

克里斯塔拉

层层恐惧

遗产:钢铁与魔法

乐高:地平线冒险

如龙:夏威夷的海盗黑帮

阈域核心

失落记录:绽放与狂怒

漫威蜘蛛侠2

地铁:离去

夜莺

忍者龙剑传2:黑之章

地狱已满2

喋血街头4:无悔

康加

死亡回归

法师的复仇

浪人崛起

幸福工厂

血清

斯凯:迷雾之岛

瘦长鬼影:降临

神之浩劫2

星河战队:灭绝

风暴之门

仙剑奇侠传七

无限试驾:太阳王冠

未见之轴

黑池

上古卷轴OL

东京极速赛车

扭矩漂移2

部落3:对手

直到黎明

矢量打击

战锤40K:星际战士2

鸣潮

轩辕剑柒

NVIDIA572.83驱动发布:61款游戏加入DLSS、未提及黑屏

硬件世界 共同研究探讨硬件知识及相关信息
评论 (0)
  • 文/郭楚妤编辑/cc孙聪颖‍越来越多的企业开始蚕食动力电池市场,行业“去宁王化”态势逐渐明显。随着这种趋势的加强,打开新的市场对于宁德时代而言至关重要。“我们不希望被定义为电池的制造者,而是希望把自己称作新能源产业的开拓者。”4月21日,在宁德时代举行的“超级科技日”发布会上,宁德时代掌门人曾毓群如是说。随着宁德时代核心新品骁遥双核电池的发布,其搭载的“电电增程”技术也走进业界视野。除此之外,经过近3年试水,宁德时代在换电业务上重资加码。曾毓群认为换电是一个重资产、高投入、长周期的产业,涉及的利
    华尔街科技眼 2025-04-28 21:55 116浏览
  • 你是不是也有在公共场合被偷看手机或笔电的经验呢?科技时代下,不少现代人的各式机密数据都在手机、平板或是笔电等可携式的3C产品上处理,若是经常性地需要在公共场合使用,不管是工作上的机密文件,或是重要的个人信息等,民众都有防窃防盗意识,为了避免他人窥探内容,都会选择使用「防窥保护贴片」,以防止数据外泄。现今市面上「防窥保护贴」、「防窥片」、「屏幕防窥膜」等产品就是这种目的下产物 (以下简称防窥片)!防窥片功能与常见问题解析首先,防窥片最主要的功能就是用来防止他人窥视屏幕上的隐私信息,它是利用百叶窗的
    百佳泰测试实验室 2025-04-30 13:28 165浏览
  • 浪潮之上:智能时代的觉醒    近日参加了一场课题的答辩,这是医疗人工智能揭榜挂帅的国家项目的地区考场,参与者众多,围绕着医疗健康的主题,八仙过海各显神通,百花齐放。   中国大地正在发生着激动人心的场景:深圳前海深港人工智能算力中心高速运转的液冷服务器,武汉马路上自动驾驶出租车穿行的智慧道路,机器人参与北京的马拉松竞赛。从中央到地方,人工智能相关政策和消息如雨后春笋般不断出台,数字中国的建设图景正在智能浪潮中徐徐展开,战略布局如同围棋
    广州铁金刚 2025-04-30 15:24 130浏览
  • 贞光科技代理品牌紫光国芯的车规级LPDDR4内存正成为智能驾驶舱的核心选择。在汽车电子国产化浪潮中,其产品以宽温域稳定工作能力、优异电磁兼容性和超长使用寿命赢得市场认可。紫光国芯不仅确保供应链安全可控,还提供专业本地技术支持。面向未来,紫光国芯正研发LPDDR5车规级产品,将以更高带宽、更低功耗支持汽车智能化发展。随着智能网联汽车的迅猛发展,智能驾驶舱作为人机交互的核心载体,对处理器和存储器的性能与可靠性提出了更高要求。在汽车电子国产化浪潮中,贞光科技代理品牌紫光国芯的车规级LPDDR4内存凭借
    贞光科技 2025-04-28 16:52 195浏览
  • 文/Leon编辑/cc孙聪颖‍2023年,厨电行业在相对平稳的市场环境中迎来温和复苏,看似为行业增长积蓄势能。带着对市场向好的预期,2024 年初,老板电器副董事长兼总经理任富佳为企业定下双位数增长目标。然而现实与预期相悖,过去一年,这家老牌厨电企业不仅未能达成业绩目标,曾提出的“三年再造一个老板电器”愿景,也因市场下行压力面临落空风险。作为“企二代”管理者,任富佳在掌舵企业穿越市场周期的过程中,正面临着前所未有的挑战。4月29日,老板电器(002508.SZ)发布了2024年年度报告及2025
    华尔街科技眼 2025-04-30 12:40 137浏览
  • 随着电子元器件的快速发展,导致各种常见的贴片电阻元器件也越来越小,给我们分辨也就变得越来越难,下面就由smt贴片加工厂_安徽英特丽就来告诉大家如何分辨的SMT贴片元器件。先来看看贴片电感和贴片电容的区分:(1)看颜色(黑色)——一般黑色都是贴片电感。贴片电容只有勇于精密设备中的贴片钽电容才是黑色的,其他普通贴片电容基本都不是黑色的。(2)看型号标码——贴片电感以L开头,贴片电容以C开头。从外形是圆形初步判断应为电感,测量两端电阻为零点几欧,则为电感。(3)检测——贴片电感一般阻值小,更没有“充放
    贴片加工小安 2025-04-29 14:59 153浏览
  • 在智能硬件设备趋向微型化的背景下,语音芯片方案厂商针对小体积设备开发了多款超小型语音芯片方案,其中WTV系列和WT2003H系列凭借其QFN封装设计、高性能与高集成度,成为微型设备语音方案的理想选择。以下从封装特性、功能优势及典型应用场景三个方面进行详细介绍。一、超小体积封装:QFN技术的核心优势WTV系列与WT2003H系列均提供QFN封装(如QFN32,尺寸为4×4mm),这种封装形式具有以下特点:体积紧凑:QFN封装通过减少引脚间距和优化内部结构,显著缩小芯片体积,适用于智能门铃、穿戴设备
    广州唯创电子 2025-04-30 09:02 151浏览
  • 在CAN总线分析软件领域,当CANoe不再是唯一选择时,虹科PCAN-Explorer 6软件成为了一个有竞争力的解决方案。在现代工业控制和汽车领域,CAN总线分析软件的重要性不言而喻。随着技术的进步和市场需求的多样化,单一的解决方案已无法满足所有用户的需求。正是在这样的背景下,虹科PCAN-Explorer 6软件以其独特的模块化设计和灵活的功能扩展,为CAN总线分析领域带来了新的选择和可能性。本文将深入探讨虹科PCAN-Explorer 6软件如何以其创新的模块化插件策略,提供定制化的功能选
    虹科汽车智能互联 2025-04-28 16:00 147浏览
  • 网约车,真的“饱和”了?近日,网约车市场的 “饱和” 话题再度引发热议。多地陆续发布网约车风险预警,提醒从业者谨慎入局,这背后究竟隐藏着怎样的市场现状呢?从数据来看,网约车市场的“过剩”现象已愈发明显。以东莞为例,截至2024年12月底,全市网约车数量超过5.77万辆,考取网约车驾驶员证的人数更是超过13.48万人。随着司机数量的不断攀升,订单量却未能同步增长,导致单车日均接单量和营收双双下降。2024年下半年,东莞网约出租车单车日均订单量约10.5单,而单车日均营收也不容乐
    用户1742991715177 2025-04-29 18:28 166浏览
  • 一、gao效冷却与控温机制‌1、‌冷媒流动设计‌采用低压液氮(或液氦)通过毛细管路导入蒸发器,蒸汽喷射至样品腔实现快速冷却,冷却效率高(室温至80K约20分钟,至4.2K约30分钟)。通过控温仪动态调节蒸发器加热功率,结合温度传感器(如PT100铂电阻或Cernox磁场不敏感传感器),实现±0.01K的高精度温度稳定性。2、‌宽温区覆盖与扩展性‌标准温区为80K-325K,通过降压选件可将下限延伸至65K(液氮模式)或4K(液氦模式)。可选配475K高温模块,满足材料在ji端温度下的性能测试需求
    锦正茂科技 2025-04-30 13:08 134浏览
我要评论
0
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦