英伟达的新款BlackwellUltra和Rubin芯片如何引领下一波AI浪潮

美股研究社 2025-03-21 18:50

位于台湾台北的 Nvidia 公司大楼。


作者 | Aseity Research

编译 | 华尔街大事件


英伟达(NASDAQ:NVDA最近发布了其新系列Blackwell Ultra和 Rubin 芯片,相信它们将引领下一波人工智能投资浪潮。如果生成式人工智能是第一个,那么推理式人工智能将是第二个,这些芯片似乎考虑到了这些架构。本质上,Blackwell 是 2024 年发布的 2024 Blackwell 型号的涡轮增压版。这些芯片提供的一些最大好处是内存带宽大幅增加,单个 GPU 上的内存带宽从 192GB 飙升至 288GB。实际上,这使得这些 GPU 能够处理更大的人工智能模型,从而使它们能够高效处理密集型工作负载。它们对于训练深度学习应用程序也更加实用。

这些芯片的另一个主要特点是,除了拥有更大的内存之外,它还建立在 Blackwell 的“基于图块”的设计之上,而 Ultra 系列旨在进一步增强这一设计,使性能比其前代产品提高约 1.5 倍。

Rubin 将于 2026 年发布,将取代 Blackwell,由一对芯片组成。它们由一个名为 Vera 的定制 Arm CPU组成,旨在并行工作。这是 AI 进化的又一步,因为它取代了当前的 Grace CPU + GPU 设置,用于将 AI 集成到不同的工作负载中。与 Blackwell 一样,Rubin 还将采用基于 Tile 的设计,可容纳四个 Tile,这意味着它可以在单个封装内扩展多个芯片。

随着人工智能变得越来越普遍,这种“基于区块”的模块化设计将成为常态。它本质上允许用户“混合搭配”不同类型的芯片以适应特定的工作负载。例如,人工智能区块可能具有张量核心,而通用区块可能具有基于 Arm 的核心。通过将它们组合在一起,可以使它们更加灵活,并适应各种行业。

Rubin 设计的整体情况是,据估计,AI 系统可以达到每秒50 千万亿次浮点运算的 AI 推理速度,比目前的 Blackwell 芯片高出约 2.5 倍。展望 2027 年,也就是 Rubin Ultra 发布之时,英伟达计划将两个 Rubin GPU 融合在一起,目标是实现每秒 100 千万亿次浮点运算的速度和 1 兆字节的板载内存,这将大大加速 AI 的发展。

新的 Blackwell Ultra 和 Rubin 芯片不仅大幅提升了 AI 性能,而且也旨在提高推理能力。如果没有与其能力相匹配的互补推理,就无法拥有复杂的 AI 推理模型。对高速推理的需求变得比以往任何时候都更加迫切,AI 被集成到越来越多的新设备中。

这之所以重要,是因为人工智能中的传统推理通常依赖于静态模型执行,类似于运行简单的编程脚本,尽可能简单地说。但人工智能推理需要更复杂、更动态的内存密集型计算,这些计算通常需要实时调整。例如,自动驾驶汽车需要根据新的输入不断更新其理解,这与以前的推理有很大不同,以前的推理通常以确定性的方式运行人工智能策略。

新款 Blackwell Ultra 在这方面的优势主要来自于内存的大幅增加,每个 GPU 从 192GB 增加到 288GB,适合多步逻辑计算。一些推理模型,如 OpenAI 的 o1、Grok-3 或 DeepSeek ( DEEPSEEK ) 的 DeepSeek-R1,每秒消耗的令牌数量比前几代高出许多,这意味着推理也必须扩大规模才能满足需求。

另一方面,Rubin 允许 AI 模型将工作负载分配到不同的处理单元。与仅使用 GPU 的推理(在并行处理方面表现出色,但在顺序或逻辑驱动任务上表现不佳)不同,Rubin 提供了一种混合方法。这种集成至关重要,因为推理不仅需要 GPU 中的原始能力,还需要理解(并记住)上下文、决策和顺序处理。为了大大简化问题,AI 模型将能够将逻辑任务卸载到 CPU,同时使用 GPU 进行计算。这使得英伟达的 AI 堆栈具有高度适应性,确保它可以在同一芯片内以更高的效率和功耗处理需要巨大 GPU 能力的传统工作负载以及逻辑决策。

随着这些芯片的发布,英伟达现在已经牢牢占据了AI 加速器市场的主导地位,以及数据中心计算的市场份额,已经为大约 90% 的数据中心工作负载提供支持。这进一步提高了竞争对手在计算方面挑战它的门槛,这也有助于证明其高估值和成为世界上最有价值的公司之一的合理性。


为了更全面地了解这些性能影响,Blackwell Ultra 的 HGX 系统声称,与上一代 hopper 系统相比,该系统可为 AI 模型提供11 倍更快的 AI 推理速度和 7 倍更高的吞吐量。因此,有人认为英伟达的护城河正在被谷歌、亚马逊等公司及其它主要超大规模企业所瓦解,这些企业正在创建自己的 AI 芯片,因此英伟达需要满足更高的标准。


这些芯片的第二个含义是,英伟达首席执行官黄仁勋最近宣布,“推理和代理 AI ”的新拐点已经到来,而之前对 LLM 的关注可能不再是未来几个月和几年 AI 圈讨论的“热门话题”。据称,Blackwell Ultra 是专门为这个“推理时代”量身定制的,因为它具有额外的能力和板载内存,可以思考思考过程的每一步。


这些影响是巨大的。英伟达基本上打开了潘多拉魔盒,通过这些强大的 GPU 和 CPU 将人工智能和人工智能干扰融入日常应用中,现在可以比以往更经济地进行训练。它正在从一家硬件公司或芯片制造商转变为硬件和软件之间的关键接口。这意味着,虽然目前它的大部分计算都是从数据中心出租的,但在未来几年,它似乎也将被用于从仓库到医院和电信网络的各种应用。如果有人怀疑英伟达的主导地位正在逐渐消失,这一发展为相反的观点提供了可靠的证据。


英伟达的几家同行正在凭借自己的芯片在市场上取得进展。需要注意的是,像谷歌和亚马逊这样的超大规模公司主要制造针对其自身生态系统优化架构的芯片。这些公司并不是想侵占英伟达的核心市场,而是创造完全适合高效利用资源以满足自身需求和 AI 模型的替代方案。


例如,谷歌一直在创建自己的 TPU来加速机器学习任务。而亚马逊的 Trainium 和 Inferentia芯片则推出了用于训练和性能的定制 AI 芯片。亚马逊通常遵循削价定价策略,因此我预计这些芯片的价格也将具有竞争力。


现实情况是,许多开发人员和客户不需要昂贵的英伟达 GPU(他们通常按小时租用),而主要好处最终是节省时间(除非模型训练任务巨大,而且他们可能会坚持使用英伟达,从而使更便宜的模型的优势变得毫无意义)。


AMD也凭借其 Instinct MI300X 取得了重大进展,该产品旨在成为英伟达解决方案的更便宜的替代品。值得注意的是,微软和Meta 等公司已经开始将 MI300X 集成到其数据中心,这意味着 AMD 正在取得进展。


与此同时,微软和 Meta也在开发自己的芯片,这既是出于战略原因,也是出于财务原因。目前,英伟达基本上控制着整个供应链,相信 Majestic 7 的其余部分不会支持这种对利润丰厚的 AI 市场的控制。


然而,就目前情况而言,这些芯片都是为满足特定工作负载而定制的,或旨在完全削弱英伟达到目前为止,还没有一家公司试图成为“下一个 英伟达”或创造更出色的 GPU。他们都遵循着自己独特的战略,所以现在威胁看起来很小,但肯定正在出现。但无论如何,即使这些公司有自己的芯片,英伟达也已经将软件锁定在 CUDA 和用于 AI 训练和推理的众多集成软件中。对于竞争对手来说,这些库需要从头开始构建和维护,即使对于一整个经验丰富的软件工程师团队来说,这也是一项艰巨的任务。此外,目前没有其他 GPU 足够强大,能够及时且经济高效地训练下一代 AI 模型。超大规模企业目前的举动似乎更像是成本优化和多样化的衡量标准,而不是完全取代英伟达,而其 Blackwell Ultra 和 Rubin 版本继续表明它是 AI 基础设施的黄金标准。没有公司试图超越英伟达的领先地位,因为目前这样做完全是徒劳的,相反,他们试图进行不对称竞争,或者只是提供更便宜的替代品。就竞争而言,英伟达目前似乎继续称王,并占据 AI 基础设施市场的最大份额。


Blackwell Ultra 的每次部署价值高于前几代产品。英伟达新的基于 GB300 的 AI 工厂(使用 Blackwell Ultras)就是这方面的一些证据。它允许在一个机架中扩展多达72 个 GPU以进行推理。由于这些“AI 工厂”在内存和吞吐量方面都表现出色,它们估计可以比基于上一代 Hopper 芯片的工厂产生高达 50 倍的收入。像 AWS、谷歌和微软这样的超大规模企业将迅速购买这些最新芯片,因为它们追求自己的 AI 愿景,此外还会购买自己的芯片进行专门优化。但新一代英伟达芯片最棒的一点是,它们还发布了与之交互的软件,例如Dynamo 推理网络框架。这意味着英伟达可以提供硅片以及类似于亚马逊 AWS 的高利润软件销售,以充分利用这波已经出现并快速增长的新一波推理 AI。


这些新芯片显然瞄准了新一轮人工智能投资浪潮,旨在实现推理和推论,这让看跌者大吃一惊,这是人工智能领域的长期和高信念投资。看跌者一直在寻找英伟达可能和将会失败的方式,而这始终表明英伟达一直处于领先地位。


图表


过去三个月英伟达股价的下跌是非理性的,且出于恐惧。关税和其他地缘政治因素不会改变人工智能的论点。如果说有什么不同的话,那就是现在是买入英伟达的绝佳时机,只希望它跌得更多。


英伟达被低估有几个原因,即分析师预测 AI 数据中心的发展空间将达到“万亿美元”,而英伟达正处于其中间。一些估计认为,这个发展空间大约需要 10-20 年,而且这只是我们能预见的近期情况。随着 AI 模型变得越来越智能(我认为我们大多数人都已经看到 ChatGPT 等 AI 模型呈指数级增长),可以合理地假设 Nvidia 的估值也会随之上升。

该公司最近的业绩也带来了约 73-75% 的巨额毛利率。这意味着该公司可以凭借 Blackwell Ultra 和 Rubin 等芯片继续保持领先地位,并继续占据主导地位。

目前看来,英伟达势不可挡,它的抛售与该公司无关,因为整个市场目前都在遭受冲击。然而,尽管这些新芯片降低了竞争对手和超大规模企业发布自有芯片的吸引力,但这才是行业最终的发展方向,尤其是对于非常先进的人工智能应用而言。例如,如果像谷歌或亚马逊这样的公司不只是想要,而且需要定制芯片来实现最高效率并集成到他们的应用中,那么他们就会开发它,这至少会让英伟达出局。这究竟意味着什么尚不得而知,但看看其他超大规模企业如何利用自己的芯片将是一个关键的风险管理因素。

此外,虽然英伟达迎合了大多数“高端”市场的需求,但它这样做忽视了长尾市场,而 AMD 等公司生产的价格更便宜、竞争力越来越强的芯片更适合长尾市场。这些长尾应用包括大学实验室进行的实验或单个开发人员训练小众模型。单独来看,这些应用加起来不算多,但随着人工智能越来越普及,如果英伟达不能满足更多预算端市场的需求,这可能是一个错失的机会,但这可能是一个以后可以解决的问题。

如果看涨者需要确认人工智能革命尚未达到顶峰或处于泡沫之中,并且英伟达在这方面仍是王者,那么Blackwell Ultra 和 Rubin 芯片的发布应该会给他们信心,让他们以相对便宜的价格买入英伟达。它的护城河正在扩大,并且它在保持人工智能军备竞赛的领先地位方面表现出了极大的一致性。

【如需和我们交流可后台回复“进群”加社群】


美股研究社 美股研究社,一个专注研究美股的平台,专业的美股投资人都在这.想了解美国股市行情、美股开户、美股资讯、美股公司;
评论 (0)
  • 全球领先的光学解决方案供应商艾迈斯欧司朗(SIX:AMS)近日宣布,凭借AS1163独立智能驱动器(SAID)成为中国领先的智能集成系统产品汽车制造商宁波福尔达智能科技股份有限公司(“福尔达”)环境动态照明应用的关键供应商。此次合作标志着汽车技术发展的一个重要时刻,充分展现了AS1163在优化动态照明应用系统成本方面的多功能性和先进性能。该产品支持传感器集成,拥有专为车顶照明设计的超薄外形,并能提升车内照明系统的性能。AS1163是一款先进的智能LED驱动器,能够与开放系统协议(OSP)网络无缝
    艾迈斯欧司朗 2025-03-20 14:26 105浏览
  •         在当今电子设备高度集成的时代,电路保护显得尤为重要。TVS管(瞬态电压抑制二极管)和压敏电阻作为一种高效的电路保护器件,被广泛应用于各种电子设备中,用以吸收突波,抑制瞬态过电压,从而保护后续电路免受损坏。而箝位电压,作为TVS管和压敏电阻的核心参数之一,直接关系到其保护性能的优劣。箝位电压的定义        箝位电压指瞬态保护器件(如TVS二极管、压敏电阻)在遭遇过压时,将电路电压限制在安全范围内的
    广电计量 2025-03-20 14:05 100浏览
  • 如同任何对我们工作方式的改变,新的工作方式必然会遇到许多必须面对的挑战。如果不解决组织在实施精益六西格玛过程中面临的障碍以及如何克服它们的问题,那么关于精益六西格玛的讨论就不算完整。以下列举了组织在成功实施精益六西格玛时常见的几个障碍,以及克服它们的方法:1)对精益六西格玛方法论缺乏理解。抵触情绪通常源于对精益六西格玛方法论的不了解,以及不相信它能真正发挥作用。这种情况在所有层级的人员中都会出现,包括管理层。虽然教育培训可以帮助改善这一问题,但成功的项目往往是打消疑虑的最佳方式。归根结底,这是一
    优思学院 2025-03-20 12:35 108浏览
  • PCIe 5.0应用环境逐步成形,潜在风险却蠢蠢欲动?随着人工智能、云端运算蓬勃发展,系统对于高速数据传输的需求不断上升,PCI Express(PCIe)成为服务器应用最广的传输技术,尤其在高效能运算HPC(High Performance Computing)及AI服务器几乎皆导入了最新的PCIe 5.0规格,使得数据传输的双向吞吐量达到了128GB/s,让这两类的服务器能够发挥最大的效能。不过随着PCIe 5.0的频率达到16GHz,PCB板因为高频而导致讯号衰减加剧的特性,使得厂商面临很
    百佳泰测试实验室 2025-03-20 13:47 110浏览
  • 贞光科技代理的品牌-光颉科技高精密薄膜电阻凭借0.01%的超高精度,在AI服务器电源模块中实现了精确电压分配、优化功率因数和减少热损耗,显著提升系统能效和可靠性。在当今的数字时代,人工智能(AI)服务器已成为数据中心的核心。随着AI应用的激增,服务器的性能和能效需求也在不断提高。电源模块作为服务器的关键组件,其性能直接影响整个系统的效率和可靠性。本文将探讨光颉科技高精密薄膜电阻,特别是其0.01%的精度,如何在AI服务器电源模块中提升能效。电源模块在AI服务器中的重要性电源模块负责将输入电源转换
    贞光科技 2025-03-20 16:55 164浏览
  • 流感季急诊室外彻夜排起的长队,手机屏幕里不断闪烁的重症数据,深夜此起彼伏的剧烈咳嗽声——当病毒以更狡猾的姿态席卷全球,守护健康的战争早已从医院前移到每个人的身上。在医学界公认的「72小时黄金预警期」里,可穿戴设备闪烁的光芒正穿透皮肤组织,持续捕捉血氧浓度、心率变异性和体温波动数据。这不是科幻电影的末日警报,而是光电传感器发出的生命预警,当体温监测精度精确到±0.0℃,当动态血氧检测突破运动伪影干扰……科技正在重新定义健康监护的时空边界。从智能手表到耳机,再到智能戒指和智能衣物,这些小巧的设备通过
    艾迈斯欧司朗 2025-03-20 15:45 183浏览
  • 近日,保定飞凌嵌入式技术有限公司(以下简称“飞凌嵌入式”)携手瑞芯微电子股份有限公司(以下简称“瑞芯微”)正式加入2025年全国大学生嵌入式芯片与系统设计竞赛(以下简称“嵌入式大赛”),并在应用赛道中设立专属赛题。本次嵌入式大赛,双方选用基于瑞芯微RK3588芯片设计的ELF 2开发板作为参赛平台,旨在通过此次合作,促进产教融合,共同推动嵌入式系统创新人才的培养。全国大学生嵌入式芯片与系统设计竞赛是一项A类电子设计竞赛,同时也是被教育部列入白名单的赛事,由中国电子学会主办,是学生保研、求职的公认
    飞凌嵌入式 2025-03-20 11:53 97浏览
  • 家电“以旧换新”政策的覆盖范围已从传统的八大类家电(冰箱、洗衣机、电视、空调、电脑、热水器、家用灶具、吸油烟机)扩展至各地根据本地特色和需求定制的“8+N”新品类。这一政策的补贴再叠加各大电商平台的优惠,家电销售规模显著增长,消费潜力得到进一步释放。晶尊微方案为升级换代的智能家电提供了高效且稳定的触摸感应和水位检测功能,使得操作更加便捷和可靠!主要体现在:水位检测1健康家电:养生壶、温奶器、加湿器的缺水保护安全2清洁电器:洗地机、扫地机器人的低液位和溢液提醒3宠物家电:宠物饮水机的缺水提醒/满水
    ICMAN 2025-03-20 15:23 162浏览
  • 本文内容来自微信公众号【工程师进阶笔记】,以工程师的第一视角分析了飞凌嵌入式OK3506J-S开发板的产品优势,感谢原作者温老师的专业分享。前两周,有一位老朋友联系我,他想找人开发一款数据采集器,用来采集工业现场的设备数据,并且可以根据不同的业务场景,通过不同的接口把这些数据分发出去。我把他提的需求总结了一下,这款产品方案大概有以下功能接口,妥妥地一款工业网关,在网上也能找到很多类似的产品方案,为啥他不直接买来用?再跟朋友深入地聊了一下,他之所以联系我,是因为看到我在公众号介绍过一款由飞凌嵌入式
    飞凌嵌入式 2025-03-20 11:51 129浏览
  • 为有效降低人为疏失导致交通事故发生的发生率,各大汽车制造厂及系统厂近年来持续开发「先进驾驶辅助系统」ADAS, Advanced Driver Assistance Systems。在众多车辆安全辅助系统之中,「紧急刹车辅助系统」功能(AEB, Autonomous Emergency Braking)对于行车安全性的提升便有着相当大的帮助。AEB透过镜头影像模块与毫米波雷达感测前方目标,可在发生碰撞前警示或自动刹车以降低车辆损伤以及乘员伤害。面临的挑战以本次分享的客户个案为例,该车厂客户预计在
    百佳泰测试实验室 2025-03-20 15:07 119浏览
我要评论
0
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦