作者 | Aseity Research
编译 | 华尔街大事件
英伟达(NASDAQ:NVDA)最近发布了其新系列Blackwell Ultra和 Rubin 芯片,相信它们将引领下一波人工智能投资浪潮。如果生成式人工智能是第一个,那么推理式人工智能将是第二个,这些芯片似乎考虑到了这些架构。本质上,Blackwell 是 2024 年发布的 2024 Blackwell 型号的涡轮增压版。这些芯片提供的一些最大好处是内存带宽大幅增加,单个 GPU 上的内存带宽从 192GB 飙升至 288GB。实际上,这使得这些 GPU 能够处理更大的人工智能模型,从而使它们能够高效处理密集型工作负载。它们对于训练深度学习应用程序也更加实用。
这些芯片的另一个主要特点是,除了拥有更大的内存之外,它还建立在 Blackwell 的“基于图块”的设计之上,而 Ultra 系列旨在进一步增强这一设计,使性能比其前代产品提高约 1.5 倍。
Rubin 将于 2026 年发布,将取代 Blackwell,由一对芯片组成。它们由一个名为 Vera 的定制 Arm CPU组成,旨在并行工作。这是 AI 进化的又一步,因为它取代了当前的 Grace CPU + GPU 设置,用于将 AI 集成到不同的工作负载中。与 Blackwell 一样,Rubin 还将采用基于 Tile 的设计,可容纳四个 Tile,这意味着它可以在单个封装内扩展多个芯片。
随着人工智能变得越来越普遍,这种“基于区块”的模块化设计将成为常态。它本质上允许用户“混合搭配”不同类型的芯片以适应特定的工作负载。例如,人工智能区块可能具有张量核心,而通用区块可能具有基于 Arm 的核心。通过将它们组合在一起,可以使它们更加灵活,并适应各种行业。
Rubin 设计的整体情况是,据估计,AI 系统可以达到每秒50 千万亿次浮点运算的 AI 推理速度,比目前的 Blackwell 芯片高出约 2.5 倍。展望 2027 年,也就是 Rubin Ultra 发布之时,英伟达计划将两个 Rubin GPU 融合在一起,目标是实现每秒 100 千万亿次浮点运算的速度和 1 兆字节的板载内存,这将大大加速 AI 的发展。
新的 Blackwell Ultra 和 Rubin 芯片不仅大幅提升了 AI 性能,而且也旨在提高推理能力。如果没有与其能力相匹配的互补推理,就无法拥有复杂的 AI 推理模型。对高速推理的需求变得比以往任何时候都更加迫切,AI 被集成到越来越多的新设备中。
这之所以重要,是因为人工智能中的传统推理通常依赖于静态模型执行,类似于运行简单的编程脚本,尽可能简单地说。但人工智能推理需要更复杂、更动态的内存密集型计算,这些计算通常需要实时调整。例如,自动驾驶汽车需要根据新的输入不断更新其理解,这与以前的推理有很大不同,以前的推理通常以确定性的方式运行人工智能策略。
新款 Blackwell Ultra 在这方面的优势主要来自于内存的大幅增加,每个 GPU 从 192GB 增加到 288GB,适合多步逻辑计算。一些推理模型,如 OpenAI 的 o1、Grok-3 或 DeepSeek ( DEEPSEEK ) 的 DeepSeek-R1,每秒消耗的令牌数量比前几代高出许多,这意味着推理也必须扩大规模才能满足需求。
另一方面,Rubin 允许 AI 模型将工作负载分配到不同的处理单元。与仅使用 GPU 的推理(在并行处理方面表现出色,但在顺序或逻辑驱动任务上表现不佳)不同,Rubin 提供了一种混合方法。这种集成至关重要,因为推理不仅需要 GPU 中的原始能力,还需要理解(并记住)上下文、决策和顺序处理。为了大大简化问题,AI 模型将能够将逻辑任务卸载到 CPU,同时使用 GPU 进行计算。这使得英伟达的 AI 堆栈具有高度适应性,确保它可以在同一芯片内以更高的效率和功耗处理需要巨大 GPU 能力的传统工作负载以及逻辑决策。
英伟达被低估有几个原因,即分析师预测 AI 数据中心的发展空间将达到“万亿美元”,而英伟达正处于其中间。一些估计认为,这个发展空间大约需要 10-20 年,而且这只是我们能预见的近期情况。随着 AI 模型变得越来越智能(我认为我们大多数人都已经看到 ChatGPT 等 AI 模型呈指数级增长),可以合理地假设 Nvidia 的估值也会随之上升。
该公司最近的业绩也带来了约 73-75% 的巨额毛利率。这意味着该公司可以凭借 Blackwell Ultra 和 Rubin 等芯片继续保持领先地位,并继续占据主导地位。
目前看来,英伟达势不可挡,它的抛售与该公司无关,因为整个市场目前都在遭受冲击。然而,尽管这些新芯片降低了竞争对手和超大规模企业发布自有芯片的吸引力,但这才是行业最终的发展方向,尤其是对于非常先进的人工智能应用而言。例如,如果像谷歌或亚马逊这样的公司不只是想要,而且需要定制芯片来实现最高效率并集成到他们的应用中,那么他们就会开发它,这至少会让英伟达出局。这究竟意味着什么尚不得而知,但看看其他超大规模企业如何利用自己的芯片将是一个关键的风险管理因素。
此外,虽然英伟达迎合了大多数“高端”市场的需求,但它这样做忽视了长尾市场,而 AMD 等公司生产的价格更便宜、竞争力越来越强的芯片更适合长尾市场。这些长尾应用包括大学实验室进行的实验或单个开发人员训练小众模型。单独来看,这些应用加起来不算多,但随着人工智能越来越普及,如果英伟达不能满足更多预算端市场的需求,这可能是一个错失的机会,但这可能是一个以后可以解决的问题。
如果看涨者需要确认人工智能革命尚未达到顶峰或处于泡沫之中,并且英伟达在这方面仍是王者,那么Blackwell Ultra 和 Rubin 芯片的发布应该会给他们信心,让他们以相对便宜的价格买入英伟达。它的护城河正在扩大,并且它在保持人工智能军备竞赛的领先地位方面表现出了极大的一致性。
【如需和我们交流可后台回复“进群”加社群】