北京时间3月19日凌晨,英伟达 GTC 2025 大会在加州圣何塞正式举办,黄仁勋发布了 Blackwell GPU、硅光交换机、机器人模型等一系列重磅产品。
作为GTC的重头戏,黄仁勋在演讲中宣布推出数据中心AI GPU的新一代产品——NVIDIA Blackwell Ultra GPU,而Blackwell Ultra NVL72 平台将于 2025 年下半年推出,具有两倍的带宽和 1.5 倍更快的内存。
随后,黄仁勋还重磅公布了新一代 AI 芯片 Rubin,也就是 Hopper、Blackwell 之后的下一代架构。
Vera Rubin NVL144 将于 2026 年下半年推出,而 Rubin Ultra NVL576 将于 2027 年下半年推出。
黄仁勋展示了 Rubin 系统的参数,并宣称 Rubin 的性能可达 Hopper 的 900 倍,而 Blackwell 是 Hopper 的 68 倍。
值得一提的是,英伟达宣布Blackwell GPU已经创下满血版DeepSeek-R1推理性能的世界纪录。
单个配备8块Blackwell GPU的NVIDIA DGX系统,可实现每位用户每秒超过250个token,或每秒超过30000个token的最大吞吐量。
通过硬件和软件的结合,英伟达自今年1月以来将DeepSeek-R1 671B模型的吞吐量提高了约36倍,相当于每个token的成本降低了约32倍。
可见,英伟达GPU在AI芯片领域的成熟度和生态完善度,在短期内难以被撼动。
通过把DeepSeek的AI不断提速,英伟达还将继续捍卫其在AI芯片领域的霸主地位。那么像OpenAI、DeepSeek这样的公司,也许会在未来的AI产业链中占据更重要的位置。
(END)
文章来源:微果酱 公众号