图片为豆包 AI 生成
1 月 7 日,被誉为「科技春晚」的 CES 在美国拉斯维加斯拉开序幕,英伟达 CEO 黄仁勋穿着标志性皮夹克登场,就英伟达即将发布的产品和未来布局发表了主题演讲。
相比游戏玩家对新一代消费显卡的热切期盼,黄仁勋将更多篇幅留给了 AI 智能体、NVIDIA Cosmos 世界基础模型、自动化数字工厂、自动驾驶、人形机器人等未来 AI 的重要应用领域,为大众绘制了一幅英伟达的数字宇宙蓝图。有媒体评价英伟达的这一系列部署,不亚于想「掌控世界」。
资本市场也迅速做出反应,英伟达的股价上涨了 3.43%,股几近冲破历史峰值,彰显出市场对其战略布局的高度认可与强烈信心。毕竟,英伟达芯片是推动 AI 技术变革的核心力量。
结合黄仁勋在 CES 2025 的演讲内容,我们来看下黄仁勋如何应用英伟达的创新技术赋能 AI,构建英伟达「AI 宇宙」。
在科技领域,英伟达堪称传奇。
从另辟蹊径,推出首款 GPU,提升图形渲染技术,让游戏画面有了质的飞跃,到 All In AI,专注生产人工智能芯片,英伟达一直在计算领域敢为天下先。
黄仁勋曾坚定表示:「我们的目标是为人类做出贡献。这意味着,我们不会走别人走过的老路,而是打造别人不曾打造的产品。」
这份执着以及对计算机技术的热忱和远见,使英伟达成功改写全球芯片格局。
2012 年,黄仁勋将他重金打造的全球第一台超算 DGX-1 捐赠给了旧金山的一家非盈利性机构。也许当时的黄仁勋也没意料到,他会利用这台超算,打造出世界第一个大语言模型 - ChatGPT。
这家公司,就是后来的 Open AI。
ChatGPT 的爆火,让英伟达的芯片一夜之间声名鹊起,成为全球科技界竞相争逐的产品,千金难求。
而由 ChatGPT 掀起的人工智能浪潮已经席卷全球各行各业,深度重塑社会经济和生活形态。对于未来,黄仁勋有自己的愿景,「AI 不再知识用来写代码和生成图片,它将会彻底改变我们的生活和工作方式」。
在黄仁勋的演讲中,这些改变主要集中在四个方面:
从当下的视角来看,这未来愿景仿佛空中楼阁,还在遥远的未来,不过这绝非是黄仁勋的无稽之谈,而是基于英伟达强劲的软硬件技术以及正在搭建的 AI 生态的合理展望。
英伟达的成功,离不开其强大的 GPU 架构。
最新发布的 GeForce RTX 50 系列 Blackwell 架构,集成高达高达 920 亿个晶体管,人工智能浮点运算能力飙升至四千万亿次,带宽达 1.8TB/s,相较于上一代实现翻倍提升。
在光追技术全开的极致工况下,能够以 4k 240 帧率流畅运行游戏,配合升级至第四代的 AI 超分 DLSS 4,渲染速度呈八倍速飞跃,当之无愧为「性能怪兽」。
随后,黄仁勋还展示了结合强大 GPU、CPU、内存、网络和数据处理能力的 Blackwell 架构的 NVLink72。
72 指的是其由 72 个 Blackwell GPU 组成,其 AI 浮点运算性能高达 1.4 exaflops,超越了目前世界上最快的超级计算机。
未来可用于需要大量计算资源的领域以及大规模机器模型训练等。
在 ChatGPT 取得成功后,各个科技企业也争相涌入 AI 领域,开发了自己的 AI 大模型,我们耳熟能详的有谷歌的 Gemini、百度的文心一言、华为的盘古大模型等。
随着 AI 大模型的发展和应用,一系列挑战也接踵而至。
AI 大模型需要海量的训练数据来学习各种知识和模式,随着参数和数据量的增加,大模型的训练成本也呈指数递增。
Anthropic 首席执行官表示:未来三年,AI 模型训练成本可能会可能飙升至百亿乃至千亿美金之巨。
同时,其推理与调度能力短板明显,复杂任务执行捉襟见肘。在此背景下,AI 智能体(AI Agent)应运而生,成为下一个重要的 AI 风口。
那问题来了,什么是 AI 智能体?
AI 智能体的本质通过智能体实现人类思考行为模式的数字映射。经过训练的 AI 智能体,可以通过通过工具与外部系统连接,高效地利用感知到的实时环境数据进行快速决策和行动。
未来,AI 智能体有望参与到更多复杂的环境中,如成为研究或实验室助理,监测实验数据和比对实验结果,并给出更科学的实验方案。
它不再是简单的某种模型,而是一个能够理解任务、规划和采取行动的数字工作者。
为了助推生态系统构建自主智能体 AI ,英伟达创建了三大工具:NVIDIA NIMS、NVIDIA NEMO 和一系列开源蓝图。
同时发布了基于 NVIDIA LLAMA Nemotron 语言基础模型的完整模型家族。
借助一系列的开源模型,企业可以轻松获取适配自身需求的模型,结合 NIM 预训练模型和 NEMO 框架组织,轻松创建和管理专属 AI 应用,集成专属 AI 智能体并实现部署。
这意味着,未来企业的 IT 部门,有可能转型成为 AI 智能体的「管家」,专注培育和管理数字劳动力,而AI智能体也将成为用户的AI助手,帮助人们有效化解工作难题,从全面提升人机协同办公效率,开启智能办公新纪元。
NVIDIA Cosmos:一个可以理解物理世界的基础模型。
当前 AI 在大语言模型中已经有相当出色的表现,能理解认知层面的知识和智能,不过,它对物理世界知之甚少。因此,让 AI 理解物理世界成为 AI 发展的关键突破方向。
黄仁勋表示,「AI,不应只局限于语言模型中,我们需要教导 AI 理解物理智能」。
这次 CES,英伟达重磅推出 NVIDIA Cosmos,一个理解物理世界的世界基础模型,旨在推动物理 AI 的发展。
黄仁勋表示,世界基础模型对于推动机器人和自动驾驶的开发至关重要,但很多开发者还未拥有自主训练模型所需的数据和资源。
开发者可以使用 NVIDIA Omniverse 构建基于物理的、地理空间的三维场景,然后将 Omniverse 渲染输出到 Cosmos,Cosmos 就能生成逼真的、基于物理的合成数据,涵盖不同的物体、环境以及天气、时间或极端情况等条件。
两者的结合可以为开发者提供一个物理模拟的、多元宇宙生成器。
Cosmos 可分为 Nano、Super、Ultra 三档:
Cosmos一词可译为「宇宙」,可见英伟达的「野心」绝不止是创造一个世界基础模型,而是未来在机器人领域的应用。
基于 Cosmos 和 Omniverse,黄仁勋进而谈到了英伟达在工业界的战略:三体计算机解决方案。
这三台计算机为:
基于三体计算机解决方案,目前英伟达计划部署应用的机器人领域有:自动化未来工厂、自动驾驶、人形机器人。
工厂借助 Cosmos 与 Omniverse 构建工厂的数字孪生,模拟海量未来场景,训练机器人寻优路径,提升生产效率;自动驾驶与人形机器人领域,英伟达推出计算力飙升 20 倍的 Thor 机器人电脑。
凭借 Omniverse、AI 模型与 Cosmos 协同生成高保真 4D 环境与海量训练数据。从Thor机器人电脑到 Cosmos 模型,英伟达为车企和机器人开发公司提供了从硬件到软件的整套解决方案,加速了其智能化的发展。
本次发布会中,英伟达也靠实力秀了一波「朋友圈」。
在 PC 端,与 Windows 紧密合作,将持续支持和维护 WSL2 平台,将 Windows PC 打造成世界一流的 AI PC,使用户轻松获取英伟达强大的 AI 支持。
在汽车领域,英伟达目已与特斯拉、奔驰、丰田、小米、比亚迪、理想等车企强强联合,今年,Aurora 和大陆集团将加入阵营,共同发力部署无人驾驶卡车。英伟达还将基于 NVIDIA Drive 平台与合作车企共同开发下一代该机自动驾驶系统和自动驾驶汽车产品。
发布会现场,黄仁勋展示了 14 款合作人形机器人,如 Figure 02、Agility A2、1X NEO 以及小鹏的 Iron 等。
除此之外,英伟达还慷慨地提供了海量的开源蓝图,鼓励更多企业和开发者踊跃应用其AI模型,从而加速创新落地。
尽管业界普遍认为,AI 智能体在 2025 年将实现更高程度的普及,并具备独立处理更复杂的业务的能力。但现阶段而言,的智能体仍是低代码产品,缺乏自我反思和规划能力,仅能按照预设的程序逻辑执行业务。
例如,在当前的智能客服应用场景中,智能体虽能够依据既定的问答模板对常见问题进行回应,但面对复杂且具有歧义的客户咨询时,往往无法像人类客服那样进行深入思考与灵活应对,其处理结果的准确性和有效性受到较大限制。
因此,AI 智能体能否在短期内成为主流应用范式,尚存在诸多不确定性,仍需观望。
关于 Cosmos 模型在自动驾驶领域的应用,也有人提出质疑,称:「合成驾驶数据有点像使用 ChatGPT,您可能相信您所看到的是真实的,但如果没有进一步验证,您通常无法完全确定。相比之下,现实世界的视频驾驶数据是可靠的,并且代表了真实、合法的场景发生时的情况。」
特斯拉 CEO 马斯克对这一观点表示认同并转发评论:正确(Correct)。
尽管黄仁勋所提出的 「数字孪生」概念极具创新性与吸引力,但在实际构建高度拟真的 4D 驾驶环境并应用于自动驾驶训练方面,仍面临诸多技术难题与挑战。
例如,在模拟复杂的天气条件(如暴雨、暴雪、浓雾等)、极端的交通状况(如突发交通事故、道路施工、交通拥堵等)以及多样化的道路场景(如山区弯道、狭窄街道、高速公路出入口等)时,现有的 AI 技术尚无法精确还原真实世界的所有细节与动态变化。
那么基于此类模拟环境训练出来的自动驾驶模型在实际应用中很可能出现适应性不足的问题。
尽管对未来愿景保有质疑,但对于英伟达将凭借其强大的 GPU 架构与领先的 AI 技术重塑未来科技格局,引领未来 AI 变革浪潮这件事似乎比较确定。