NVIDIA 加速计算、数据科学和研究领域专家预测,多模态模型将推动行业创新和效率提升。
今年,生成式 AI 可谓在企业中掀起了一场风暴。各行各业都在讨论如何更好地利用这项技术提高创新与创造力、改善客户服务、变革产品开发,甚至促进沟通。
IDC 预测 2025 年全球企业在 AI 解决方案上的支出将达到 3070 亿美元,并且到 2028 年将增长至 6320 亿美元,复合年均增长率为 29.0%。到 2030 年,AI 累计为全球经济带来的增长将达到 19.9 万亿美元,并将在同年推动全球 GDP 增长 3.5%。
AI 正在以惊人的速度发展,不过一些公司和初创企业在采用 AI 方面仍然进展缓慢,它们依然局限于测试或孤立的项目。出现这种情况的原因在于 AI 的效益因公司、用例和投资水平的不同而有所差异。
今年,越来越多的业界人士开始对 AI 保持乐观态度。Forrester Research 的 2024 年 AI 现状调查显示,三分之二的受访者认为其组织的 AI 项目投资回报率即使未达到 50%,也可以认为是成功的。
下一个即将到来的重要趋势是代理式 AI。这种自主或“推理型”AI 需要使用多样化的语言模型、精密复杂的检索增强生成堆栈以及先进的数据架构。
NVIDIA 在各个行业领域的专家已经对未来一年进行过预测。下面让我们听一听 NVIDIA 专家在 AI 推动企业、研究和初创企业生态系统方面的分享:
IAN BUCK
NVIDIA 超大规模和高性能计算副总裁
推理技术推动 AI 的发展:随着 AI 模型的规模和复杂性增长,对高效推理解决方案的需求也将持续攀升。
生成式 AI 的发展已经将推理从简单的查询识别和响应转变为复杂的信息生成,其中包括从多个来源和大语言模型(例如 OpenAI o1 和 Llama 450B)中进行总结,这极大地增加了计算需求。通过新的硬件创新成果以及持续的软件改进,性能将得到提升,并有望使总体拥有成本降低至原先的五分之一或更低。
加速一切:随着 GPU 的应用日益广泛,各行各业将着眼于加速从规划到生产的每个环节。新的架构将进一步推动这一良性循环,每一代产品都能够提高成本效益并实现数量级更高的计算性能。
各个国家和企业都在竞相建立 AI 工厂来加速更多的工作负载,预计众多参与者将寻求平台解决方案和数据中心参考架构或蓝图,从而使建立和运行数据中心的时间从原本的数月缩短至几周。这样能帮助他们更好地解决一些世界上最棘手的挑战,例如量子计算、药物发现等。
尽一切努力杜绝量子计算中的错误:研究人员通过使用超级计算和模拟来解决那些新生领域面临的最大挑战,即通过克服各类错误让量子计算实现巨大的跨越。
量子比特(Qubit)是量子计算中的基本信息单位,容易受到噪声的影响,仅在执行数千次运算后就会变得不稳定,这使得目前的量子硬件无法解决实际问题。2025 年,量子计算领域将逐步转向量子纠错这一具有挑战但又至关重要的技术。纠错需要快速、低延迟的计算。同时,我们还有望看到量子硬件在专用基础设施的支持下,在超级计算机内进行物理集群。
AI 也将在管理这些复杂的量子系统、优化纠错和提高量子硬件整体性能方面发挥至关重要的作用。将量子计算、超级计算和 AI 融合在加速的量子超级计算机中,将加快实现用于解决药物发现、材料开发和物流优化等各个领域中复杂问题的量子应用。
BRYAN CATANZARO
NVIDIA 深度学习应用研究副总裁
赋予 AI 具体形象:AI 将变得更容易使用、能够灵敏地作出情感反应并展现出更强的创造力和多样性。早期的生成式 AI 模型在绘制图像时甚至难以完成画牙齿这样简单的任务。而随着 AI 的飞速发展,生成的图像和视频变得更加逼真,AI 生成的声音也更加接近真人的感觉。
随着算法和数据集的完善,以及企业认识到 AI 需要有面孔和声音才能对 80 亿人产生影响,AI 的发展速度将进一步加快。这也促使 AI 的交互方式从回合制互动转变为更加流畅自然的对话。AI 交互将不再是一连串的问答,而是会变成更具吸引力、更像人类的对话。
重新思考行业基础设施和城市规划:各国和各行业将开始研究 AI 如何帮助经济的各个方面实现自动化,这样即使在全球人口减少的情况下也能维持现有的生活水平。
这些工作有助于实现可持续发展和应对气候变化。例如,农业将开始投资自动化机器人,这些机器人能够以机械方式清洁田地、清除害虫和处理杂草。这可以减少对杀虫剂和除草剂的使用,在保护地球健康的同时,解放人力去做其他更有意义的工作。城市规划部门也有望引入新的思路,来适应在自动驾驶汽车的发展并改善交通管理。
从长远来看,AI 有助于找到碳减排和碳封存的办法,来解决这个迫在眉睫的全球性挑战。
KARI BRISKI
NVIDIA 生成式 AI 软件副总裁
智能体的交响乐 — AI 编排器:企业将部署大量 AI 智能体,这些智能体是经过训练的半自主模型,能够在企业内部网络进行客户服务、人力资源、数据安全等任务。为了更大限度提高这些任务的效率,预计数量不断增加的 AI 编排器能够将人类查询流畅地引导至多个智能体,综合结果并加以解释,从而为用户提供建议并采取行动。
编排器将能够深入理解内容、具备多语言能力,并能够流畅处理包括 PDF、视频流等多种数据类型。在自学数据飞轮的驱动下,AI 编排器将持续完善对特定业务的洞察。例如,在制造业中,AI 编排器可以通过分析实时数据、根据生产计划和供应商谈判提出建议来优化供应链。
企业 AI 领域的这一演变将显著提高各行各业的生产力和创新力,同时变得更易于获取。知识工作者的生产力将提高,因为他们能够利用由 AI 驱动的专家组成的个性化团队。开发人员也可以通过可定制的 AI blueprint 构建这些先进智能体。
多步推理增强 AI 洞察:多年来,AI 一直擅长回答特定问题,而无需深入研究问题的上下文。随着加速计算和新模型架构的发展,AI 模型将应对越来越复杂的问题,并以更高的精准度且更深入的分析做出回答。
通过使用一种被称为“多步推理”的功能,大而复杂的问题可以被分解为较小的任务,有时甚至还会进行多次模拟,以便从多个角度解决问题。由此,AI 系统可以增加“思考时间”。这些模型会动态评估每个步骤,确保作出与上下文相关且清晰明了的回答。多步推理还会整合来自各种来源的知识,使 AI 能够建立逻辑联系,并合成不同领域的信息。
这可能会影响金融、医疗健康、科研和娱乐等多个领域。例如,具备多步推理能力的医疗健康模型可以根据患者的诊断、用药情况和对其他治疗的反应,提出一系列建议供医生参考。
开启您的 AI 查询引擎:对于拥有 PB 级数据的企业和研究机构来说,他们所面临的挑战是如何快速访问这些数据并提供可操作的洞察。
AI 查询引擎将改变企业挖掘数据的方式,企业专用的搜索引擎可筛选结构化和非结构化数据(包括文本、图像和视频等),利用自然语言处理以及机器学习来理解用户意图,并提供更加相关且全面的结果。
这将推动更智能的决策流程,增强客户体验并提高各行业的生产力。依靠自身持续学习的能力,AI 查询引擎将创造出能进行自我改进的数据飞轮,帮助应用程序变得更加有效。
CHARLIE BOYLE
NVIDIA DGX 平台副总裁
代理式 AI 使高性能推理成为企业不可或缺的能力:代理式 AI 的出现将推动对复杂多模型系统近乎实时响应的需求。这将使高性能推理变得与高性能训练基础设施同样重要。IT 领导者将需要具有扩展能力、专门构建且经过优化的加速计算基础设施以满足代理式 AI 的需求,从而实现实时决策所需的性能。
企业扩展 AI 工厂,将数据转化为智能:企业 AI 工厂可以将原始数据转化为商业智能。企业将在 2025 年扩展这些工厂,以利用大量历史数据和合成数据,为消费者行为、供应链优化、金融市场波动到工厂和仓库数字孪生生成预测和模拟。由于 AI 工厂能够帮助早期用户预测并塑造未来情景,而不仅仅是对其作出反应,因此将成为企业的一项关键竞争优势。
液冷 AI 数据中心成为新趋势:随着 AI 工作负载不断推动增长,领先的企业为了实现性能和能效的最大化将转向液冷技术。超大规模云提供商和大型企业将引领这一趋势,率先在容纳成千上万的 AI 加速器、网络和软件的新 AI 数据中心中采用液冷技术。
为了减轻大规模设计、部署和运营智能制造所带来的财务负担,越来越多的企业将不再建造自己的 AI 基础设施,而是选择在托管设施中部署或者按需租用容量。这些部署将帮助企业无需自行安装和运营就能充分利用最新的基础设施。这一转变将加速液冷技术作为 AI 数据中心主流解决方案在行业中的广泛应用。
GILAD SHAINER
NVIDIA 网络高级副总裁
告别传统网络,迎接计算网时代:随着数据中心架构走向统一计算网架构(computing fabric),“网络”一词将在数据中心成为过去。统一计算网能使成千上万的加速器通过横向和纵向两种通信扩展方式,利用英里级长度的线缆实现多个数据中心设施之间的高效通信。
这种统一计算网将包括面向纵向扩展通信的 NVIDIA NVLink 网,以及面向横向扩展通信的智能交换机、SuperNIC 和 DPU。这将有助于在加速器之间安全地传输数据,并在传输过程中执行计算从而最大限度地减少了数据移动。跨越全网的横向扩展通信对于大规模 AI 数据中心的部署至关重要,能使 AI 数据中心从部署到开机运行的时间从数月乃至数年缩短至数周。
随着代理式 AI 工作负载的增长,需要在多个相关的 AI 模型之间进行通信,协同工作;而非使用单一的、本地化的模型,计算网将成为实现实时生成式 AI 的关键。
分布式 AI:随着全新的以太网设计,所有数据中心都将被加速,并让数十万块 GPU 能够支持单一工作负载。这将有助于实现 AI 工厂在多租户生成式 AI 云和企业 AI 数据中心中的普及。
借助这一突破性技术,AI 能够快速扩展到企业平台并简化 AI 云的构建与管理。
由于电力限制和数据中心应该尽量靠近可再生能源的源头的需求,企业将会把数据中心建立在更加分散的地域。它们之间相隔数百甚至数千英里,横向扩展通信必须能确保长距离的可靠数据传输。
LINXI(JIM)FAN
NVIDIA AI 智能体高级研究科学家
机器人将朝着人形机器人的方向发展:机器人将开始理解任意语言指令。目前,工业机器人必须手动编程,并且它们无法对不可预测的输入或编程语言以外的语言做出智能响应。融合了视觉、语言和任意动作的多模态机器人基础模型将推动这种“AI 大脑”的发展。同时,代理式 AI 也将使 AI 的推理能力更强。
当然,我们不能指望马上就能在家庭、餐厅、服务区和工厂看到智能机器人。但这些应用场景可能比我们想象的要更加接近,因为各国政府纷纷寻找应对老龄化社会和劳动力资源短缺的解决方案。物理自动化将逐步实现,10 年内将会像 iPhone 一样无处不在。
推理是 AI 智能体的核心能力:今年 9 月,OpenAI 发布了一种经过强化学习训练并用于执行复杂推理任务的新型大语言模型 OpenAI o1。OpenAI o1 还被称为“Strawberry”。这个模型在回复用户之前能够生成一条长的内部思维链,在纠正错误的同时将复杂的步骤分解为简单的步骤,然后再响应用户。
2025 年将成为大量计算开始转向边缘推理的一年。应用程序可能需要成千上万个的 token 来处理单次查询,因为小语言模型会在微秒内连续进行多次查询直至生成答案。
小型模型将变得更加节能并对机器人技术日益重要,借助小型模型能创造出协助人类完成日常工作的人形机器人和普通机器人并促进移动智能应用的发展。
BOB PETTE
NVIDIA 企业平台副总裁
寻求可持续的扩展能力:企业准备使用新一代半自主 AI 智能体改进各种业务流程,他们将着重通过构建强大的基础设施、治理机制和类人能力,以实现有效的大规模部署。与此同时,AI 应用将越来越多地运用本地处理能力,使更加复杂的 AI 功能能够直接在工作站(包括轻薄型笔记本电脑和紧凑型设备)上运行,从而提升性能并减少 AI 驱动任务的延迟。
经过验证的参考架构提供了有关合适的软硬件平台的指导,因此将成为优化性能和加速 AI 部署的关键。这些架构将成为企业适应复杂的 AI 实施领域的重要工具,有助于确保企业的投资符合当前需求和未来的技术发展。
使用 AI 为建筑、工程和设计行业带来变革:预计将出现更多专为建筑、工程和设计行业量身定制的生成式 AI 模型,来提升这些行业的效率并加速创新。
在建筑行业,代理式 AI 能将从现场传感器和摄像头采集的大量建筑数据中提取有意义的信息,提供更高效的项目进度安排和预算管理的洞察。
AI 将全天候评估实景捕捉数据(激光雷达、摄影测量和辐射场),提炼出有关质量、安全与合规的关键洞察,以此减少错误和工地伤害。
对工程师而言,基于物理信息神经网络的预测物理学将加速洪水预测、结构工程和计算流体力学的发展,从而为建筑的各个房间或楼层量身定制气流解决方案,使设计更新迭代更加迅速。
在设计行业,检索增强生成可以在设计初期尽早实现合规,确保用于设计和建造建筑的信息建模符合当地建筑规范。扩散 AI 模型通过允许建筑师和设计师结合关键词提示与粗略草图生成内容丰富、详尽的概念图来更快完成概念设计和场地规划,并用于客户展示。这样他们就能抽出时间专注于研究和设计。
SANJA FIDLER
NVIDIA AI 研究副总裁
预测不可预测的情况:未来将出现更多能够在日常生活中学习的模型,它们能够在几乎没有人工干预的情况下,运用非常复杂的技能帮助数字人、机器人甚至自动驾驶汽车理解混乱的、有时甚至不可预测的情境。
无论是研究实验室还是华尔街都将迎来新一轮的发展规律周期,这类似于 5-7 年前对自动驾驶的乐观预期。Waymo 和 Cruise 等公司花费多年时间才推出了一套可行的系统,但由于这些公司和包括特斯拉在内的其他公司所采集的大量数据可能无法适用于所有地区,因此这套系统仍然无法进行规模化。
借助今年推出的模型,我们现在能够以更快的速度利用互联网规模的数据理解自然语言,并通过观察人类和其他行为来模拟动作,从而大大减少投资。机器人、汽车和仓库机械等边缘应用将快速学会协调、提高灵活性和其他技能,以便在现实世界中导航、适应和交互。
机器人能在您的厨房里煮咖啡、煎鸡蛋后清理干净吗?现在还不能,但这一切可能比你想象的要更快实现。
日趋真实:生成式 AI 在图形和模拟领域的全流程中逐步实现高保真和逼真效果,带来超逼真的游戏、AI 生成电影和数字人。
不同于传统图形技术,绝大多数图像将来自生成的像素而非渲染,从而呈现出更自然的动作和外观。借助情境行为开发和迭代工具能使游戏能够以远低于当今 3A 游戏的成本制作出更为复杂的游戏。
各行各业采用生成式 AI:几乎所有行业都准备利用 AI 来提升和改进人们的生活和娱乐方式。
农业将使用 AI 优化食物供应链,改善食物的运送。例如,可以使用 AI 预测各个农场不同农作物的温室气体排放量。这类分析可以为制定减少供应链中温室气体排放的设计策略提供参考。与此同时,教育行业将使用 AI 智能体创造个性化的学习体验,这些 AI 智能体将使用学生的母语进行交流并根据学生特定学科的水平提出或回答问题。
随着下一代加速器进入市场,这些生成式 AI 应用的交付效率将大大提高。通过提高模型在训练和测试中的效率,企业和初创公司将在这些应用中获得更高、更高的投资回报。
ANDREW FENG
NVIDIA GPU 软件副总裁
加速数据分析在无更改代码的情况下提供洞察:2025 年,企业将主要采用加速数据分析来应对日益增长的数据量。
企业每年产生数百 PB 的数据,每家公司都在寻求可以利用这些数据的方法。为此,许多公司将采用加速计算进行数据分析。
未来将支持“零代码更改”和“零配置更改”的加速数据分析解决方案,使企业能够以最小的工作量将现有的数据分析应用与加速计算相结合。生成式 AI 赋能的分析技术将进一步扩大加速数据分析的应用范围,使即便不具备传统编程知识的用户也能够创建新的数据分析应用。
经过简化的开发者体验促进了加速计算的无缝集成,这将帮助企业消除使用加速计算的障碍,使企业能够利用其独特的数据开发新的 AI 应用和更丰富的商业智能。
NADER KHALIL
NVIDIA 开发者技术总监
初创企业的员工队伍:到了 2025 年,提示词(Prompt)工程师和 AI 个性设计师将变得广为人知。随着企业积极使用 AI 提高生产力,预计在初创企业和企业中将出现融合新技能和现有技能的新型骨干员工。
提示词工程师在为聊天机器人和代理式 AI 创建、测试和迭代提示设计的基础上,设计并完善能够优化 AI 训练和产生预期结果的精确文本字符串。对提示词工程师这一岗位产生需求的行业将从科技扩大到法律、客户支持和出版等。随着 AI 智能体的普及,企业和初创企业将越来越依赖 AI 个性设计师为智能体赋予独特的个性。
正如计算机的发展催生了计算机科学家、数据科学家、机器学习工程师等工作岗位,AI 也将创造出各种新的工作岗位,为具有强大分析能力和自然语言处理能力的人才提供更多机会。
了解员工效率:越来越多将 AI 融入业务实践的初创企业将在与投资者和商业伙伴交流时,把“每位员工的收入贡献”(RPE)作为他们洽谈的话题之一。
AI 对员工工作的辅助将使初创企业的管理者重点关注所雇用的每一名新员工如何帮助企业中的其他员工创造更多收入,而不是采取“不惜一切代价实现增长”的思维方式。初创公司在讨论 AI 投资回报以及与大型企业和科技公司争夺人才填补空缺职位所面临的挑战时,RPE 是一个很好的切入点。
编者注:有关 AI 解决方案支出的数据来自 IDC 的《IDC FutureScape: Worldwide Generative Artificial Intelligence 2025 Predictions》报告,文件编号 US52632924,发布于2024 年 10 月;有关 AI 经济影响的数据来自 IDC 的新闻稿“IDC FutureScape: The AI Pivot Towards Becoming an AI-Fueled Business”,发布于 2024 年 10 月。
点击“阅读原文”或扫描海报二维码,北京时间 1 月 7 日(星期二)上午 10:30 观看 NVIDIA CEO 黄仁勋在拉斯维加斯现场发表的 CES 开幕主题演讲。