企业正在加快推行 AI 技术,并开始构建采用生成式 AI 的最佳实践,NVIDIA AI 专家预测,各行各业都将因此而快速转型
今年的《韦氏企业词典》(Merriam-Webster: Enterprises)年度词汇候选者颇多。随着整个行业都聚焦于变革性的新技术,继 “生成式 AI” 和 “生成式预训练 Transformer” 之后,又出现了 “大语言模型(LLM)”、“检索增强生成(RAG)” 等词汇。
生成式 AI 从年初开始崭露头角,到年末已经引起了轰动。许多企业正在竞相依靠 AI 提取文本、语音和视频的能力,生成能够彻底改变生产力、创新和创造力的新内容。
企业纷纷顺势而为。麦肯锡表示,像 OpenAI 的 ChatGPT 这样的深度学习算法在经过企业数据的进一步训练后,每年可在 63 个业务用例中创造相当于 2.6 万亿至 4.4 万亿美元的价值。
然而,管理海量内部数据往往被认为是扩大 AI 规模的最大障碍。NVIDIA 的 AI 专家预测,企业在 2024 年的工作重点将是“广交良友”,即与云服务提供商、数据存储和分析公司以及其他擅长高效处理、微调和部署大数据的公司建立合作伙伴关系。
这一切都将围绕大语言模型展开。NVIDIA 专家表示,LLM 研究的进展将被越来越多地应用于商业和企业应用中。RAG、自主智能体和多模态交互等 AI 功能将变得更易于获取,并且几乎可以通过任何平台轻松部署。
以下是 NVIDIA 专家对未来 2024 年的展望:
MANUVIR DAS
NVIDIA 企业计算副总裁
不存在一款万能的应用:企业正在接受定制化。任何企业都不会只有一到两个生成式 AI 应用,许多企业将拥有数百个定制化应用,这些应用使用的是适用于业务各个部分的专有数据。
在投入到生产中后,这些定制 LLM 将使用 RAG 功能连接数据源与生成式 AI 模型,从而作出更加准确、明智的回答。Amdocs、Dropbox、基因泰克公司(Genentech)、SAP、ServiceNow 和 Snowflake 等头部企业已经在使用 RAG 和 LLM 构建新的生成式 AI 服务。
开源软件引领潮流:借助开源预训练模型,企业将把能够解决特定领域挑战的生成式 AI 应用纳入其运营战略中。
如果企业能够将这些领先的模型与私有或实时数据相结合,就能加速提升整个企业的生产力和成本效益。AI 计算和软件将可以在几乎任何平台上使用,无论是云计算和 AI 模型代工服务,还是数据中心、边缘和桌面。
现成的 AI 和微服务:生成式 AI 推动了应用编程接口(API)端点的采用,使开发者能够更轻松地构建复杂的应用。
随着开发者将在 2024 年使用 RAG 等 AI 微服务定制成品 AI 模型,软件开发工具套件和 API 将更上一层楼。这将帮助企业运用能够获取最新业务信息的智能助手和摘要工具,充分挖掘出 AI 驱动的生产潜力。
开发者可以将这些 API 端点直接嵌入其应用,而且无需再为维护支撑这些模型和框架所需的基础设施而操心。终端用户也能体验到更加直观、反应更迅速且更符合其需求的定制应用。
IAN BUCK
NVIDIA 高性能计算和超大规模数据中心业务副总裁
宝藏技术的国家应用: AI 将成为新时代的“太空竞赛”,每个国家都希望建立自己的卓越中心,以推动研究和科学的重大进步,提高国内生产总值。
只需要几百个节点的加速计算,就能快速建立起高效率、高性能的百亿亿次级 AI 超级计算机。由政府出资建造的生成式 AI 卓越中心,将通过创造新的工作岗位和建立更强大的大学项目来培养下一代科学家、研究人员和工程师,进而推动国家经济的增长。
量子飞跃:企业领导者将在两大关键驱动力之下发起量子计算研究计划:一是使用传统 AI 超级计算机模拟量子处理器的能力;二是混合经典-量子计算统一开放式开发平台的可用性。这使开发者能够使用标准编程语言构建量子算法,无须掌握需要定制的专业知识。
量子计算方面的探索曾被认为是计算机科学中的一个非主流的小领域。但随着企业与学术界和实验室共同推进材料科学、医药研究、亚原子物理和物流领域的快速发展,量子计算探索将成为主流。
KARI BRISKI
NVIDIA AI 软件业务副总裁
将 RAG 变成财富:企业将在 2024 年大力采用检索增强生成(RAG)AI 框架,围绕此的讨论也会更多。
模型有时会因为无法获得与指定用例相关的足够准确信息而作出这种不准确或无意义的回答。
随着企业训练用于构建生成式 AI 应用和服务的 LLM,越来越多的人将 RAG 视为一种能够避免作出不准确或无意义回答的方法。
通过语义检索,企业将使用开源基础模型打通自己的数据,这样用户就能够从索引中检索到相关数据,然后在运行时将这些数据传递给模型。
企业可以使用更少的资源,为医疗、金融、零售和制造等行业创造出更准确的生成式 AI 应用。终端用户有望看到更加精进、更加符合上下文的多模态聊天机器人和个性化内容推荐系统,这将使他们能够自然、直观地与数据进行对话。
多模态“大显身手”:基于文本的生成式 AI 将成为过去式。尽管生成式 AI 仍处于起步阶段,但预计许多行业都将采用多模态 LLM,使消费者能够结合文本、语音和图像,对有关表格、图表或示意图的查询作出更加符合语境的回答。
Meta、OpenAI 等公司将通过加强对感官的支持来推动多模态生成式 AI 的发展,进而促进物理科学、生物科学和整个社会的进步。企业将不仅能够理解文本格式的数据,还能够理解 PDF、图表、幻灯片等格式的数据。
NIKKI POPE
NVIDIA AI 和法律伦理主管
AI 安全将成为核心议题:头部 AI 企业之间的合作将加快稳健且安全的 AI 系统的研发速度。预计各个行业将采用新的标准化安全协议和最佳实践来保障生成式 AI 模型的一致且高度安全性。
企业将更加关注 AI 系统的透明度和可解释性,并将使用新的工具和方法阐释复杂 AI 模型的决策过程。由于整个生成式 AI 生态系统都会将安全问题作为核心,预计 AI 技术将变得更加可靠、可信且符合人类的价值观。
RICHARD KERRIS
NVIDIA 开发者关系副总裁,媒体和娱乐业务主管
开发普及化:不久之后,几乎所有人都能够成为开发者。以前的开发者必须掌握并熟练使用特定的开发语言才能开发应用或服务。随着计算基础设施越来越多地在软件开发语言上训练,任何人都将能够提示机器创建应用、服务、设备支持等。
企业将继续雇用开发人员构建和训练 AI 模型及其他专业应用,同时其他具备相关技能的人士也都将获得更多构建定制产品和服务的机会。在文本输入或语音提示的帮助下,他们与计算机的交互将变得像口述指令一样简单。
电影和音乐将迎来新的时代:正如 Fab Four “新创作”的 AI 增强歌曲引发了新一波的披头士热潮一样,第一部长篇生成式 AI 电影的诞生也将在电影业掀起轩然大波。
比如,电影制片人在使用 35 毫米胶片摄影机拍摄后,可以通过生成式 AI 技术,将所拍摄的内容快速转换成 70 毫米格式。这将降低制作 IMAX 电影所需的巨额成本,并让更多导演参与其中。
创作者将使用文字、图像或视频来提示计算机把精美的图像和视频转化成新类型和新形式的娱乐内容。一些专业人士担心这会抢了他们的“饭碗”,但由于生成式 AI 能够通过特定任务的训练而日益完善,这些问题也会逐渐消失,反而使专业人士有时间去处理其他任务,并为他们提供界面对艺术家友好的新工具。
KIMBERLY POWELL
NVIDIA 医疗业务副总裁
AI 手术助手:外科医生在手术室内外使用语音增强其所见所闻的时代已经到来。
通过将器械、影像、机器人技术和实时患者数据与 AI 相结合,可以为外科医生提供更好的培训,在手术过程中提供更加个性化的服务,甚至在远程手术过程中给出实时反馈和指导以提高安全性。目前每年有 1.5 亿台手术无法开展,尤其是在中低收入国家,而 AI 手术将有助于缩小这一缺口。
生成式 AI 打造新型药物研发工厂:一种新的药物研发流程正在兴起。生成式 AI 分子生成、特性预测和复杂建模将推动智能实验室的运转速度,缩短研发周期并提高临床可行候选药物的质量。
这些 AI 药物研发工厂使用全基因组、原子分辨率仪器和能够全天候运行的机器人实验室自动化技术来建立海量医疗数据集。计算机将实现有史以来首次在庞大而复杂的数据集中学习规律和关系,并且生成、预测和模拟复杂的生物关系,而这些关系之前只能通过耗时的实验观察和人工合成才能发现。
CHARLIE BOYLE
NVIDIA DGX 系统副总裁
企业将定制 LLM 迁移到云端:企业在 2023 年认识到从头开始构建 LLM 并非易事。他们往往会因为需要投资于新的基础设施和技术而对这条路望而却步,而且他们还很难确定如何以及何时该优先开展公司的其他举措。
云服务提供商、主机托管提供商、以及其他提供企业数据处理服务的公司将通过全栈 AI 超级计算和软件来帮助企业。这将使各行各业的企业能够更轻松地定制和部署预训练模型。
在企业数据湖中挖掘 LLM 这座 “金矿”:目前并不缺少关于普通企业信息存储量的统计数据,大型企业存储的信息量可能高达数百 PB。但许多公司都表示自己只挖掘了不到一半的信息来获取可执行的洞察。
2024 年,企业将开始借助生成式 AI,将那些未被利用的数据用于构建和定制 LLM。借助 AI 加持的超级计算,企业将开始挖掘自身的非结构化数据,包括聊天、视频和代码等,从而将其生成式 AI 开发工作扩展到训练多模态模型。这一巨大的进步超越了挖掘表格和其他结构化数据的能力,将使企业能够针对问题提供更加具体的答案,并发现新的机遇,包括帮助检测医学扫描图像中的异常情况,发现零售业的新兴趋势,以及提高运营安全等。
AZITA MARTIN
NVIDIA 零售、消费品包装和快餐店业务副总裁
生成式 AI 购物顾问:零售商既要为顾客提供其想要的产品,又要提供符合其个人需求和偏好的高质量、人性化全渠道购物体验。
为了实现这些目标,零售商正准备引进先进的生成式 AI 购物顾问,这些顾问将接受有关零售商品牌、产品和客户数据的细致培训,以便能够提供符合品牌的向导式个性化购物过程并像人类助手那样细致入微。这一创新的方法将帮助品牌脱颖而出,通过提供个性化的帮助提高顾客忠诚度。
采取保障安全的措施:全球零售商正面临着日益严峻的挑战。以美国为例,根据美国零售联合会的报告,自疫情后零售业盗窃案的数量激增以来,零售商遭遇的此类事件猛增了 26.5%。
为了提高顾客和员工在店内的安全,零售商将开始使用计算机视觉和实体安全信息管理软件采集并关联来自不同安全系统的事件。这将使 AI 能够检测出异常行为,比如大规模抢夺货架上的物品等。它还将帮助零售商主动打击犯罪活动,维护购物环境的安全。
REV LEBAREDIAN
NVIDIA Omniverse 和仿真技术副总裁
工业数字化拥抱生成式 AI:工业数字化与生成式 AI 的融合有望促进工业转型。
生成式 AI 将使几何、光、物理、物质和行为等物理学的各个方面转化成数字数据变得更加容易。物理学数字化的普及将加速工业企业的发展,提高其设计、优化、制造和销售产品的效率并使其能够更加轻松地创建用于训练新一代 AI 的虚拟训练场和合成数据。这些 AI 将在自主机器人、自动驾驶汽车等物理领域进行交互和运行。
3D 互通性跃升:首次实现从设计到生产的数据互通。
全球制造、产品设计、零售、电子商务和机器人行业最有影响力的软件与从业公司正在加入新成立的 OpenUSD 联盟。OpenUSD 是一种 3D 工具和数据之间的通用语言,它将打破数据孤岛,使工业企业中的各个数据湖、工具系统和专业团队能够比以往更加轻松、快速地开展协作,从而加快繁琐人工工业流程的数字化进程。
吴新宙
NVIDIA 副总裁兼汽车业务总经理
实现整个汽车生产生命周期的现代化:汽车行业将进一步采用生成式 AI 来提供符合物理学的逼真效果图,在准确展示汽车内部与外部的同时,加快设计评审的速度、降低成本并提高效率。
越来越多的汽车制造商将在其智能工厂中采用这项技术,通过连接设计与工程工具来构建生产设施的数字孪生。此举能够在不关停工厂产线的情况下降低成本,实现运营的精简化。
生成式 AI 将使消费者的研究和购买变得更具互动性。无论是汽车配置器和 3D 可视化,还是增强现实演示和虚拟试驾,都将为消费者带来更加引人入胜和愉快的购物体验。
行驶安全无小事:除了汽车产品生命周期外,生成式 AI 还将推进自动驾驶汽车(AV)开发领域的突破性进展,包括将记录的传感器数据转化为全交互式 3D 模拟。在将自动驾驶汽车部署到现实世界前,可以使用这些数字孪生环境以及合成数据生成技术,在虚拟环境中安全地对自动驾驶汽车进行大规模的开发、测试和验证。
生成式 AI 基础模型还将帮助车辆的 AI 系统提供全新的个性化用户体验、功能以及车内外的安全措施。
驾驶将变得更加安全、智能和愉悦。
BOB PETTE
NVIDIA 企业平台副总裁
使用生成式 AI 创建新事物:通过生成式 AI,企业只需要与大语言模型进行对话就可以完成汽车的设计,或者使用新的技术和设计原则来从无到有创建新的城市。
建筑、工程、施工和运营(AECO)行业正在围绕生成式 AI 构建未来。AECO 和制造业的数百家生成式 AI 初创公司与客户将专注于为几乎所有用例创建解决方案,包括设计优化、市场洞见、施工管理和物理预测等。AI 将加速制造业的发展,提高效率、减少浪费并实现全新的生产和可持续发展方式。
开发者和企业尤其关注点云数据分析,该技术能够使用激光雷达生成具有精确细节的建筑和自然环境示意图。借助由生成式 AI 加速的工作流,这项技术将实现高保真的洞察和分析。
GILAD SHAINER
NVIDIA 网络业务高级副总裁
AI 飞速增长,连接需求激增:企业正在使用 GPU 和基于 GPU 的系统获得加速计算所需要的网络带宽,网络效率和性能也将再度成为其关注的焦点。
万亿参数的 LLM 将需要更快的传输速度和更广的覆盖范围。想要快速推行生成式 AI 应用的企业将需要投资于加速网络技术或者选择能够满足这一需求的云服务提供商。实现最佳连接的关键在于将其融入到加入了新一代软硬件的全栈系统中。
网络将成为设计数据中心的决定性因素:企业将认识到数据中心不必千篇一律。为数据中心选择合适网络的第一步是确定数据中心的用途。传统数据中心的带宽有限,而能够运行大型 AI 工作负载的数据中心需要成千上万个 GPU,而且这些 GPU 在运行时必须保证高度确定且较低的尾部延迟。
网络在大规模满负荷情况下的运行能力是确定性能的最佳指标。未来的企业数据中心需要通过独立的管理网络(又称南北向网络)和 AI 网络(又称东西向网络)连接。其中的 AI 网络包含专门用于高性能计算、AI 和超大规模云基础设施的网内计算。
DAVID REBER JR.
NVIDIA 首席安全官
明确使安全模式能够适应 AI:企业正在如火如荼地从以应用为中心的安全模式转向以数据为中心的安全模式。数据是 LLM 的基础供应链,同时也是生成式 AI 的未来。企业现在才刚刚看到这个问题大规模地显现,他们需要重新评估人员、流程和技术,重新定义安全开发生命周期(SDLC)。整个行业将重新定义信任的方法并明确透明度的含义。
新一代网络工具将应运而生。AI 的安全开发生命周期将由新的市场领导者来定义工具和使命,以完成从命令行界面到人类语言界面的过渡。随着越来越多的企业开始使用开源 LLM(如 Meta 的 Llama 2)加速生成式 AI 的输出结果,这一需求将变得尤为重要。
使用 AI 提升安全性:将 AI 应用于网络安全领域将能够检测出从未被发现的威胁。目前,全球只有一小部分数据被用于网络防御。与此同时,攻击者仍在不断利用每一个错误配置。
企业将通过实验认识到 AI 在发现突发威胁和风险方面的潜力。网络助手将帮助企业用户应对网络钓鱼和配置问题。为了使这项技术发挥作用,企业需要解决工作和个人生活交汇处固有的隐私问题,以便能够在以数据为中心的环境中实现集体防御。
除了实现技术的全民化之外,AI 也将在威胁不断增加的情况下造就新一代的网络防御者。一旦明确任何一种威胁,企业将使用 AI 生成海量数据,并使用这些数据训练下游检测器以防御并检测此类威胁。
RONNIE VASISHTA
NVIDIA 电信高级副总裁
RAN 既是目标,也是起点:预计对 5G 投资案例将展开大规模重新评估。
经过五年的发展,5G 的网络覆盖范围和容量都有了显著的提升,但收入增长却很缓慢,而且大部分专有且灵活性欠佳的基础设施的成本也在上升。同时,5G RAN 的利用率仍止步于 40% 以下。
在新的一年里,我们将在现有频谱上,积极开辟新的收入来源,发掘可商业化的新应用。电信行业还将重新考量资本支出结构,更加关注以通用组件构建的灵活高利用率的基础设施。此外,由于企业正在使用 AI 工具来提高性能和效率以降低成本,所以预计运营费用将全面降低。这些举措的成效将决定运营商对 6G 技术的投资力度。
从聊天机器人到网络管理:为提升客户服务和支持力度,电信公司已将生成式 AI 应用于聊天机器人和虚拟助手。在新的一年里,他们将进一步在网络规划和优化、故障和欺诈检测、预测分析和维护、网络安全运营以及能源优化等领域加强生成式 AI 的使用,实现运营方面的改进。
鉴于生成式 AI 的普及度和战略性,建立新型 AI 工厂基础设施来推动其发展也将成为当务之急。越来越多的电信公司将建立供内部使用的 AI 工厂,并以平台即服务的形式,将这些工厂提供给开发人员。这类基础设施将能够支持作为额外租户的 RAN。
MALCOLM DEMAYO
NVIDIA 金融服务副总裁
金融服务,AI 至上:随着 AI 的飞速发展,金融服务公司将会把算力用在数据上,而不是用数据来提高算力。
金融服务公司需要在保持技术发展速度,降低集中风险的同时保持敏捷性,所以需要做出战略转变,即采用将本地基础设施与云计算混用这样具有高度可扩展性的方式。能够处理好最关键工作负载(包括 AI 驱动的客服助手、欺诈检测、风险管理等)的金融服务公司将获得领先优势。
MARC SPIELER
NVIDIA 能源高级总监
物理机器学习加速仿真模拟:能源公司将越来越多地使用物理机器学习加速仿真模拟、优化工业流程并增强决策能力。
物理机器学习将传统的物理模型与先进的机器学习算法相结合,是快速、准确模拟复杂物理现象的强大帮手。例如在能源勘探和生产中,物理机器学习可以快速建立地下地质模型,帮助确定潜在的勘探地点,评估运营和环境风险。
在风能和太阳能等可再生能源领域,物理机器学习将在预测性维护方面发挥关键作用,使能源公司能够预见设备故障并提前安排维护,从而减少停机时间和成本。随着算力和可用数据的不断增加,物理机器学习将深入改变能源公司处理模拟和建模任务的方式,推动更高效和可持续的能源生产。
LLM —— 提升运营成果的高招:结合物理机器学习,LLM 将能够分析能源设备的大量历史数据和实时传感器输入数据,从而预测潜在故障和维护需求。这种具有前瞻性的方法将减少意外停机时间,延长风力涡轮机、发电机、太阳能电池板和其他关键基础设施的使用寿命。LLM 还有助于优化维护计划和资源配置,确保维修和检查工作的高效率。最后,将 LLM 应用于预测性维护将为能源公司节省成本,帮助其更加稳定地为用户供应能源。
DEEPU TALLA
NVIDIA 嵌入式和边缘计算副总裁
机器人开发者的兴起:LLM 将为机器人工程师的工作带来迅速的改观。生成式 AI 将为机器人开发代码并创建新的模拟环境以测试和训练它们。
LLM 将自动创建 3D 场景、构建环境并根据输入的数据生成资产,从而加快模拟开发速度。生成的模拟资产将成为合成数据生成、机器人技能训练和机器人应用测试等工作流的关键。
除了帮助机器人开发者外,LLM 背后的引擎 —— Transformer AI 模型将使机器人变得更加智能,使其能够更好地理解复杂的环境,并更有效地在这些环境中执行各种技能。
为了扩大机器人产业的规模,机器人必须变得更加通用。也就是说,它们需要能够更快掌握技能或将技能应用于新的环境中。在模拟中训练和测试的生成式 AI 模型将成为使机器人变得更加强大、灵活且易用的关键。
GTC 2024 将于 2024 年 3 月 18 至 21 日在美国加州圣何塞会议中心举行,线上大会也将同期开放。点击 “阅读原文” 或扫描下方海报二维码,立即注册 GTC 大会。