AI 计算是一种计算机器学习算法的数学密集型流程,通常会使用加速系统和软件,它可以从大量数据集中提取新的见解并在此过程中学习新能力。 我们如今生活在一个数据时代,因此,AI 计算是这个时代的革命性技术,它能够找到人类无法找到的规律。 例如,美国运通使用 AI 计算来检测每年数十亿次信用卡交易中的欺诈行为;医生使用 AI 计算来寻找肿瘤,并在无数医疗影像中发现细微的异常情况。
AI 计算的三个步骤
在介绍众多 AI 计算用例前,我们先来了解一下它是如何运作的。 首先,用户(通常是数据科学家)需要整理和准备数据集,这个阶段称为提取/转换/加载(ETL)。这项工作现在可以通过 Apache Spark 3.0 在 NVIDIA GPU 上加速进行。Apache Spark 是目前最流行的开源大数据挖掘引擎之一。 然后,数据科学家会选择或设计最适合其应用的 AI 模型。 一些在开拓新领域或寻求竞争优势的公司会从头开始设计并训练自己的模型。这个过程除了需要一定的专业知识外,还可能需要一台 AI 超级计算机和 NVIDIA 的帮助。 机器学习运维(MLOps)更加详细地描述了 AI 计算的三个主要步骤——ETL(最上面的一行)、训练(右下)和推理(左下)。 许多公司选择采用预训练 AI 模型并根据其应用需求进行自定义。在提供软件、服务和支持的门户网站 NVIDIA NGC 上,有几十种预训练模型和定制工具可供使用。 最后,公司会通过他们的模型来筛选数据。这个关键步骤被称为推理,AI 将会在这个步骤中提供可行的洞察与见解。 这三个步骤需要消耗很多精力,但好在每个人在各种帮助下都能够使用 AI 计算。 例如,NVIDIA TAO 工具套件可以使用迁移学习将三个步骤简化为一个,这种方法不需要大型数据集就能为新的应用定制现有的 AI 模型。除此之外,NVIDIA LaunchPad 还为用户提供了各种模型部署用例的实践培训。
AI 模型的内部构造
AI 模型被称为神经网络,其灵感来自于人类大脑内部的网状构造。 这些 AI 模型展开后看起来就像是由多层线性代数方程组成的数学“千层面”。深度学习作为目前最流行的一种 AI 形式,得名就是因为它由许多这样的‘层’组成。 识别图像的深度学习模型示例(选自美国国家科学院的一篇关于深度学习的文章,图片来源:艺术家 Lucy Reading-Ikkanda) 进一步聚焦,你就会看到每一层都由众多方程式堆栈组成,每个方程式都代表着一组数据相互关联的可能性。 AI 计算将每一层中的每一个方程堆栈相联系,以寻找规律。这是一项庞大的工程,需要高度并行的处理器在高速计算机网络上共享大量数据。
GPU 计算与 AI 的结合
事实上,AI 计算的引擎是 GPU。 NVIDIA 于 1999 年推出了第一款 GPU,用于需要大规模并行计算的电子游戏 3D 图像渲染。 GPU 计算很快被推广到电影大片的图形服务器中。科学家和研究者在世界上最大的超级计算机上使用 GPU,其可应用的研究范围小到化学中的微小分子,大到天体物理学中的遥远星系。 当 AI 计算在十多年前出现时,研究者很快就开始使用 NVIDIA 的可编程平台运行并行处理。下面的视频简单回顾了 GPU 的历史。
AI 计算的历史
AI 这个概念至少可以追溯到艾伦·图灵所在的时代,这位英国数学家在二战期间帮助破解了密码信息。 艾伦·图灵 1947 年,图灵在一次演讲中说:“我们想要的是一台能够从经验中学习的机器。” NVIDIA 为了纪念他的远见卓识,以他的名字命名了 NVIDIA 的一个计算架构。 图灵的展望在 2012 年成为了现实。研究者在 2012 年开发出了能够比人类更快、更精准识别图像的 AI 模型。ImageNet 比赛的结果也大大加快了计算机视觉的发展。 今天,以机器学习界大咖 Andrew Ng 创立的 Landing AI 为代表,许多公司正在使用 AI 和计算机视觉提高制造业的效率,与此同时,AI 也在为体育、智慧城市等领域带来更接近真人的视角与思维方式。
AI 计算开启对话式 AI
2017 年 Transformer 模型面世后,AI 计算在自然语言处理方面获得了巨大的进步,出现了一种名为“attention”的机器学习技术。它可以捕捉如文本、语音等连续数据中的上下文。 如今,对话式 AI 已十分普遍。它可以解析用户在搜索框中输入的句子,也可以在用户开车时读出短信并让你口述回复。 这些大型语言模型还被应用于药物研发、翻译、聊天机器人、软件开发、呼叫中心自动化等众多领域。
AI+图形:创造 3D 世界
许多意想不到的领域的用户正在体验 AI 计算的力量。 最新的电子游戏凭借着实时光线追踪与 NVIDIA DLSS 将画面真实性提高到了更高级别。后者利用 AI 在 GeForce RTX 平台上为用户提供了超流畅的游戏体验。 这仅仅是个开始。新兴的神经图形学将加速虚拟世界的创建,以填充 3D 互联网与元宇宙。 神经图形学将加速虚拟世界的设计和开发,填充 3D 互联网与元宇宙
AI 计算用例
汽车、工厂和仓库 汽车制造商正在运用 AI 计算以提供更加平稳、安全的驾驶体验,并为乘客提供智能化车载信息娱乐功能。 梅赛德斯-奔驰正在与 NVIDIA 联手开发软件定义汽车。该公司即将推出的车型将提供由 NVIDIA DRIVE Orin 中央计算机驱动的智能和自动驾驶功能。这些系统将在数据中心使用建立在 NVIDIA Omniverse 基础上的 DRIVE Sim 软件进行测试和验证,以确保它们能够安全应对各类场景。 梅赛德斯-奔驰在 CES 上宣布,它还将使用 Omniverse 设计并规划其全球各地的制造和装配设施。 许多公司通过在 NVIDIA Omniverse 中创建 AI 数字孪生工厂来提高工厂的效率,宝马集团也是其中之一。如下视频所示,百事可乐等消费业巨头也为其物流中心采用了这种方法。 工厂和仓库内的自主机器人进一步提高了制造业和物流业的效率。许多机器人由 NVIDIA Jetson 边缘 AI 平台驱动,并通过 NVIDIA Isaac Sim 在模拟和数字孪生中使用 AI 进行训练。 过去一年里,就连拖拉机和割草机都通过 AI 实现了自主运行。 位于加州利弗莫尔的初创企业 Monarch Tractor 在去年 12 月推出了一款 AI 驱动的电动车,促进了农业的自动化;位于科罗拉多州博尔德的 Scythe 于去年 5 月推出了一款装有八个摄像头和十多个传感器的自主电动割草机 M.52(如下视频所示)。 @2023 Scythe Robotics版权归 Scythe Robotics 所有 此视频由 Scythe Robotics 制作,如果您有任何疑问或需要使用此视频,请联系 Scythe Robotics 保护网络安全,检测基因序列 AI 计算用例的数量和种类十分惊人。 网络安全软件在数字指纹等 AI 技术帮助下更快检测出网络钓鱼和其他网络威胁。 医疗领域的研究者们在 2022 年 1 月依靠 AI 计算在 8 小时内完成了整个基因组的测序,打破了纪录。其研究成果(如下视频所述)有可能治愈罕见遗传病。 AI 计算还被应用在银行、零售、邮局、电信、交通运输和能源网络等多个领域。 如今,AI 计算技术不断开拓新应用,研究者正在开发更新、更强大的方法。 过去一年中,另一种强大的神经网络——扩散模型开始流行。这种模型可以将文字描述转换成精美的图像。研究者预测这些模型的应用将进一步拓展 AI 计算的版图。