如今,人工智能的发展速度非常快。我们周围事物的复杂性不断增长,这促使每个人都依赖人工智能,以多种方式帮助人类,从检测欺诈交易、预测市场价格到在高层相关者中做出决策。在人工智能蓬勃发展与应用的面前,任何企业都没有理由不尝试人工智能。基于2021年AI技术的发展,可以对人工智能在2022的发展进行预测。
首先,我们对 2021 年AI发布的技术进行简要整理。
2021 年 AI 技术
2021年 AI 主要的技术发布 在2 月份开始,当时谷歌发布了Tensorflow 3D,将深度学习模型升级到 3D 空间,实现 3D 场景理解,可用于虚拟现实、图像中的点云应用、激光雷达和自我视觉-自动驾驶汽车。的自我监督学习,它能够完成识别文本、图像和其他主要在社交媒体中可用的非结构化数据的无监督任务。SEER 建立在 ImageNet 之上,该 ImageNet 对十亿个随机、未标记和未策划的公共 Instagram 图像进行了预训练。4月份没有什么新鲜事,但是,欧盟提出了新的人工智能法规,为该地区的人工智能横向提供法律框架。拟议的法律框架侧重于人工智能系统的具体利用和相关风险。
5 月,谷歌发布了 Vertex AI,它与谷歌云服务集成,可以使用基于视觉、视频、自然语言等预训练 API的自动化 ML (或 AutoML)的强大功能构建 ML。使用 Vertex,通过简化编码(低代码开发)消除了运行 ML 管道的复杂性。然后在 6 月,微软的 GitHub 发布了他们的GitHub Copilot,它使用户能够通过自动完成来加速编码。自动完成是,在有人完成他们的代码之前,GitHub Copilot 将自行完成代码。7 月,谷歌的DeepMind 发布了超过 350,000 种蛋白质的预测形状使用他们一年前开发的 AlphaFold AI 系统。一些人声称,该数据库可以在许多方面发生革命性变化,例如提高了解疾病和开发新药的能力。
8 月,来自卡内基梅隆大学和麻省理工学院的研究人员发表了一项开创性的发明,即一种新型的生成对抗网络 (GAN),它只能通过绘制草图来生成模仿图像,他们称之为 GAN 草图。然后在 10 月,NVIDIA 结合了两个强大的语言转换器,创建了超越 OpenAI 强大的 GPT-3的Megatron-Turing 自然语言生成(NLG)。该 Transformer 模型旨在通过GPU 加速基于数千亿自然语言标记将训练效率提高 10 倍。11 月,NVIDIA 再次发布了名为StyleGAN3的下一代 GAN ,它可以生成模仿人类照片几乎 99.9% 逼真。最后,在 12 月,DeepMind 发布了另一个名为Gopher的自然语言转换器模型,可以在人机交互中合成响应。
基于这些突破,2022 年人工智能最有可能的五大预测如下。
预测 1:人工智能将在业务中更易于解释和自动化
Enthought 的首席运营官 Mike Connel 表示,超过 90% 的工业 AI 或 ML 项目可能无法在 2022 年实现其业务目标,因为无法解释他们在业务中的模型。可解释的 AI(或 XAI)变得如此重要,因为它对许多企业构成了威胁,例如,产生有偏见的结果的模型。业务的高级利益相关者将关注模型如何代表真实业务问题的问题,而不是如何对其进行编码。此外,企业对低代码 ML 模型开发的需求变得如此不可避免,因为开发一个模型可能是乏味和迭代的。近年来,自动化 ML(或 AutoML)发展得如此迅速。
目前,开发 XAI 和 AutoML 的公司很少。最受欢迎的公司之一是H2O.ai , Inc.。H2O.ai 将其服务命名为Driverless AI。这项 AI 服务使数据科学家能够更快地开发机器学习模型,因为 AutoML 能够自动处理所有流程(从数据探索、模型选择和评估),并使用可视化为业务利益相关者解释模型。这避免了机器学习是“黑盒”模型的观点。此外,谷歌还提供 XAI 作为他们今年 5 月初发布的 Vertex AI 云平台的堆栈。因此,这将不可避免地推动云中自动化和可解释的 ML 模型在来年更快的发展。
预测 2:3D 人工智能将彻底改变自动驾驶汽车
自动驾驶或自动驾驶汽车是一种驾驶者很少或没有控制的概念。这些汽车可能有传感器,可以对周围环境进行视觉感知,还有一个系统可以消化这些感官信息,以使用所谓的计算机视觉来控制运动。如今,大多数自动驾驶汽车,例如配备 HW2.5 自动驾驶系统的特斯拉 Model X,都使用基于卷积神经网络算法的2D 对象检测,即 YOLO(You Only Look Once)。LiDAR 相机传感仪器捕获的周围环境图像仅将信息处理为 2D 对象(或无深度对象)。这可能会限制自动驾驶汽车做出自主决策的能力。
最近,出现了从 2D 到 3D 单目场景理解的升级趋势。被称为 3D 边界框估计算法的算法试图处理这种运动,例如 Deep3DBox、FQNet、Shift R-CNN 和级联几何约束。还有其他方法,例如 Pseudo-3D 方法。随着2021 年Tensorflow 3D的出现,以 3D方式学习周围物体的自动驾驶汽车的未来非常有前景。据福布斯报道,由于许多人使用 Tensorflow 进行深度学习,因此使用新的 3D 版本将非常容易。对其他应用的影响以及历史建筑的保护在增强现实空间中也将在不久的将来可见。
预测 3:生成对抗网络 (GAN) 将彻底改变设计制造商
毫无疑问,GAN 是人们在谈论诸如在 Deepfake 中生成看起来像某人的脸的人脸、使用文森特·梵高的绘画风格创作新绘画或制作一瓶酒的逼真图像时所寻找的东西。 . 近年来,GAN 彻底改变了艺术工作室和电影制作行业。
在不久的将来,GAN 将登陆制造企业。最近,GAN 具有从 3D 渲染对象中学习并生成 3D 对象的能力。在科学和技术术语中,这称为计算机辅助设计(或 CAD)。例如,来自 MIT CSAIL 的一组研究人员表明,GAN 可以学习将 3D 家具对象与 IKEA 包含家具照片的大型数据集区分开来。然后,GAN 生成识别图像的 3D 渲染对象。这是一个巨大的突破,因为在计算机软件上手动进行 CAD 是制造业中漫长而昂贵的过程。
此外,汽车行业将发现 GAN 在设计车辆及其零部件方面的更多应用。Monolith AI是一家总部位于英国的初创公司,是极少数在产品设计优化中尝试使用 GAN 的公司之一。他们展示了如何将 GAN 应用于拓扑优化和无网格设计生成以产生新的汽车设计。该企业还实施 GAN 以生成无法通过3D 打印生产的组件的 3D 对象,并解决这些组件的计算流体动力学 (CFD) 模拟。
随着 GAN 在制造业中的这些应用,人工智能很可能在明年成为设计优化和增材制造过程中的主流。
预测 4:Transformers 和认知 AI 将彻底改变语言应用
自然语言处理和生成 (NLG) 已经改变了企业通过社交媒体上的推文了解客户、找到正确的事实并从新闻中识别恶作剧以及通过聊天机器人与人类对话的方式。NLG 依赖于使用转换器,这是一种深度学习结构,由编码器和解码器处理输入(可以是任何形式的数据)和生成输出(以文本形式)组成。
两种最流行的 NLG 模型是 BERT(来自 Transformers 的双向编码器表示)和 GPT(生成式预训练 Transformer)。谷歌在 2018 年发布的 BERT 有 3.4 亿个参数,而 OpenAI 的 GPT-3 被称为最强大的转换器,有 1750 亿个参数。参数的数量呈指数增长。似乎只看它的走势,变形金刚之间的竞争是无止境的。那么,这对自然语言世代的未来意味着什么?
自然语言处理可以通过将文本分解成句子结构(或句法分析)并分析单词、语法和意义的关系(或语义分析)来分类好情绪和坏情绪。我们需要提供尽可能多的数据,让 NLP 能够识别上下文。未来,NLP 会“有意识”地从文本中理解更多,比如从作者的情感中寻找隐含的意义,从而做出认知 AI。随着变压器中现在有数十亿个参数可用,认知人工智能的出现即将到来。
认知人工智能将帮助企业在客户在聊天机器人中进行对话后,向客户提供更个性化的反馈。最流行的对话框架是亚马逊的 Alexa 和苹果的 Siri。对话的上下文将不再是通用的,例如询问姓名或职业。上下文将非常多样化和具体,例如医疗保健中的科学、人力资源或医疗处方。
最后但同样重要的是,NLP 将与图像处理相结合,例如处理面部表情、手势和肢体语言,以了解两个人之间对话中的情绪。然后,认知 AI 将生成人工对话。这种受生物识别启发的认知人工智能将在不久的将来流行。
预测 5:元宇宙中的数字孪生将主导行业
数字孪生是实时显示物理行为的对象或系统的虚拟表示。如今,许多行业都使用它来了解其产品的行为和缺陷,例如机械或建筑结构,并通过模拟改进其物理模型。通用电气和劳斯莱斯等公司是使用数字孪生改进喷气发动机设计的前沿领先行业。
为了代表数字孪生版本的原型,该原型配备了许多传感器,用于测量操作期间的不同物理行为。可能有数百个传感器需要了解。凭借海量的训练数据,人工智能可以了解每个传感器测量的行为和意义的复杂性,因此可以通过预测性维护或提供来预测故障发生。
现在,公司正在开发虚拟现实和增强现实(VR 和 AR)体验,使人们能够使用感官直接与现实空间中不存在的物体进行交互。进行 VR 和 AR 最常见的方式是通过有限的交互将体验“放在桌面上”。现在,技术使人们能够在真实空间中与物体无缝交互。人们可以通过 VR 和 AR 与对象交互的空间称为元界。在 Metaverse 中,人们可以实时交互。未来,更多的公司将在元界中结合AI应用开发用户体验。波音公司刚刚宣布,他们将在元宇宙中对其飞机进行 3D 工程设计使用微软名为 HoloLens 的 AR 和 VR 技术。将工程引入虚拟世界有一些好处,即降低了制造真实原型的成本,因为组件的成本和设计的可重复实验。在不久的将来,城市规划、环境建筑设计和防灾很有可能在元宇宙中进行。
小结
五个关键预测是人工智能将在业务中更加自动化和可解释,3D 中的人工智能将彻底改变自动驾驶汽车中的计算机视觉,GAN 将通过优化实现制造设计,Transformers 将彻底改变自然语言生成和人工人类对话,数字孪生将在 Metaverse 元宇宙中进行。
鉴于人工智能理论方面的创新速度和复杂技术支持的实际应用的创新速度,人工智能将继续推动进程并帮助人类完成各种复杂的任务。