从2020年起,每年追踪并发布全球人工智能(AI)最新发展趋势,已经成为MathWorks公司的一种惯例。日前,MathWorks中国区行业市场经理李靖远代表公司发布了2022年及以后推动AI发展的十大关键趋势预测,让我们一起来了解一下。
MathWorks中国区行业市场经理李靖远
人工智能在工程和科学学科、整个行业和学术界广泛普及
尽管落地速度不尽相同,但人工智能在很多行业中已经处于蓬勃发展的阶段,是不争的事实。在智能家居、自动驾驶、机器人、网络安全、医疗设备等新兴行业中,得益于良好的数字化技术基础,人工智能的发展和落地就相对较为领先。而在数字化基础相对落后一些的传统行业,例如电力、化工等领域,人工智能、大数据、数字化的普及与转型可以说才刚刚开始,还需要大量的数字化积累。
在李靖远所列举的案例中——日本Daihatsu公司分析汽车发动机产生爆震的原因;三星公司研究降低无线通信电路的噪音;韩国能源研究所对风机,尤其是海上风机进行故障监测;医疗设备公司将人工智能用于可穿戴医疗传感器中,都利用到了MathWorks提供的机器学习和深度学习工具箱。而在MathWorks官网上,仅使用MATLAB AI解决工程问题的案例就超过了100个。
AI将工程、计算机科学、数据科学和IT部署整合起来
之前,科学计算、工程、数据科学和IT部署,是彼此相对独立的。但未来,在AI的加持下,这几大环节将被有机的整合在一起,包括传统意义所指的开发流程、部署流程和企业运营流程,它们将通过人工智能、无代码、低代码等趋势紧密的结合在一起。
“低代码、无代码的工具在进行建模仿真之后,可以自动地生成代码,然后再被部署到CPU/MCU/GPU/FPGA等多种类型的边缘设备之上。”李靖远说。
除此之外,MathWorks还针对企业级部署在开发侧推出了MATLAB Production Server和Web App Server这样的产品,配合前文提到的海量数据处理、无代码/低代码建模系统软件、自动化代码生成,就能够共同帮助运维人员将算法快速的部署在企业IT/OT系统中,做到开发和运营一体化部署,实现开发部署运营流程的融合DevOps。
模型可解释性帮助增强在安全关键系统中使用人工智能的信心
在航空航天、军工等安全关键领域中,它们对于机械模型设计、虚拟仿真技术的态度,是要求所涉及到的模型必须具备清晰的可解释性,才会接受和应用。但长期以来,人们一直将AI视为一种黑盒式的系统建模方法。。随着研究者设计出更多可解释性方法,且越来越多的软件供应商将这些方法加入自己的工具,业内工作者会更愿意将AI创新纳入自己的工作流。
也就是说,工程师和科学家开始理解模型做出特定决策的理由,以及模型可以安全运行的范围。他们能通过试验来解释模型在不同场景中的运行方式,并借助可视化来理解模型不正常运行时的内在工作机制。这种理解正推动汽车、航空航天和医疗等行业标准委员会对安全关键型系统中 AI 的验证和确认进行创新,例如EUROCAE和FDA都在致力于开发这方面的认证标准。
仿真和测试将迈入三维时代且更加逼真
要实现安全关键型系统中AI的形式化验证和确认,关键的一步是在所有可能的场景中测试系统的运行状况。对于自动驾驶汽车,目前这个步骤是在驾驶员的协助下通过路测完成的。物理测试大大限制了场景的多样性,增加了捕获所有关键边缘情形所需的时间。
今后几年内,工程师有望借助三维仿真软件工具的最新技术,极大程度地摆脱物理测试的限制。他们可以将AI模型集成到传统方法,例如用于物理系统建模的基于模型的设计,然后在各种仿真三维场景中执行自动测试。
将有更多的AI模型部署到更多低功耗、低成本的嵌入式设备中
有越来越多的方法可以将AI整合到更多边缘系统,从FPGA、ECU到MCU,更多低成本、低功耗设备得到了广泛的硬件支持,并为工程师所用。软件供应商使这一创新成为可能,他们让非芯片专家也能运用种种先进方法,让这些方法不再是嵌入式系统工程师的专利。借助量化和剪枝等方法减小要部署的模型,并采用深度学习社区提供的高效预训练模型,可以实现AI的高效部署,并能够让基于AI的系统在今后得到更为广泛的应用。
人工智能帮助应对全球挑战
这里提及的全球挑战,包括从持续的传染病大流行到气候变化,再到电动汽车的发展、碳中和等等,越来越多的科学家在使用MATLAB数据算法去分析新冠病毒的流行趋势,对大气进行长期的空气质量监测,利用数据分析大气的气候变化等等。
以数据为中心的人工智能
之前我们所熟知的人工智能技术更专注于模型和算法本身,但从2019年开始,相关研究方向开始专注于改善提供给模型和数据管理的数据,也就是说要给予模型更好更优的算法、更优的数据,数据的优化代表着能产生更优秀的模型。
无代码/低代码/自动编码:大量的宣传为扩大AI用户群体带来巨大好处
各个垂直行业领域中专家的Know-How主要集中于本领域内,如何以更简洁的方式,让他们可以快速的上手人工智能,将人工智能算法与自身擅长的领域知识相结合,是MathWorks在思考的问题。在这个前提下,无代码和低代码就起到了很大的关键作用——利用MathWorks所提供的深度学习、机器学习,包括强化学习工具箱,专家们就算并不擅长编程,也能很快地掌握无代码/低代码的人工智能学习方案。
自动标记就是一个很好的案例。众所周知,在面对海量数据的时候,我们很难通过人工的方式去给不同的数据类型“打标签”。但有了自动打标签APP之后,它就会自动给所有类型的数据标注标签,之后再对其进行训练、调优以及可视化,这样,工程技术人员就可以非常清晰地看到相关内容。
MathWorks在其中提供了完整的AI工具链,除了“打标签”,还包括对采集到的数据进行预处理,例如通过算法拟合补充丢失的数据,过滤“脏”数据等等,之后再进行人工智能的建模、仿真、测试和部署。值得一提的是,这条工具链还可以实现跨平台操作,无论是Tensorflow、Pytorch,还是ONNX格式模型,都可以将框架中的模型导入MATLAB和Simulink之中,并进行仿真测试。
AI驱动跨框架、跨平台和多学科团队之间的协作
Tensorflow、Pytorch、Keras、Caffe等AI框架各自专注的领域并不相同,没有任何一个框架可以解决所有的问题,所以各个框架之间的协同和互操作性就成为一个非常必要的因素。MathWorks希望改变这种局面,其做法是以Simulink为基础平台,将其他框架中的算法导入Simulink之中,使之成为整个大系统仿真的一部分,以此来更好地促进不同学科之间的交流,以及整个平台系统级的仿真。
下图解释了这一流程。MATLAB作为企业级AI开发平台,不同框架里的所有模型都会导出为ONXX格式,方便其在各个平台之间相互调用,增强互操作性。同时,MATLAB还针对几种主流框架提供了导入器工具,Tensorflow、Keras、Caffe、Pytorch等框架中的模型可以通过导入器自动进入MATLAB中,形成系统级仿真。
但在李靖远看来,仅做到这一点并不足够,使用一些降阶模型去替代高保真仿真模型以加速仿真速度,也是今后的趋势。因为很多非线性系统,包括流体力学中的多维系统,在实际仿真过程中需要的并不是高保真仿真模型,而是整个系统模型的输入、输出要尽量接近真实。此时,利用人工智能所实现的降阶模型就有了用武之地,我们可以将其作为系统的一部分来加快仿真速度。
而且对于很多非线性系统来说,其建模都是通过查表来完成的,因为设计人员无法了解它们的物理结构,并通过物理结构去真实地建立对应的模型,只能通过一些实验数据来建立模型。但人工智能能够改变这一切,通过大量的深度学习数据,设计人员就能够在面对非线性系统建模时找到其中的规律,从而更好的进行系统仿真,这在以前是很难想象的。
另一方面,当前很多大规模AI训练模型取得了巨大成果,但对资源消耗过大,从参数量分别为1700亿和3亿+的GPT/BERT模型,到华为2000亿参数的“盘古”模型,再到google万亿级稀疏模型switch transformer,为了适应更好的广度要求,这些模型的规模越做越大。
于是有专家提出了大模型与相关联的小模型协同发展的思路,就是大模型输出模型能力,小模型负责实际的推理与执行,然后再将结果进行反馈。这与李靖远提出的“采用降阶模型来代替高仿真模型”说法不谋而合,因为大多数时候我们更想了解的是系统级的响应,所以当使用小模型去进行系统性仿真时,就能够加快仿真速度,并取得较高的经济性。
但需要强调的是,目前降阶模型的主要适用场景分为两种:一是针对非线性模型,二是在仿真过程中,理想模型与降阶模型的吻合度相对比较高。
人工智能大量用于应用科学研究
从近年来人工智能的发展趋势来看,应用学科日益成为AI应用的新热点。例如迁移学习使研究人员更容易在工作中应用人工智能,他们只需在实际应用中对训练好的模型进行一定幅度的微调,就可以快速地将其部署于实际场景中。此外,研究人员利用GANs等领先的人工智能技术来生成对抗网络,开拓新的人工智能技术如PIML以促进机器学习和物理知识的融合等,也都是很好的案例。
- MathWorks 的MATLAB 已在中国配合美帝制裁哈工大等高校,这些人如中国区行业市场经理李靖远等还好意思继续在中国为MathWorks开拓市场吗?!