我最近参加了上海世界通信大会(MWC)。机器人的声势浩大,而且是非常浩大。我看到几十家公司,寻找顾客打造品牌,并提供他们众多应用程序中的任何一种。
举个应用程序的例子,机器人护士Tug。它看起来一点也不像我们在科幻片中看到的机器人形象,除非你想的是星际大战(Star Wars)中某些比较实用的例子。它看起来像是一个有轮子的箱子,但拥有许多我们期待行动机器人具备的功能,包括巡游和回避障碍物。这可以在医院里巡游,若是有人走道它面前,就会停下,还会绕过不对的点滴站;这台机器人还能呼叫电梯,前往其他楼层。Tug的重点是送药和食物给病人,且已经在美国37间荣民医院服务。
想象这能替忙碌的护士减轻多少肩头负担。厂内还有多种其他助理应用服务,在长者照护、在教学支持、餐厅与旅馆。把这当成在智能音箱之后,下个重要的个人助理物品(Amazon已经有超过十万台机器人在仓库工作,所以很明显他们正在开发家用机器人当作Echo的后继者)。这不是科幻小说;家用助理机器人今天就可以出货。
机器人健康助理
很显然,生产这种机器人的技术挑战和自动驾驶问题类似,不过依然有明显的不同。巡游和回避障碍是共通点,但清晰驾驶车道和交通管理的概念,无法运用在这些机器人身上;一切都关乎在建筑物内的障碍回避与巡游(要重新规划地图以绕过临时不可移动的障碍)。虽然车子有自然语言接口只是还不错,但是对机器人助理来说,却是不可或缺。谁想要在药房送错药,或是餐厅搞砸点单时学着怎么按钮?
Gartner 最近推出一份机器人人工智能与感应要求的前十大清单,其中包括了:
• 计算机视觉-场景分析、对象识别等等
• 生物识别与验证-谁在跟我说话,他们是否获准下达此等命令
• 对话接口-话语识别与自然语言处理
• 声音场景分析-识别明显的噪音如狗吠或玻璃破裂
• 地点感应-我在哪,谁/什么在我附近
• 自动移动-能够不撞倒对象或人,移动到建筑物其他地方的能力
• 机器人内建人工智能功能-不只是仰赖云端
现今对于建立具有这些能力的系统默认取向,从根据多核心绘图处理器(GPU)平台,在机器人内建人工智能系统。这可以理解──产品建立者可以使用现成的平台做样品,无须担心专用集成电路(ASIC)细节,就像他们会使用中央处理器(CPU)开发板给更传统应用程序使用的方式一样。但是随着产品数量暴增,或着你正推动其暴增的时候,成本与顾客满足/差异化就愈来愈重要。现成的解决方案很贵,耗电量很大,且使用和别人一样的平台就很难有所差异。这就是为什么无可避免地,大量解决方案转向ASIC平台。你无须放弃所有已经投入样品的投资;成本较低的GPU平台可能还是解决方案的一部份,但是重要层次的人工智能功能性可以转移到更有成本效率、更加统合的平台上。
在机器学习(ML)应用程序中,数字信号处理(DSP)优于GPU的每瓦特效能远近驰名,有一部分原因是固定点优于浮动点操作,还有某些平台的量化弹性。订做解决方案的价格优势(以数量算)也很出名。这就是为何你更有可能看到具数量/价格敏感性的ML应用程序在边际采用DSP而不是现有的GPU。
智能屏幕-无屏幕机器人的形式之一?
但你能做到所有用GPU可以做到的事吗?答案是还真不少。拿计算机视觉,亦即定位、追踪、对象识别、手势识别为例。这个程度的视觉处理现在在某些DSP为基础的内建平台上已经有了。或者用自动移动支持本地重新训练(无须连上云端)。再一次,支持此一智能的核心识别能力,也是你在GPU会发现的同样能力,在DSP上也找得到。
语音识别/验证与声音场景分析也可以卸下。这些(和其他这里举的例子)明白地点出,为何卸除的意义这么重要。这每一种智能操作都分解成多重步骤,就说从取得声音,到方向解析,到也许基本字词识别,最终甚至是自然语言处理(NLP)。最后一步非常困难,可能需要上云端。但是在那之前的步骤都可以很轻松用内建解决方案处理。某些应用程序,只须识别很有限的单字,或是你希望侦测非语言信号,例如打破窗户的地方,你可能根本不需要云端(或本地GPU)。已经有人暗示,甚至有限的NLP在不久的未来便能在边际支持。
例如CEVA打造了一连串庞大的解决方案,在边缘人工智能用平台、前端语音处理、物联网深入学习上,使用人工智能支持这些前端功能。