移动计算推动了产品机会的爆发——智能手机、可穿戴设备、可听设备、运动相机等。传感技术将进一步扩大必须具有环境感知的应用机会。现在,对于运输、机器人、家庭自动化、智能城市、工厂和仓库管理中许多可能的应用来说,通过视觉、雷达或激光雷达传感来进行物体识别和碰撞警告,通过超声波传感器实现短距离的接近侦测,通过惯性测量单元(IMU)进行运动和姿势检测,基于声学的危险声音检测已经很普遍了。说实话,这个清单是无穷无尽的。我们拥有建立一个由智能传感驱动的未来主义的、几乎是科幻小说的世界所需要的所有原材料。但是怎么做呢?
从感知到运动
想一想一个在机场周围移动的机器人助手。帮助乘客办理登机手续,找到他们的登机口,获得航班的详细信息。这个机器人必须在机场内自由移动,不能撞到在各个方向行走或奔跑的人,或可能是静止的或有时可能移动的物体。这个机器人助手应该知道如何在一个不断变化的环境中进行智能导航。而且,它必须在一定的可能性范围内,能够理解并响应自然语言的语音命令。我们将在下面讨论这个问题。
光学和接近传感器是智能导航技术的一个起点。这些传感器信息输入到一个被称为SLAM的复杂算法中,并生成一个不断移动变化的的空间的点阵云图且随之变化更新。弱光条件下,SLAM技术正越来越多地被航位推算所加强,因为在弱光条件下,光学的效果较差。这种方法从一个已知的位置追踪运动,从车轮运动、加速计和其他传感器中获取信息。同时,接近传感器提供输入,避免撞上一个物体或一个人。我们已经有多个传感器向算法提供信息,以构建地图和定位机器人助手在地图中的位置。
基于摄像头的SLAM需要高精度的线性方程求解,矢量DSP平台很适合。基于超声波的接近感测必须从降噪开始,在回声和其他杂波中定位最近的物体,然后进行范围(和方向)计算。这种信号处理非常适合于标量DSP。
从声音到行动
一位乘客看到一个助手,就叫它过来:"嘿,Airbot!" 首先,助理必须识别这个命令和它的来源。这一步需要一些复杂的音频处理,尤其是在机场航站楼这样的嘈杂环境中。识别触发语音命令是任何智能音箱中都会有的基本人工智能。机器人还可以通过“波束成形(beamforming)”技术检测语音命令的来源方向。这个技术需要更多的信号处理,从多个麦克风在稍微不同的时间检测到的识别命令中找出方向。
我们的机器人助手”滑行”到乘客身边,沿途避开其他障碍物,在几英尺远的地方停下来,问道:"我能为你做些什么?"它在屏幕上展示了一系列它知道如何回答的问题,然后乘客说,"我想办理登机手续"。我们的机器人首先必须做一些更多的信号处理,以减少该音频信号的噪音,部分通过波束成形,部分通过回声消除。然后,它必须识别这个命令。
自然语言处理(NLP)可以在云端处理,但机场网络有很大的负荷。因此,NLP必须在本地处理,以便快速响应。机器人应快速响应,以提供令人满意的用户体验。它要求乘客直接看着它的屏幕,拍一张照片,然后要求乘客插入一个图片ID,如护照身份页。然后它可以比较这些图片以增加安全性,这需要一个强大的可编程神经网络引擎。
办理登机手续的剩余步骤?那就有传统的嵌入式处理就够了。
将一切结合起来
智能传感设备必须使用一个支持同时处理多个传感器的平台。它应该为前端信号处理提供强大的标量DSP支持,为基于图像的计算和SLAM提供矢量DSP支持。对语音和视觉人工智能的神经网络支持,也是一个矢量DSP,但对神经网络有特殊的扩展,同时在SDK中有丰富的软件编译器和库,为你提供这些技术领域的所有基础支持。
CEVA的 "SensPro2"是传感平台提供动力的方案之一。基于CEVA在视觉、音频、SLAM和人工智能方面的强大背景,SensPro2是一款用于多任务传感和多传感器的人工智能(包括摄像头、雷达、激光雷达、飞行时间、麦克风和惯性测量单元)的高度可扩展和增强的第二代高性能传感器控制中心SensorHub DSP。