瑞士电子与微技术中心(CESM)的研究人员开发出高效率的机器学习算法,并用于设计出一款仅有几立方公分的低功率实时脸部侦测与辨识摄影机系统。
研究人员将这款经概念验证的系统称为“视觉封装”(Vision-In-Package;VIP)系统,整合了摄影机系统,以及低功耗处理器(ARM Cortex M4/M7与8MB RAM)、高动态范围成像器、光学组件和通讯接口等。该系统仅占用约4立方公分的空间,连电池加起来的重量还不到20克,并配备一套可实时执行的完整脸部分析管线,并完全嵌入于此VIP系统中。
其软件部份十分精简且独立作业,无需外部支持。它是由精简版uKOS操作系统(在μKernel计划开发)以及执行于其上的脸部分析套件共同组成。相较于执行于强大硬件架构的现有系统,VIP系统仅需更低几十倍的CPU时间与内存容量,而其分析管线大约以每秒4-5格的速率执行QVGA级的分辨率。
首先,该系统侦测到所有的脸部数据输入并撷取信号格,这通常需要不到100毫秒(ms)的运行时间,而且仅需几百KB的RAM内存。接着,诸如眼角与鼻角等脸部特征,就会落在每次侦测到的脸部区域,并经过标准化步骤(水平校准眼睛以及缩放脸部至标准尺寸的概略几何转换步骤,以及亮度测量标准化,包括移除由阴影和不均匀照明所导致的非线性强度变化),归纳出“脸部”。
然后进行实际的脸部识别,在一些特点位置撷取描述性特征,以便在脸部注册数据库中辨识人物。任何时候,只需点选即可在此数据库中注册新的人脸,而无需再次进行训练。
为了实现这一点,研究人员们使用高效率的机器学习算法,包括Adaboost、回归树的集合以及LBP算法,并进行数百万个案例的“训练”。研究人员表示,由此产生的分类器通常仅占几百KB的空间,甚至还可快速执行在低端移动处理器上。
该视觉封装系统还可应用在可穿戴设备、营销与广告分析(收集收视率与人口统计资料、实现更多人际互动的机器人)、电视制造商(1984年型电视机即将来临)、汽车产业(监测驾驶人是否有睡意、分心驾驶,或用于自动设定调整),以及无处不在的安全相机(日益智慧化)。
编译:Susan Hong
本文授权编译自EE Times,版权所有,谢绝转载
关注最前沿的电子设计资讯,请关注“电子工程专辑微信公众号”。