广告

利用深度学习和计算机视觉分析脸部表情

2017-07-20 09:31:08 Gordon Cooper,Synopsys嵌入式视觉产品营 阅读:
深度学习技术对于降低计算机视觉识别和分类的错误率展现出巨大的优势。在嵌入式系统中实施深度神经网络有助于机器透过视觉解读脸部表情,并达到类似人类的准确度。
广告

辨别脸部表情和情绪是人类社会互动早期阶段中一项基本且非常重要的技能。人类可以观察一个人的脸部,并且快速识别常见的情绪:怒、喜、惊、厌、悲、恐。将这一技能传达给机器是一项复杂的任务。研究人员经过几十年的工程设计,试图编写出能够准确识别一项特征的计算机程序,但仍必须不断地反复尝试,才能识别出仅有细微差别的特征。

那么,如果不对机器进行编程,而是直接教机器精确地识别情绪,这样是否可行呢?

深度学习(deep learning)技术对于降低计算机视觉(computer vision)识别和分类的错误率展现出巨大的优势。在嵌入式系统中实施深度神经网络(见图1)有助于机器透过视觉解读脸部表情,并达到类似人类的准确度。
20170719_Synopsys_TA31P1
图1:深度神经网络的简单例子

神经网络可经由训练而识别出模式,而且如果它拥有输入输出层以及至少一个隐藏的中间层,则被认为具有“深度”识别能力。每个节点从上一层中多个节点的加权输入值而计算出来。这些加权值可经过调整而执行特别的影像识别任务。这称为神经网络训练过程。

例如,为了训练深度神经网络识别面带开心笑脸的照片,我们向其展示开心的图片作为输入层上的原始数据(影像像素)。由于知道结果是开心,网络就会识别图片中的模式,并调整节点加权,尽可能地减少开心类别图片的错误。每个显示出开心表情并带有批注的新图片都有助于优化图片权重。藉由充份的输入信息与训练,网络可以摄入不带标记的图片,并且准确地分析和识别与开心表情相对应的模式。

深度神经网络需要大量的运算能力,用于计算所有这些互连节点的加权值。此外,数据存储器和高效的数据移动也很重要。卷积神经网络(CNN)(见图2)是目前针对视觉实施深度神经网络中实现效率最高的先进技术。CNN之所以效率更高,原因是这些网络能够重复使用图片间的大量权重数据。它们利用数据的二维(2D)输入结构减少重复运算。
20170719_Synopsys_TA31P2
图2:用于脸部分析的卷积神经网络架构(示意图)

实施用于脸部分析的CNN需要两个独特且互相独立的阶段。第一个是训练阶段,第二个是部署阶段。

训练阶段(见图3)需要一种深度学习架构——例如,Caffe或TensorFlow——它采用中央处理器(CPU)和绘图处理器(GPU)进行训练计算,并提供架构使用知识。这些架构通常提供可用作起点的CNN图形范例。深度学习架构可对图形进行微调。为了实现尽可能最佳的精确度,可以增加、移除或修改分层。
20170719_Synopsys_TA31P3
图3:CNN训练阶段

在训练阶段的一个最大挑战是寻找标记正确的数据集,以对网络进行训练。深度网络的精确度高度依赖于训练数据的分布和质量。脸部分析必须考虑的多个选项是来自“脸部表情识别挑战赛”(FREC)的情感标注数据集和来自VicarVision (VV)的多标注私有数据集。

针对实时嵌入式设计,部署阶段(见图4)可实施在嵌入式视觉处理器上,例如带有可编程CNN引擎的Synopsys DesignWare EV6x嵌入式视觉处理器。嵌入式视觉处理器是均衡性能和小面积以及更低功耗关系的最佳选择。
20170719_Synopsys_TA31P4
图4:CNN部署阶段

虽然标量单元和向量单元都采用C和OpenCL C(用于实现向量化)进行编程设计,但CNN引擎不必手动编程设计。来自训练阶段的最终图形和权重(系数)可以传送到CNN映射工具中,而嵌入式视觉处理器的CNN引擎则可经由配置而随时用于执行脸部分析。

从摄影机和影像传感器撷取的影像或视讯画面被馈送至嵌入式视觉处理器。在照明条件或者脸部姿态有显着变化的识别场景中,CNN比较难以处理,因此,影像的预处理可以使脸部更加统一。先进的嵌入式视觉处理器的异质架构和CNN能让CNN引擎对影像进行分类,而向量单元则会对下

一个影像进行预处理——光线校正、影像缩放、平面旋转等,而标量单元则处理决策(即如何处理CNN检测结果)。

影像分辨率、画面更新率、图层数和预期的精确度都要考虑所需的平行乘积累加数量和性能要求。Synopsys带有CNN的EV6x嵌入式视觉处理器采用28nm工艺技术,以800MHz的速率执行,同时提供高达880MAC的性能。

一旦CNN经过配置和训练而具备检测情感的能力,它就可以更轻松地进行重新配置,进而处理脸部分析任务,例如确定年龄范围、识别性别或种族,并且分辨发型或是否戴眼镜。

总结

可在嵌入式视觉处理器上执行的CNN开辟了视觉处理的新领域。很快地,我们周围将会充斥着能够解读情感的电子产品,例如侦测开心情绪的玩具,以及能经由识别脸部表情而确定学生理解情况的电子教师。深度学习、嵌入式视觉处理和高性能CNN的结合将很快地让这一愿景成为现实。

EETC wechat barcode


关注最前沿的电子设计资讯,请关注“电子工程专辑微信公众号”。

本文为EET电子工程专辑 原创文章,禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
  • 面板大厂每周工作超52h,可带薪休假3天! 据业内人士2月11日透露,三星显示器近期限时推出名为“平衡假期”的特别假期。具体内容是,每周平均工作超过52小时的员工可获得三天带薪休假,每周工作超过60小时的员工可获得六天带薪休假。上个月,三星显示
  • 勤哲Excel服务器自动生成跨领域经营企业中的管理系统 在当今竞争激烈的商业环境中,企业运营效率的高低往往决定了其在市场中的地位和生存能力。而信息化系统的应用,正逐渐成为企业提升运营效率的关键因素。众所周知,信息化系统能够实时监控企业生产、销售等各个环节的
  • 又一显示大厂人事地震:董事长辞职 2月10日消息,天眼查App显示,近日,杉杉控股有限公司发生工商变更,周婷卸任法定代表人,并由董事长变更为董事;周顺和接任法定代表人并担任董事长;孙伟卸任董事职务。 2月7日,杉杉集团在宁波市鄞州区人
  • 三星初期独供iPhone折叠屏,预计明年5月量产 据IT业界9日报道,苹果公司最近进入了“可折叠iPhone”零部件供应商选择的最后阶段,据观察,三星显示器已决定独家供应初期面板量。据悉,三星将供应约1500万至2000万片,并将于明年5月开始量产,
  • 大联大世平集团推出基于NXP产品的AI胶囊咖啡机方案 大联大控股今日宣布,其旗下世平推出基于恩智浦(NXP)MCX N947 MCU的AI胶囊咖啡机方案。    图示1-大联大世平基于NXP产品的AI胶囊咖啡机
  • 为什么三极管基极和发射极端需要并联一个电阻? 三极管基极和发射极端并联电阻主要是为了提高电路的可靠性:1、三极管的基极不能出现悬空,当输入信号不确定时(如输入信号为高阻态时),加下拉电阻,可有效接地,防止三极管受噪声信号的影响而产生误动作,使晶体
  • 特斯拉上海储能超级工厂正式投产 2月11日,特斯拉上海储能超级工厂投产仪式今日在上海临港举行,这一重要项目的投产标志着特斯拉在华业务的进一步拓展。特斯拉上海储能超级工厂于 2024 年 5 月正式在上海临港新片区开工建设。从开工到产
  • 比亚迪,又掀桌子了 一年一度的新能源汽车“掀桌子”活动又开始了,前两年新能源汽车“价格战”的阴影还没有消散,今年关于智能驾驶只怕又要卷生卷死了。搅动风云的,依旧是那个男人,依旧是那个品牌——比亚迪,又来掀桌子了。昨晚,比
  • 恩智浦拟以3.07亿美元收购边缘NPU企业Kinara 恩智浦 NXP 荷兰当地时间昨日宣布已同边缘 NPU 企业 Kinara 达成最终协议,计划以 3.07 亿美元现金收购后者。这笔交易预计将于 2025 上半年完成,但须满足包括监管部门批准在内的惯例
  • 消息称宁德时代计划本周提交港股上市申请,筹资至少50亿美元 据路透社报道,宁德时代计划本周提交港股上市申请,筹资至少 50 亿美元(当前约 365.4 亿元人民币)。2024年12月,宁德时代表示,经公司股东大会审议通过后,最快在 18 个月内完成在港上市,并
广告
热门推荐
广告
广告
广告
EE直播间
在线研讨会
广告
广告
广告
向右滑动:上一篇 向左滑动:下一篇 我知道了