广告

效率远高于CPU、GPU和DSP的嵌入式视觉处理器将问世

2015-04-23 张迎辉 阅读:
视觉处理是最近两年最火最受关注的技术之一,多家市场调研公司数据显示,视觉处理系统的市场到2020年将超过3000亿美元,年复合增长率超过35%,主要应用在包括汽车安全、图像侦测、视频监控和手势识别游戏操控等。本文将介绍Synopsys公司最新推出的嵌入式视觉处理器IP……

OPTION_5:HP

视觉处理是最近两年最火最受关注的技术之一,市场调研公司ABI Research、InSight Media等多家公司的数据显示,视觉处理系统的市场到2020年将超过3000亿美元,年复合增长率超过35%,主要应用在包括汽车安全、图像侦测、视频监控和手势识别游戏操控等。

fig.1 视觉处理市场增长预期到2020年将超过3000亿美元。《电子工程专辑》
fig.1 视觉处理市场增长预期到2020年将超过3000亿美元。

电子工程专辑记者邵乐峰的文章《揭秘谷歌Tango计划背后的芯片巨人》一文中介绍了一家号称将有可能改变世界的芯片公司,本文将会介绍由Synopsys公司最新推出的嵌入式视觉处理器IP。 Synopsys DesignWare ARC处理器高级产品营销经理Mike Thompson介绍了一款新开发的可编辑和可配置的IP,可以提供比通过CPU、移动GPU和DSP等更高的视觉处理效率,同时它还可以通过自我学习与培训,实现在更多应用领域更精确的视觉处理能力。

fig.2 Synopsys DesignWare ARC处理器高级产品营销经理Mike Thompson《电子工程专辑》
fig.2 Synopsys DesignWare ARC处理器高级产品营销经理Mike Thompson

为什么需要嵌入式视觉处理?

Mike Thompson认为,目前现有的视觉处理应用,包括智能监控、生物识别和机器视觉,以及基于云处理的城市监控技术,都是基于非常强大的CPU硬件和带操作系统的软件处理的视觉处理,尽管处理能力很强大,但同时消耗的功耗非常大,处理的响应较慢。而一些特别的应用,例如车载的交通信号识别、人脸识别和手势识别,则要求低功耗且能即时响应,这些新的应用,需要市场能够提供的处理器IP,来设计研发出新的SoC或处理器。

fig.3 与CPU、GPU和DSP相比,SNPS EV处理器的视觉处理效率高出很多《电子工程专辑》
fig.3 与CPU、GPU和DSP相比,SNPS EV处理器的视觉处理效率高出很多

虽然视觉算法可以在大多数处理器上运行,但是这类算法牵涉到许多的复杂数学运算和数据迁移。通用处理器(GPP)可以用来做视觉处理,但是这样的处理器缺少复杂数学运算资源,运行起来速度会非常慢。在一些视觉应用中,采用的图形处理器(GPU)虽然具有许多的运算资源,但是却缺乏高效移动视觉数据的能力,因此其视觉性能相对较低,并且其功耗也非常的高。视觉处理器是专为视觉处理而设计,因此它们拥有所需的复杂数学运算能力,并且它们还具有精密的数据迁移能力,能够有效地处理视觉帧数据。此外,要能够在嵌入式视觉应用中得到使用,它们也需要满足低功耗要求。

“在包括安全设备、游戏设备和汽车电子等诸多产品中,嵌入式系统从各种视觉输入中提取观测结果的能力正在变得越来越重要,这正是对拥有更高性能和更高能效的视觉处理功能的驱动性需求,”嵌入式视觉联盟(Embedded Vision Alliance)创始人Jeff Bier表示。“像Synopsys的DesignWare EV处理器这样的专用处理器可以帮助设计人员为其视觉应用实现想要的性能,而同时仅需适用于便携式设备的功耗等级。”

第2页:如何突破视觉识别精度的瓶颈?

第3页:专为无缝集成到SoC中而设计的EV处理器

{pagination}

如何突破精度的瓶颈?

Synopsys公司近日对外发布了全新DesignWare EV视觉处理器产品。该系列的EV52和EV54视觉处理器是完全可编程和可配置的视觉处理器IP核,它们结合了软件解决方案的灵活性与专用硬件的低成本和低功耗特性。

fig.4 Synopsys DesignWare ARC嵌入式视觉处理器家族的技术原理图,内嵌4个RISC CPU和2至8个E(processing element)。《电子工程专辑》
fig.4 Synopsys DesignWare ARC嵌入式视觉处理器家族的技术原理图,内嵌4个RISC CPU和2至8个E(processing element)。

上面这张图实际上是实现高效实时处理的关键:多个可并行、独立运算的PE可快速进行目标检测,即运行卷积神经网络(CNN)等算法,而且所有的RISC和PE单元均可编程配置。

Synopsys DesignWare ARC处理器高级产品营销经理Mike Thompson在媒体见面会上对电子工程专辑记者说,EV处理器以超过1000GOPS/W的性能实现了卷积神经网络(CNN),从而能够仅以其他视觉解决方案的一小部分功耗,实现对诸如面部、行人和手势等多样化的目标快速而准确的监测。

Mike表示, EV处理器系列得到了基于OpenCV和OpenVX等现有和新兴的嵌入式视觉标准,以及Synopsys的MetaWare开发工具包的综合性软件编程环境的支持。通过把专为视觉数据处理而优化的高性能硬件与高效编程工具结合在一起, EV处理器成为了各种嵌入式视觉应用的一种理想解决方案,包括视频监控、手势识别和目标监测等应用。

据Mike Thompson介绍,Synopsys从2012年开始开发DesignWare ARC嵌入式视觉处理器,一开始其识别率就达到了85%,如果是通过更好的CNN模型和不断培训,准确率还可以更高。“2015年谷歌微软的视觉识别精度是95%,但那是通过服务器云处理实现的。如果经过更多的CNN的培训,我们的解决方案的精度甚至可能更高。”Mike 说。“它就像是人的眼睛和大脑,刚开始看到一样东西时,你可能会认不出来,但如果你天天都不断地去看,识别的准确率就会很高。”

EV处理器系列包含多个高性能处理内核,可在典型的28nm工艺技术中实现高达1GHz的运行速率。EV处理器系列也实现了一种前馈卷积神经网络(CNN)结构,它支持一个可编程的点对点串流互连网络,以用于快速和准确的目标监测这一视觉处理的关键任务。执行单元处理器的数量可配置,开发人员能够在视觉应用中利用通用的任务级和数据级并行处理功能,去执行复杂的图像和视频识别算法,同时仅消耗市场上其它可用视觉处理器五分之一的功耗。

高生产率的编程工具

在开发方面,Synopsys提供了一个完整的、包括OpenVX和OpenCV库、以及Synopsys的MetaWare开发工具包的软件编程环境,简化了Synopsys EV处理器系列的应用软件开发。可用于EV处理器的OpenCV源程序视觉库提供了用于实时计算机视觉的2500多种功能。

这些处理器都是可编程的,同时可以被“训练”从而支持任何监测目标图形。OpenVX框架包括43个标准计算机视觉内核, 它们已专为运行在EV处理器上而进行了诸如边缘监测、图像金字塔创建和光流估计等优化。用户们也可定义新的OpenVX内核(kernel),为其目前的视觉应用带来灵活性,同时满足未来目标监测的需求。OpenVX内核可以在运行时分配给EV处理器的多个单元执行,从而简化了处理器的编程。完整的工具套件和源程序库、以及可提供的参考设计使得设计人员能够高效的构建、调试、评估和优化其嵌入式视觉系统。

第3页:专为无缝集成到SoC中而设计的EV处理器

{pagination}

更方便地集成进SoC中

EV处理器专为无缝地集成到SoC中而设计。他们可与任何的主处理器搭配使用并与其并行工作。EV系列通过信息传递和中断来支持与主处理器的同步。此外,EV处理器的内存可映射到主处理器。这些特点使得主处理器能够保持控制,同时使所有的视觉处理都能够被卸载到EV处理器上,这样可降低功耗并且加速结果呈现。EV处理器可以存取储存在SoC内存映射区域内的数据,或在需要的情况下,通过ARM AMBA AXIT标准系统接口独立地存取芯片外数据源提供的图像数据。

fig.5 Synopsys的嵌入式处理器的目标应用市场《电子工程专辑》
fig.5 Synopsys的嵌入式处理器的目标应用市场

“嵌入式视觉正在从视频监控到消费性产品和游戏设备等一系列多样化的应用中推动创新,” Synopsys DesignWare ARC处理器高级产品营销经理Mike Thompson表示。“Synopsys的全新EV处理器系列提供完美的目标监测精度和5倍的功效优化,同时提供了一个全面的视觉程序库和一个强大的软件编程环境的支持。这种结合使设计团队能够把嵌入式视觉功能更快地集成到更多的系统中,同时功耗比现有的解决方案大大降低。”

DesignWare EV52和EV54处理器计划于2015年5月供货。目前Synopsys还免费为客户提供人脸识别、交通信号的速度识别、智能视频监控的人脸识别和人脸跟踪等参考设计。相信很快,集成了EV52和EV54处理器的SoC,将有望进入市场,帮助客户提供在视觉处理方面的更佳体验。

“最终应用包括摄像头、可穿戴设备、家庭自动化、数字电视、虚拟现实、游戏设备、机器人、数字显示屏、医疗电子以及汽车信息娱乐系统等。”Mike说,

名词解释:什么是CNN(Convolutional neural network) ?

卷积神经网络(CNN)模拟我们大脑处理视觉时的工作状态。它们将图像分解成若干部分,并逐步找到其被训练去识别的目标。CNN已经存在了20多年,但直到近年这些算法才有了实质上的改进,并且目前在目标识别方面较其他可用算法甚至是人类专家更好。CNN是一种深度学习算法,其训练方式与我们的大脑采用目标的多幅图像来进行训练差不多,它基于这些图像归纳出能够被算法利用、用以在图片或视频中找到目标的一幅图形。

Nvidia、CEVA、Microsoft以及其他公司近期的发布强调了嵌入式视觉向CNN的迁移。其实,Microsoft和Google最近都已在高端应用中采用了CNN,其所得的精度超过了95%,较人类专家还要更高。CNN目前是获取高质量和高精度结果的最佳视觉算法,其性能比Viola-Jones、HOG、SIFT和SURF等其他算法更胜一筹。

本文为《电子工程专辑》原创,版权所有,谢绝转载

本文为EET电子工程专辑 原创文章,禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
您可能感兴趣的文章
相关推荐
    广告
    近期热点
    广告
    广告
    可能感兴趣的话题
    广告
    广告
    向右滑动:上一篇 向左滑动:下一篇 我知道了