广告

Cadence:Tensilica Vision C5 DSP不同于神经网络加速器

时间:2017-06-26 14:09:37 作者:张迎辉 阅读:
在硅谷2017夏季拜访Cadence总部时,刚刚发布不久的Cadence Tensilica Vision C5 DSP再一次被该公司的产品市场负责人提起,他们向电子工程专辑强调,Vision C5 DSP不是一个普通的神经网络加速器……
广告

在硅谷2017夏季拜访Cadence总部时,刚刚发布不久的Cadence Tensilica Vision C5 DSP再一次被该公司的产品市场负责人提起,他们向电子工程专辑强调,Vision C5 DSP不是一个普通的神经网络加速器,而是专门针对神经网络进行了特定优化的DSP,可以实现全神经网络层的计算加速(卷积层、全连接层、池化层和归一化层),而不仅仅是卷积层的加速。

之前电子工程专辑记者邵乐峰曾经撰写过C5 DSP的报道,“神经网络DSP市场凑齐一桌麻将,Cadence Tensilica一落座就准备听牌”,但是这家公司的外国市场部的同事在看完文章后更糊涂了。“我们没有在打麻将,我们在认真做神经网络。”Pulin Desai,Cadence旗下Tensilica IVP事业部产品市场总监笑着回应了我们之前的报道。

这位印度裔的技术市场男显然没有搞懂我们中国记者同事的梗。麻将在美国越来越普遍,听说过麻将的美国人也非常多。但是他没能理解DSP跟麻将之间有什么关系。

20170626-cadence-1
图:Cadence旗下Tensilica IVP事业部产品市场总监Pulin Desai在硅谷总部介绍Vision DSP产品 P5、P6和C5 DSP。

Cadence Tensilica Vision C5 DSP,面向对神经网络计算能力有极高要求的视觉设备、雷达/光学雷达和融合传感器等应用量身优化。针对车载、监控安防、无人机和移动/可穿戴设备应用,Vision C5 DSP 1TMAC/s的计算能力完全能够胜任所有神经网络的计算任务。

Pulin Desai再次向电子工程专辑记者解释了Vision C5 DSP与神经网络加速器的区别。

神经网络DSP vs. 神经网络加速器*

20170626-cadence-2
图1:C5 DSP与神经网络加速器的区别

基于摄像头的视觉系统在汽车、无人机和安防领域最为常见,这种架构需要两种最基础的视觉优化计算模式。首先,利用传统视觉算法对摄像头捕捉到的照片或图像进行增强;其次,使用基于神经网络的认知算法对物体进行检测和识别。现有的神经网络加速器解决方案皆依赖与图像DSP连接的硬件加速器;神经网络代码被分为两部分,一部分网络层运行在DSP上,卷积层则运行在硬件加速器上。这种架构不但效率低下,且耗能较高。

Vision C5 DSP是专门针对神经网络进行了特定优化的DSP,可以实现全神经网络层的计算加速(卷积层、全连接层、池化层和归一化层),而不仅仅是卷积层的加速。因此,主视觉/图像DSP能力得以释放,独立运行图像增强应用,Vision C5 DSP则负责执行神经网络任务。通过移除神经网络DSP和主视觉/图像DSP之间的冗余数据传输,Vision C5 DSP的功耗远低于现有的神经网络加速器。同时,Vision C5 DSP还提供针对神经网络的单核编程模型。

为了让读者更快地明白这两者的区别,电子工程专辑记者还是打算再添几张PPT:
20170626-cadence-3
区别2:神经网络、加速器与神经网络DSP的区别

20170626-cadence-4
再附上一张Vision C5 DSP与目前商用的GPU的对比

20170626-cadence-5
图:Vision C5 DSP跟CPU、GPU、神经网络加速器在嵌入式系统中的应用场合对比

Pulin Desai总结:Vision C5 DSP是一款灵活前瞻的永不过时(future-proof)解决方案,支持各类内核尺寸、深度和输入规格。Vision C5 DSP采用多项系数压缩/解压技术,支持未来添加的新计算层。与之相反,CNN硬件加速器由于程序重编能力有限,扩展能力较差。

20170626-cadence-6

已经公布的Vision DSP 生态伙伴。不过小编没有看到有中国国内的公司。这也侧面说明中国的神经网络研究的步伐可能还有点落后吧。

最后附上Vision C5 DSP的参数与性能说明

依托独立引擎,Vision C5 DSP具备领先的神经网络性能:

• 不到1mm2的芯片面积可以实现1TMAC/秒的计算能力(吞吐量较Vision P6 DSP提高4倍),为深度学习内核提供极高的计算吞吐量

• 1024 8-bit MAC或512 16-bit MAC 确保8-bit 和16-bit精度的出色性能

• 128路8-bit SIMD或64路16-bit SIMD的VLIW SIMD架构

• 专为多核设计打造,以极少的资源代价获得NxTMAC的处理能力

• 内置iDMA和AXI4总线接口

• 使用与Vision P5和P6 DSP一致的经验证软件工具包

• 基于业界知名的AlexNet CNN Benchmark,Vision C5 DSP的计算速度较业界的GPU最快提高6倍;Inception V3 CNN benchmark,有9倍的性能提升。

Vision C5 DSP搭载Cadence神经网络Mapping工具链,可将Caffe和TensorFlow等映射为在Vision C5 DSP上高度优化过的可执行代码,充分发挥手动优化神经网络库的丰富功能。

本文为《电子工程专辑》原创,版权所有,转载请注明出处并附链接

EETC wechat barcode


关注最前沿的电子设计资讯,请关注“电子工程专辑微信公众号”。

本文为EET电子工程专辑 原创文章,禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
  • 路特斯的努力有多“韧性” 文|沪上阿YI路特斯如今处在一个什么样的地位?吉利控股集团高级副总裁、路特斯集团首席执行官冯擎峰一直有着清晰的认知:“这个品牌的挑战依然非常大。首先,整个中国市场豪华汽车整体数据下滑了30%~40%,
  • 又一芯片大厂终止研发! ‍‍Mobileye 将终止内部激光雷达开发Mobileye 宣布终止用于自动驾驶的激光雷达的开发,并裁员 100 人。Mobileye 认为,下一代 FMCW 激光雷达对可脱眼的自动驾驶来说必要性没
  • 银河E5和小鹏MONAM03开门红,纯电车或将卷土重来? 文|萝吉今年下半年开始,国内新能源市场正式跨过50%历史性节点,且份额依然在快速增长——7月渗透率破50%,8月份破55%……在这一片勃勃生机万物竞发的景象下,新能源市场占比最高的纯电车型,却在下半年
  • 2.4亿美元!“果链”捷普科技在印度设厂! 周二,捷普科技(Jabil)官员与印度泰米尔纳德邦代表团在泰米尔纳德邦首席部长MK Stalin的见证下,签署了一份备忘录。MK Stalin正在美国进行为期17天的访问,旨在吸引新的投资。MK St
  • 大力拓展半导体行业-节卡复合机器人有何优势? 会议预告向世界展示中国最具创新力、领导力和品牌化的产品与技术!9月27号,“第6届国际移动机器人集成应用大会暨复合机器人峰会”将在上海举行,敬请关注!逐个击破现有痛难点。文|新战略半导体行业高标准、灵
  • 【光电通信】特种光纤与光纤通信-236页收藏  今日光电      有人说,20世纪是电的世纪,21世纪是光的世纪;知光解电,再小的个体都可以被赋能。追光逐电,光赢未来...欢迎来到今日光电!----追光逐电 光赢未来----来源:通信大讲堂申明
  • 该国产SiC将上主驱,还有20家企业取得进展... 近日,又一国产SiC企业宣布实现了主驱突破,并将出口海外。据“行家说三代半”的追踪统计,自2022年起,国内主驱级SiC器件/模块开始在多款车型中得到应用,尤其是2024年,本土供应商的市场份额显著上
  • 60%汽车供应商裁员! 疫情后的劳动力囤积和强有力的员工保护规则掩盖了德国高薪制造业工作市场令人担忧的变化。根据联邦劳工办公室的数据,欧元区最大经济体德国的失业率在2019年春季曾达到历史最低点4.9%,现已上升至6%。虽然
  • 骄成超声:引领超声波技术革新,助力碳化硅产业升级 8月28-30日,PCIM Asia 2024展在深圳举行。“行家说”进行了为期2天的探馆,合计报道了200+碳化硅相关参展企业(.点这里.)。其中,“行家说”还重点采访了骄成超声等十余家企业,深入了
  • 活动邀请|华强电子产业研究所诚邀您莅临2024深圳跨境电商展览会 展位信息深圳跨境电商展览会(CCBEC)时间:2024年9月11-13日 9:30-17:30地点:深圳国际会展中心(宝安)展馆:16号馆 16D73/16D75 展位报名注册准备好“观众注册”入场二
广告
热门推荐
广告
广告
广告
EE直播间
在线研讨会
广告
广告
广告
向右滑动:上一篇 向左滑动:下一篇 我知道了