人工智能(AI)在自动驾驶、物联网和机器人技术中的应用离不开数据处理。目前终端设备需要将采集的大量数据,包括图像、视频、音频等,通过网络传输至数据中心进行AI相关的处理,然后再将结果返回至终端设备。这就带来了网络带宽、数据传输稳定性及安全性等问题。

人工智能(AI)在自动驾驶、物联网和机器人技术中的应用离不开数据处理。目前终端设备需要将采集的大量数据,包括图像、视频、音频等,通过网络传输至数据中心进行AI相关的处理,然后再将结果返回至终端设备。这就带来了网络带宽、数据传输稳定性及安全性等问题。

因此,AI从云端走向边缘终端设备是大势所趋,AI边缘推理芯片应运而生。

Intel、Google、Nvidia及Flex Logix边缘推理芯片

目前的AI边缘推理芯片有Intel的Myriad、Google的Edge TPU、Nvidia的Jetson Nano及Flex Logix的InferX X1等。

(图片来源:Flex Logix)

20190415flex2.jpg

(图片来源:Flex Logix)

Flex Logix的InferXtm X1边缘推理芯片是在业界领先的eFPGA互连技术上,结合专为AI推理运算而优化的nnMAXtm乘加器(MAC)而开发。

Flex Logix公司称,在通常只有一个摄像头或传感器、需要完成小批量数据处理的边缘应用中,InferX X1的性能接近数据中心推理芯片,并且只需一个DRAM即可在边缘应用中提供高吞吐量,同时保持系统功耗和成本。

“设计边缘神经网络推理芯片的一个难题是如何降低大量的数据交换及降低功耗,而我们的可编程互连技术是接近完美的解决方案。”Flex Logix公司CEO Geoff Tate说。

Tate表示,InferX X1基于低DRAM带宽,与高端数据中心服务器的黄金标准Nvidia的Tesla T4相比,每瓦吞吐量提高了四倍,每美元吞吐量提高了三倍。

Tate提到,InferX在YoloV2,YoloV3和GoogleNet等推理基准方面优于其它供应商的边缘推理芯片,如Intel的Myriad X和Nvidia的Jetson Nano。

20190415flex3.jpg
图:InferX X1与Nvidia Tesla T4的价格/性能比和性能/瓦特比。(图片来源:Flex Logix)

Tate强调InferX虽然不具Tesla T4的吞吐量,但其最终售价将仅为T4价格的几分之一。

“我们的InferX X1 AI边缘推理芯片专注于AI推理,而Intel及Nvidia等边缘推理产品除了推理还提供AI训练,因此可以说Flex Logix的边缘推理芯片做得更专更精。”Flex Logix的销售总监Jim Jian在接受《电子工程专辑》记者的采访时谈到。

Jim还特别提到,目前几乎没有哪个边缘推理产品的供应商公布其产品的Benchmark,“我们决定将InferX X1的Benchmark公之于众,方便客户在不同的供应商之间进行比较和选择。”显示出Flex Logix对InferX X1 AI边缘推理芯片的信心。

20190415flex4.jpg
(图片来源:Flex Logix)

高算力,低成本,InferX X1是怎样做到的?

InferX AI芯片的核心技术源自Flex Logix拥有专利的现有eFPGA IP里的可编程互连技术,同时结合专为AI推理而设计的乘加器(MAC)和存储单元。这些乘加器支持INT8、INT16、BF16等AI算法里常见的精度数字。

20190415flex5.jpg

(图片来源:Flex Logix)

“在运算一层网络的时候,我们利用可编程互连将InferX的MAC根据这一层网络的dataflow来连接,等于是专为这一层运算配置了一个ASIC。同时对下一层网络进行pre-load,以实现在这一层运算完后可以最快速地配置下一层。同样的可编程互连也与片上的SRAM连接,将这一层的输出,快速配置成下一层的输入,从而避免了大量的数据交换。所以InferX只需要一颗x32 DRAM就够了。这让我们可以将芯片设计得更小,大大降低了功耗和成本。”Flex Logix公司CEO Geoff Tate指出。

InferX X1芯片可以通过扩展口来连接数个芯片以增加算力。Flex Logix同时还提供搭载InferX X1的半高半长PCIe卡给Edge Server和gateway客户。

20190415flex6.jpg
(图片来源:Flex Logix)

正是因为应用了核心的可编程互连技术,并在InferX芯片产品中引入其它新技术,才使得InferX X1能在提供高算力的同时提供低功耗和低成本,并且适用于任何神经网络。

InferX X1应用在哪些领域?

InferX X1是专为边缘推理应用而设计的,适用于边缘终端设备,特别是需要实时处理数据的设备和应用,例如L3~L5的汽车自动驾驶、视频监控和识别、自然语音处理等。除此之外,还可用于机器人、无人机、医疗设备,甚至云端的推理服务器。

20190415flex7.jpg
(图片来源:Flex Logix)

InferX X1可以支持语音,图像,视频等任何基于TensorFlow-Lite或ONNX的模型和算法,特别适用于大型的模型算法和实时识别。例如YOLOv3实时物体识别算法,InferX X1在batch=1的情况下,可以对1Megapixel图像达到25.4帧每秒(fps)的吞吐量,而对2Megapixel高清图像则达到12.7帧每秒(fps)。

工程师在使用InferX X1时应当注意什么?

当《电子工程专辑》记者问到工程师在使用InferX X1时应当特别注意什么时,Jim Jian说,Flex Logix的eFPGA的用户主要是设计芯片的硬件工程师,而InferX X1芯片用于AI推理,所以客户主要是算法工程师。算法工程师不需要了解芯片内部的结构及运行,他们关注的是自己的神经网络模型在InferX X1芯片上是否能够达到所需的性能。

所以,这些算法工程师在设计拥有推理功能的边缘终端设备或系统时,首先要确认推理计算的芯片是否能提供足够的算力来达到自己算法需要的精度和吞吐量,同时还需要考虑设备对功耗的限制,以及对成本的要求。

20190415flex8.jpg
(图片来源:Flex Logix)

Flex Logix向客户提供编译器软件nnMAX Compiler,客户可以将基于TensorFlow-Lite或ONNX的算法直接用nnMAX Compiler软件编译。因此,设计一开始客户就能了解自己的算法在InferX芯片上运行的性能和功耗等数据,从而迅速评估并优化自己的设计。

相关阅读利用本性、借力培育打造令人惊叹的AI SoC

  

本文为EET电子工程专辑原创文章,禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
  • 你最棒
阅读全文,请先
您可能感兴趣
面对AI时代带来的差异化趋势、软件应用及开发时间长、软硬件协同难、高复杂度高成本等挑战,国产EDA仍需不断探索和创新。
通过机器学习技术,EDA工具可以获取更精确的模型来预测设计中存在的问题,如布线拥塞、信号干扰、热效应等,从而为用户提供更准确快速的指导,避免后期返工。
该小组汇集了国内外领先的芯片及IP、嵌入式开发工具、操作系统等厂商,形成强有力的组织,使命是通过一站式功能安全认证服务,帮助企业提升认证价值,满足IEC 61508、ISO 26262等国际功能安全认证标准,从而更高效地达成功能安全要求。
在ICCAD 2024主峰会上,中国半导体行业协会集成电路设计分会理事长魏少军教授带来“中国芯片设计业要自强不息”主题报告演讲,深入解读了过去一年中国IC设计业的发展机遇与挑战,权威分析中国IC设计业各环节的主要数据及其背后的意义。
近日,华为终端BG CEO何刚在和紫牛基金创始合伙人张泉灵的对话中表示,华为Mate 70系列每一颗芯片都有国产的能力。此外,日前在深圳宝安中学的一场讲座中,华为终端BG 董事长余承东也自豪地宣布Mate70实现了芯片的100%国产化。
美国商务部工业与安全局(BIS)宣布了对华半导体出口管制措施的新规,140家中国公司被新增到“实体清单”中,这些公司涉及半导体生产设备制造商、晶圆厂和投资机构。
目前,智能终端NFC功能的使用频率越来越高,面对新场景新需求,ITMA多家成员单位一起联合推动iTAP(智能无感接近式协议)标准化项目,预计25年上半年发布1.0标准,通过功能测试、兼容性测试,确保新技术产业应用。
中科院微电子所集成电路制造技术重点实验室刘明院士团队提出了一种基于记忆交叉阵列的符号知识表示解决方案,首次实验演示并验证了忆阻神经-模糊硬件系统在无监督、有监督和迁移学习任务中的应用……
C&K Switches EITS系列直角照明轻触开关提供表面贴装 PIP 端子和标准通孔配置,为电信、数据中心和专业音频/视频设备等广泛应用提供创新的多功能解决方案。
投身国产浪潮向上而行,英韧科技再获“中国芯”认可
来源:苏州工业园区12月17日,江苏路芯半导体技术有限公司掩膜版生产项目迎来重要进展——首批工艺设备机台成功搬入。路芯半导体自2023年成立以来,专注于半导体掩膜版的研发与生产,掌握130nm至28n
投资界传奇人物沃伦·巴菲特,一位94岁的亿万富翁,最近公开了他的遗嘱。其中透露了一个惊人的决定:他计划将自己99.5%的巨额财富捐赠给慈善机构,而只将0.5%留给自己的子女。这引起了大众对于巴菲特家庭
‍‍12月18日,深圳雷曼光电科技股份有限公司(下称“雷曼光电”)与成都辰显光电有限公司(下称“辰显光电”)在成都正式签署战略合作协议。双方将充分发挥各自在技术创新、产品研发等方面的优势,共同推进Mi
“ 洞悉AI,未来触手可及。”整理 | 美股研究社在这个快速变化的时代,人工智能技术正以前所未有的速度发展,带来了广泛的机会。《AI日报》致力于挖掘和分析最新的AI概念股公司和市场趋势,为您提供深度的
万物互联的时代浪潮中,以OLED为代表的新型显示技术,已成为人机交互、智能联结的重要端口。维信诺作为中国OLED赛道的先行者和引领者,凭借自主创新,实现了我国OLED技术的自立自强,成为中国新型显示产
2024年度PlayStation游戏奖今日公布,《宇宙机器人》获得年度最佳PS5游戏,《使命召唤:黑色行动6》获得年度最佳PS4游戏。在这次评选中,《宇宙机器人》获得多个奖项,包括最佳艺术指导奖、最
阿里资产显示,随着深圳柔宇显示技术有限公司(下称:“柔宇显示”)旗下资产一拍以流拍告终,二拍将于12月24日开拍,起拍价为9.8亿元。拍卖标的包括位于深圳市龙岗区的12套不动产和一批设备类资产,其中不
在上海嘉定叶城路1688号的极越办公楼里,最显眼的位置上,写着一句话:“中国智能汽车史上,必将拥有每个极越人的名字。”本以为这句话是公司的企业愿景,未曾想这原来是命运的嘲弄。毕竟,极越用一种极其荒唐的
今天上午,联发科宣布新一代天玑芯片即将震撼登场,新品会在12月23日15点正式发布。据悉,这场发布会联发科将推出全新的天玑8400处理器,这颗芯片基于台积电4nm制程打造,采用Arm Cortex A
极越汽车闪崩,留下一地鸡毛,苦的是供应商和车主。很多人都在关心,下一个倒下的新能源汽车品牌,会是谁?我们都没有未卜先知的超能力,但可以借助数据管中窥豹。近日,有媒体统计了15家造车新势力的销量、盈亏情