选AI芯片也有诀窍？别看算力，看“疗效”-电子工程专辑



 0

 收藏

 分享

扫码分享到微信好友

 海报

 扫一扫

扫码查看更多文章

怎样选择一款好的终端AI芯片？是谁的算力强谁就牛吗？非也……算力的提升可以简单通过MAC数的堆积和工艺的提升来达到，然而付出的代价则是芯片面积和功耗的提升，以及成本的增加。而一颗成功的终端AI芯片，应该具有以下特征……

近年随着人工智能（AI）技术的兴起，各路势力开始纷纷布局相关产品及应用，AI芯片产业也从野蛮生长，进入大浪淘沙阶段。产品落地、商业应用等实际成果成为衡量企业竞争力的标尺，新产品发布、合作签约、样板案例成为业界关注的焦点。

怎样选择一款好的终端AI芯片？是谁的算力强谁就牛吗？

“算力的提升可以简单通过MAC数的堆积和工艺的提升来达到，然而付出的代价则是芯片面积和功耗的提升，以及成本的增加。” 在5月15日耐能（Kneron）的夏季媒体沟通会上，耐能创始人兼CEO刘峻诚博士向大家普及了一些终端AI芯片选择的小知识，“一颗成功的终端AI芯片应该具有足够的算力，最有竞争力的成本，最高的兼容性以及最低的功耗。换句话说，就是用刚刚好的算力，满足相应的需求，并且成本低到能够迅速普及。”

刘峻诚发布耐能KL520智能物联网专用AI SoC

本次沟通会耐能宣布从提供IP转向量产芯片，并正式发布其首款智能物联网专用AI SoC——KL520。耐能一直以实现终端AI网络（Edge AI Net）为其愿景，相较于传统云端AI的终端“采集数据——100%上传服务器处理——反馈回终端”的复杂流程，终端AI具有保护用户的隐私/机密，实时反馈，降低网络带宽压力，总成本低等优势——“能解决的当场就给办了”。
耐能KL520智能物联网专用AI SoC机器开发板.jpg
耐能KL520智能物联网专用AI SoC及其开发板

来到发布会现场的还有美国高通公司风险投资总监毛嵩、大唐半导体研发部技术总监母大学、奥比中光高级战略BD总监彭勋禄、蓦然认知创始人兼CEO戴帅湘。几位也从投资人、方案商、终端应用等产业链不同位置的角度，介绍了他们选择AI芯片的标准，以及与耐能的合作进展。

做芯片如搭乐高，“我们是世界一流的”

其实早在CES 2019期间，耐能就宣布将于第二季度推出首款面向智能物联网市场的AI SoC。4个月后的，这款AI芯片终于亮相。

刘峻诚表示，KL520支持的ONNX、Tensorflow、Keras、Caffe框架，几乎覆盖了95%以上的AI软件开发者需求。采用Vgg16、Resnet、GoogleNet、YOLO等主流的CNN模型，压缩精度损失＜0.5%，目前主要应用在人脸识别、物品识别、身体与手势识别、3D传感上。

而相比传统的微处理器和DSP方式实现AI，KL520采用的ASIC NPU方式更加有效和灵活，能效比提升达100x。

“和传统ASIC最大的不同，就是我们的NPU是可重构的，就像是乐高积木。”刘峻诚这样形容KL520的特性，“一些体量比较小的客户可能有自己的需求，比如你要它做语音识别的用途，就把语音的积木搭上去，要做人脸识别，就把人脸识别的积木搭上去。所有积木都可以打散后重新按需求搭建，当然如果大客户不想二次开发，我们也可以全部做好，然后像交钥匙（Turn-key）一样批量出货。”

随后，刘峻诚放出了耐能KL520智能物联网专用AI SoC的架构图与详细参数。
耐能KL520架构图.jpg
耐能KL520架构图

产品型号	KL520
神经网络处理器	最高频率300Mhz 8-bit模式峰值速率：345 GOPS, 576MAC/cycle
中央处理器	ARM Cortex-M4@200MHz做系统控制 ARM Cortex-M4@250MHz作AI协处理器
SDRAM	系统级封装, 32MB或64MB, 16-bit LPDDR2-1066
外部闪存	高达64MB SPI NOR flash
支持操作系统	CMSIS RTX
功耗	典型功耗500毫瓦 1.1V 核心电压 3.3, 1.8V 输入输出电压
制程工艺	40纳米低功耗
视频输入接口	2-Lane MIPI-CSI-2 RX DVP
视频输出接口	2-Lane MIPI-CSI-2 TX MIPI-DSI TX DVP LCM
音频接口	I2S 接口连接外部音频解码器
外围接口	I2C SPI UART USB 2.0 host/device 接口 PWM GPIO SDIO

现场几位还同时对这款芯片的一个主要特性点赞，就是低功耗和小体积，算力345GOPS (300MHz) ，平均功耗500mW。但从算力来看其实不高，但能效比相对友商产品提升了3-4倍。这得益于KL520极高的MAC利用率， ResNet50 73%，GoogLeNet 74%，比竞品分别高出3.15倍和1.71倍，这对于当今AI应用能效比普遍偏高的病症，“疗效”是非常好滴。

刘峻诚表示，“我们找了市面上所能买到的AI芯片进行对比，目前（MAC利用率）还没有能达到25%以上的，我们应该是目前世界上一流的。”

此外，KL520可以作为协处理器，分担主芯片的AI算力，无需更换主芯片从而保留软硬件资产。针对智能门锁等轻量级应用，更是可以凭借内置Cortex-M4 CPU，还可直接替代主控芯片。至于为什么选择M4的核，刘峻诚笑道：“我们也是被客户逼的，因为一颗SoC中的CPU其实是最吃成本的，客户要求总价更低，所以不能选太好的CPU。于是我们把NPU做到了超强，强到用什么CPU已经不重要了。”

智能门锁最爱什么样的芯片？

随着消费习惯逐渐养成，以及渗透率的不断提高，智能门锁行业将进入快速发展期。大唐半导体研发部技术总监母大学表示，大唐一直希望打造安全、低功耗的3D人脸识别智能门锁解决方案，不过智能门锁产业存在日益凸显的安全问题，以及面临“智能门锁+AI”“智能门锁+安全”等趋势，所以他们非常期待这样一颗能解决安全、能耗问题的AI芯片出现。

智能门锁市场增长迅速

母大学指出，耐能3D方案在其AI芯片支持下，不仅利用了人脸识别、人脸比对、活体检测等红外人脸信息，而且通过红外相机和彩色相机得到的特征点视差计算出人脸的3D信息，然后将得到人脸3D信息和人脸2D红外图像信息、RGB图像信息通过耐能融合算法与原始数据进行匹配，结果都和录入数据匹配才算认证成功，安全性得到极大的提升，误识率仅为数十万分之一。同时，对包括室内室外的光线环境均能很好适应，也能有效地防止多种材质的相片、显示屏甚至人脸模型的攻击。

2D人脸识别方案能够轻易被照片骗过，所以需要用户做转头、张嘴、眨眼等动作，而3D方案则不存在被平面照片欺骗的风险。

解决3D传感行业痛点

奥比中光高级战略BD总监彭勋禄介绍道，3D成像三大技术是结构光、ToF和双目测距，三种技术各有特点。我们现在看到的绝大部分图像，视频都是通过2D摄像头平面成像，无法识别物理世界中的三维信息（如：尺寸，体积，距离等几何数据）。2D图像人脸识别存在体验性、可靠性、局限性和安全性等问题，而3D摄像头立体成像，能够识别视野内空间每个点位的三维座标信息，从而使得计算机得到空间的3D数据并能够复原完整的三维图像。

不过3D传感行业有一些“祖传”的痛点，包括3D摄像头模组成本高，芯片成本高，硬件功耗高等“三高”问题。即便是国际上少数几个掌握3D传感绝大部分核技术、我国唯一能同苹果、微软、英特尔等国际巨头抗衡的奥比中光，也面临着这些问题。

对此刘峻诚表示：“如果传统3D传感模组的芯片，从GPU/DSP切换到耐能的KL520，可以实现芯片成本的降低；而采用耐能轻量级3D传感方案，将ToF/结构光/双目的方式变为普通RGB和普通NIR，则可从模组级别上做到成本的降低。这种属于从源头上就把成本给降下来了。”

产品路线图公布

此次媒体沟通会也揭开了耐能的AI芯片产品路线图。刘峻诚透露，2019年第四季度，耐能将发布更高规格的第二款AI SoC——KL720。而2020年，“3代”的KL330、KL530和KL730系列也将相继推出，其中KL530将采用28nm工艺、KL730的工艺则为16nm。
耐能AI芯片产品路线图.jpg
耐能AI芯片产品路线图

从一家做算法的IP公司，跨足到芯片行业，其实是很有挑战的。AI有三样东西最关键，算力（硬件芯片）、算法和数据，相对于算法来说，芯片的门槛更高。我们曾经看过无数的好技术，因为没有落地场景，或是场景被其他技术抢占先机，就此消亡。这次耐能带着AI落地和芯片赚钱的决心切入市场，他们未来的表现如何，让我们拭目以待。

相关阅读：

能落地才是好AI！轻量级人工智能登场

对话耐能刘峻诚：全球化AI芯片公司在中国的成长与未来

利用本性、借力培育打造令人惊叹的AI SoC

本文为EET电子工程专辑原创文章，禁止转载。请尊重知识产权，违者本司保留追究责任的权利。

阅读全文，请先

选AI芯片也有诀窍？别看算力，看“疗效”

做芯片如搭乐高，“我们是世界一流的”

智能门锁最爱什么样的芯片？

解决3D传感行业痛点

产品路线图公布

相关阅读：

杂志声明