近年随着人工智能(AI)技术的兴起,各路势力开始纷纷布局相关产品及应用,AI芯片产业也从野蛮生长,进入大浪淘沙阶段。产品落地、商业应用等实际成果成为衡量企业竞争力的标尺,新产品发布、合作签约、样板案例成为业界关注的焦点。
怎样选择一款好的终端AI芯片?是谁的算力强谁就牛吗?
“算力的提升可以简单通过MAC数的堆积和工艺的提升来达到,然而付出的代价则是芯片面积和功耗的提升,以及成本的增加。” 在5月15日耐能(Kneron)的夏季媒体沟通会上,耐能创始人兼CEO刘峻诚博士向大家普及了一些终端AI芯片选择的小知识,“一颗成功的终端AI芯片应该具有足够的算力,最有竞争力的成本,最高的兼容性以及最低的功耗。换句话说,就是用刚刚好的算力,满足相应的需求,并且成本低到能够迅速普及。”
刘峻诚发布耐能KL520智能物联网专用AI SoC
本次沟通会耐能宣布从提供IP转向量产芯片,并正式发布其首款智能物联网专用AI SoC——KL520。耐能一直以实现终端AI网络(Edge AI Net)为其愿景,相较于传统云端AI的终端“采集数据——100%上传服务器处理——反馈回终端”的复杂流程,终端AI具有保护用户的隐私/机密,实时反馈,降低网络带宽压力,总成本低等优势——“能解决的当场就给办了”。
耐能KL520智能物联网专用AI SoC及其开发板
来到发布会现场的还有美国高通公司风险投资总监毛嵩、大唐半导体研发部技术总监母大学、奥比中光高级战略BD总监彭勋禄、蓦然认知创始人兼CEO戴帅湘。几位也从投资人、方案商、终端应用等产业链不同位置的角度,介绍了他们选择AI芯片的标准,以及与耐能的合作进展。
做芯片如搭乐高,“我们是世界一流的”
其实早在CES 2019期间,耐能就宣布将于第二季度推出首款面向智能物联网市场的AI SoC。4个月后的,这款AI芯片终于亮相。
刘峻诚表示,KL520支持的ONNX、Tensorflow、Keras、Caffe框架,几乎覆盖了95%以上的AI软件开发者需求。采用Vgg16、Resnet、GoogleNet、YOLO等主流的CNN模型,压缩精度损失<0.5%,目前主要应用在人脸识别、物品识别、身体与手势识别、3D传感上。
而相比传统的微处理器和DSP方式实现AI,KL520采用的ASIC NPU方式更加有效和灵活,能效比提升达100x。
“和传统ASIC最大的不同,就是我们的NPU是可重构的,就像是乐高积木。”刘峻诚这样形容KL520的特性,“一些体量比较小的客户可能有自己的需求,比如你要它做语音识别的用途,就把语音的积木搭上去,要做人脸识别,就把人脸识别的积木搭上去。所有积木都可以打散后重新按需求搭建,当然如果大客户不想二次开发,我们也可以全部做好,然后像交钥匙(Turn-key)一样批量出货。”
随后,刘峻诚放出了耐能KL520智能物联网专用AI SoC的架构图与详细参数。
耐能KL520架构图
产品型号 |
KL520 |
神经网络处理器 |
最高频率300Mhz 8-bit模式峰值速率:345 GOPS, 576MAC/cycle |
中央处理器 |
ARM Cortex-M4@200MHz做系统控制 ARM Cortex-M4@250MHz作AI协处理器 |
SDRAM |
系统级封装, 32MB或64MB, 16-bit LPDDR2-1066 |
外部闪存 |
高达64MB SPI NOR flash |
支持操作系统 |
CMSIS RTX |
功耗 |
典型功耗500毫瓦 1.1V 核心电压 3.3, 1.8V 输入输出电压 |
制程工艺 |
40纳米低功耗 |
视频输入接口 |
2-Lane MIPI-CSI-2 RX DVP |
视频输出接口 |
2-Lane MIPI-CSI-2 TX MIPI-DSI TX DVP LCM |
音频接口 |
I2S 接口连接外部音频解码器 |
外围接口 |
I2C SPI UART USB 2.0 host/device 接口 PWM GPIO SDIO |
现场几位还同时对这款芯片的一个主要特性点赞,就是低功耗和小体积,算力345GOPS (300MHz) ,平均功耗500mW。但从算力来看其实不高,但能效比相对友商产品提升了3-4倍。这得益于KL520极高的MAC利用率, ResNet50 73%,GoogLeNet 74%,比竞品分别高出3.15倍和1.71倍,这对于当今AI应用能效比普遍偏高的病症,“疗效”是非常好滴。
刘峻诚表示,“我们找了市面上所能买到的AI芯片进行对比,目前(MAC利用率)还没有能达到25%以上的,我们应该是目前世界上一流的。”
此外,KL520可以作为协处理器,分担主芯片的AI算力,无需更换主芯片从而保留软硬件资产。针对智能门锁等轻量级应用,更是可以凭借内置Cortex-M4 CPU,还可直接替代主控芯片。至于为什么选择M4的核,刘峻诚笑道:“我们也是被客户逼的,因为一颗SoC中的CPU其实是最吃成本的,客户要求总价更低,所以不能选太好的CPU。于是我们把NPU做到了超强,强到用什么CPU已经不重要了。”
智能门锁最爱什么样的芯片?
随着消费习惯逐渐养成,以及渗透率的不断提高,智能门锁行业将进入快速发展期。大唐半导体研发部技术总监母大学表示,大唐一直希望打造安全、低功耗的3D人脸识别智能门锁解决方案,不过智能门锁产业存在日益凸显的安全问题,以及面临“智能门锁+AI”“智能门锁+安全”等趋势,所以他们非常期待这样一颗能解决安全、能耗问题的AI芯片出现。
智能门锁市场增长迅速
母大学指出,耐能3D方案在其AI芯片支持下,不仅利用了人脸识别、人脸比对、活体检测等红外人脸信息,而且通过红外相机和彩色相机得到的特征点视差计算出人脸的3D信息,然后将得到人脸3D信息和人脸2D红外图像信息、RGB图像信息通过耐能融合算法与原始数据进行匹配,结果都和录入数据匹配才算认证成功,安全性得到极大的提升,误识率仅为数十万分之一。同时,对包括室内室外的光线环境均能很好适应,也能有效地防止多种材质的相片、显示屏甚至人脸模型的攻击。
2D人脸识别方案能够轻易被照片骗过,所以需要用户做转头、张嘴、眨眼等动作,而3D方案则不存在被平面照片欺骗的风险。
解决3D传感行业痛点
奥比中光高级战略BD总监彭勋禄介绍道,3D成像三大技术是结构光、ToF和双目测距,三种技术各有特点。我们现在看到的绝大部分图像,视频都是通过2D摄像头平面成像,无法识别物理世界中的三维信息(如:尺寸,体积,距离等几何数据)。2D图像人脸识别存在体验性、可靠性、局限性和安全性等问题,而3D摄像头立体成像,能够识别视野内空间每个点位的三维座标信息,从而使得计算机得到空间的3D数据并能够复原完整的三维图像。
不过3D传感行业有一些“祖传”的痛点,包括3D摄像头模组成本高,芯片成本高,硬件功耗高等“三高”问题。即便是国际上少数几个掌握3D传感绝大部分核技术、我国唯一能同苹果、微软、英特尔等国际巨头抗衡的奥比中光,也面临着这些问题。
对此刘峻诚表示:“如果传统3D传感模组的芯片,从GPU/DSP切换到耐能的KL520,可以实现芯片成本的降低;而采用耐能轻量级3D传感方案,将ToF/结构光/双目的方式变为普通RGB和普通NIR,则可从模组级别上做到成本的降低。这种属于从源头上就把成本给降下来了。”
产品路线图公布
此次媒体沟通会也揭开了耐能的AI芯片产品路线图。刘峻诚透露,2019年第四季度,耐能将发布更高规格的第二款AI SoC——KL720。而2020年,“3代”的KL330、KL530和KL730系列也将相继推出,其中KL530将采用28nm工艺、KL730的工艺则为16nm。
耐能AI芯片产品路线图
从一家做算法的IP公司,跨足到芯片行业,其实是很有挑战的。AI有三样东西最关键,算力(硬件芯片)、算法和数据,相对于算法来说,芯片的门槛更高。我们曾经看过无数的好技术,因为没有落地场景,或是场景被其他技术抢占先机,就此消亡。这次耐能带着AI落地和芯片赚钱的决心切入市场,他们未来的表现如何,让我们拭目以待。
相关阅读: