怎样选择一款好的终端AI芯片?是谁的算力强谁就牛吗?非也……算力的提升可以简单通过MAC数的堆积和工艺的提升来达到,然而付出的代价则是芯片面积和功耗的提升,以及成本的增加。而一颗成功的终端AI芯片,应该具有以下特征……

近年随着人工智能(AI)技术的兴起,各路势力开始纷纷布局相关产品及应用,AI芯片产业也从野蛮生长,进入大浪淘沙阶段。产品落地、商业应用等实际成果成为衡量企业竞争力的标尺,新产品发布、合作签约、样板案例成为业界关注的焦点。

怎样选择一款好的终端AI芯片?是谁的算力强谁就牛吗?

“算力的提升可以简单通过MAC数的堆积和工艺的提升来达到,然而付出的代价则是芯片面积和功耗的提升,以及成本的增加。” 在5月15日耐能(Kneron)的夏季媒体沟通会上,耐能创始人兼CEO刘峻诚博士向大家普及了一些终端AI芯片选择的小知识,“一颗成功的终端AI芯片应该具有足够的算力,最有竞争力的成本,最高的兼容性以及最低的功耗。换句话说,就是用刚刚好的算力,满足相应的需求,并且成本低到能够迅速普及。”
20190515-kneron-1.jpg
刘峻诚发布耐能KL520智能物联网专用AI SoC

本次沟通会耐能宣布从提供IP转向量产芯片,并正式发布其首款智能物联网专用AI SoC——KL520。耐能一直以实现终端AI网络(Edge AI Net)为其愿景,相较于传统云端AI的终端“采集数据——100%上传服务器处理——反馈回终端”的复杂流程,终端AI具有保护用户的隐私/机密,实时反馈,降低网络带宽压力,总成本低等优势——“能解决的当场就给办了”。
耐能KL520智能物联网专用AI SoC机器开发板.jpg
耐能KL520智能物联网专用AI SoC及其开发板

来到发布会现场的还有美国高通公司风险投资总监毛嵩、大唐半导体研发部技术总监母大学、奥比中光高级战略BD总监彭勋禄、蓦然认知创始人兼CEO戴帅湘。几位也从投资人、方案商、终端应用等产业链不同位置的角度,介绍了他们选择AI芯片的标准,以及与耐能的合作进展。

做芯片如搭乐高,“我们是世界一流的”

其实早在CES 2019期间,耐能就宣布将于第二季度推出首款面向智能物联网市场的AI SoC。4个月后的,这款AI芯片终于亮相。

刘峻诚表示,KL520支持的ONNX、Tensorflow、Keras、Caffe框架,几乎覆盖了95%以上的AI软件开发者需求。采用Vgg16、Resnet、GoogleNet、YOLO等主流的CNN模型,压缩精度损失<0.5%,目前主要应用在人脸识别、物品识别、身体与手势识别、3D传感上。

20190516-kneron-1.png

而相比传统的微处理器和DSP方式实现AI,KL520采用的ASIC NPU方式更加有效和灵活,能效比提升达100x。

“和传统ASIC最大的不同,就是我们的NPU是可重构的,就像是乐高积木。”刘峻诚这样形容KL520的特性,“一些体量比较小的客户可能有自己的需求,比如你要它做语音识别的用途,就把语音的积木搭上去,要做人脸识别,就把人脸识别的积木搭上去。所有积木都可以打散后重新按需求搭建,当然如果大客户不想二次开发,我们也可以全部做好,然后像交钥匙(Turn-key)一样批量出货。”

随后,刘峻诚放出了耐能KL520智能物联网专用AI SoC的架构图与详细参数。
耐能KL520架构图.jpg
耐能KL520架构图
 

产品型号

KL520

神经网络处理器

最高频率300Mhz

8-bit模式峰值速率:345 GOPS, 576MAC/cycle

中央处理器

ARM Cortex-M4@200MHz做系统控制

ARM Cortex-M4@250MHzAI协处理器

SDRAM

系统级封装, 32MB64MB, 16-bit LPDDR2-1066

外部闪存

高达64MB SPI NOR flash

支持操作系统

CMSIS RTX

功耗

典型功耗500毫瓦

1.1V 核心电压

3.3, 1.8V 输入输出电压

制程工艺

40纳米低功耗

视频输入接口

2-Lane MIPI-CSI-2 RX

DVP

视频输出接口

2-Lane MIPI-CSI-2 TX

MIPI-DSI TX

DVP

LCM

音频接口

I2S 接口连接外部音频解码器

外围接口

I2C

SPI

UART

USB 2.0 host/device 接口

PWM

GPIO

SDIO

现场几位还同时对这款芯片的一个主要特性点赞,就是低功耗和小体积,算力345GOPS (300MHz) ,平均功耗500mW。但从算力来看其实不高,但能效比相对友商产品提升了3-4倍。这得益于KL520极高的MAC利用率, ResNet50 73%,GoogLeNet 74%,比竞品分别高出3.15倍和1.71倍,这对于当今AI应用能效比普遍偏高的病症,“疗效”是非常好滴。

刘峻诚表示,“我们找了市面上所能买到的AI芯片进行对比,目前(MAC利用率)还没有能达到25%以上的,我们应该是目前世界上一流的。

20190516-kneron-2.png
此外,KL520可以作为协处理器,分担主芯片的AI算力,无需更换主芯片从而保留软硬件资产。针对智能门锁等轻量级应用,更是可以凭借内置Cortex-M4 CPU,还可直接替代主控芯片。至于为什么选择M4的核,刘峻诚笑道:“我们也是被客户逼的,因为一颗SoC中的CPU其实是最吃成本的,客户要求总价更低,所以不能选太好的CPU。于是我们把NPU做到了超强,强到用什么CPU已经不重要了。”

智能门锁最爱什么样的芯片?

随着消费习惯逐渐养成,以及渗透率的不断提高,智能门锁行业将进入快速发展期。大唐半导体研发部技术总监母大学表示,大唐一直希望打造安全、低功耗的3D人脸识别智能门锁解决方案,不过智能门锁产业存在日益凸显的安全问题,以及面临“智能门锁+AI”“智能门锁+安全”等趋势,所以他们非常期待这样一颗能解决安全、能耗问题的AI芯片出现。
20190515-kneron-2.jpg
智能门锁市场增长迅速

母大学指出,耐能3D方案在其AI芯片支持下,不仅利用了人脸识别、人脸比对、活体检测等红外人脸信息,而且通过红外相机和彩色相机得到的特征点视差计算出人脸的3D信息,然后将得到人脸3D信息和人脸2D红外图像信息、RGB图像信息通过耐能融合算法与原始数据进行匹配,结果都和录入数据匹配才算认证成功,安全性得到极大的提升,误识率仅为数十万分之一。同时,对包括室内室外的光线环境均能很好适应,也能有效地防止多种材质的相片、显示屏甚至人脸模型的攻击。

20190516-kneron-4.jpg

2D人脸识别方案能够轻易被照片骗过,所以需要用户做转头、张嘴、眨眼等动作,而3D方案则不存在被平面照片欺骗的风险。

解决3D传感行业痛点

奥比中光高级战略BD总监彭勋禄介绍道,3D成像三大技术是结构光、ToF和双目测距,三种技术各有特点。我们现在看到的绝大部分图像,视频都是通过2D摄像头平面成像,无法识别物理世界中的三维信息(如:尺寸,体积,距离等几何数据)。2D图像人脸识别存在体验性、可靠性、局限性和安全性等问题,而3D摄像头立体成像,能够识别视野内空间每个点位的三维座标信息,从而使得计算机得到空间的3D数据并能够复原完整的三维图像。
20190516-kneron-3.png

不过3D传感行业有一些“祖传”的痛点,包括3D摄像头模组成本高,芯片成本高,硬件功耗高等“三高”问题。即便是国际上少数几个掌握3D传感绝大部分核技术、我国唯一能同苹果、微软、英特尔等国际巨头抗衡的奥比中光,也面临着这些问题。

对此刘峻诚表示:“如果传统3D传感模组的芯片,从GPU/DSP切换到耐能的KL520,可以实现芯片成本的降低;而采用耐能轻量级3D传感方案,将ToF/结构光/双目的方式变为普通RGB和普通NIR,则可从模组级别上做到成本的降低。这种属于从源头上就把成本给降下来了。”

产品路线图公布

此次媒体沟通会也揭开了耐能的AI芯片产品路线图。刘峻诚透露,2019年第四季度,耐能将发布更高规格的第二款AI SoC——KL720。而2020年,“3代”的KL330、KL530和KL730系列也将相继推出,其中KL530将采用28nm工艺、KL730的工艺则为16nm。
耐能AI芯片产品路线图.jpg
耐能AI芯片产品路线图

从一家做算法的IP公司,跨足到芯片行业,其实是很有挑战的。AI有三样东西最关键,算力(硬件芯片)、算法和数据,相对于算法来说,芯片的门槛更高。我们曾经看过无数的好技术,因为没有落地场景,或是场景被其他技术抢占先机,就此消亡。这次耐能带着AI落地和芯片赚钱的决心切入市场,他们未来的表现如何,让我们拭目以待。

相关阅读:

能落地才是好AI!轻量级人工智能登场

对话耐能刘峻诚:全球化AI芯片公司在中国的成长与未来

利用本性、借力培育打造令人惊叹的AI SoC 

 

本文为EET电子工程专辑原创文章,禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
阅读全文,请先
您可能感兴趣
大多数研发人员和导热界面材料配方设计师可能会推荐使用具备诸多优异特性的硅。然而,也存在一些例外情况。这些问题强调了在选择导热界面材料时考虑终端产品最终应用的重要性.....
在与芯科科技(Silicon Labs)首席技术官Daniel Cooley的交谈中,我们了解到该公司在物联网(IoT)和智能边缘领域所发挥的作用和未来发展。
虽然绕过产品防伪保护的手段变得越来越高级,但是最新的 NFC 芯片技术提高了信息安全性,让品牌能够保护知识产权,预防客户误买假冒商品。
西门子推出Simcenter更新版本,助力客户简化工作流程,加快航空航天认证,同时提供深入洞见
现货促销让采购/更简单/更高效为了更好地帮助大家采购芯片,实现供需资源的无缝对接。AMEYA360决定开启【现货促销】专栏,通过AMEYA360微信公众号,每天推送原厂现货促销物料,助力广大用户制定更
一凡 铁鹰发自 智车入库 | 公众号 AI4Auto2025,智能驾驶怎么卷、卷什么?那要结合现在的能力和体验来看。2024年,「全国都能开」成为新的第一梯队门票,但很快不再「领先一代」。两个「端到端
本文来源:智能通信定位圈《2025中国高精度定位技术产业白皮书》正在调研阶段,目前已经参与调研的企业有:长沙驰芯半导体科技有限公司北京瀚巍创芯电子技术有限公司深圳捷扬微电子有限公司深圳芯邦科技股份有限
    三极管的电流放大作用应该算是模拟电路里面的一个难点内容,我想用这几个动画简单的解释下为什么小电流Ib能控制大电流Ic的大小,以及放大电路的原理。    我这里的三极管也叫双极型晶体管,模电的放
文|温风2024是所有豪华品牌都不好过的一年。中国市场豪华品牌在参与价格战和不参与价格战中反复横跳,也牵动着跨国品牌全球市场的销量和财报数字。想在全球豪华市场榜单脱颖而出,就必须在销量占全球近1/3,
1月20日,市场调查机构 CounterPoint Research发布的报告显示,2024 全年 PC 出货量达到 2.53 亿台,同比增长 2.6%,PC 市场已恢复到正常季节性波动,并随着 AI
刚进入2025年,汽车电驱行业又有2个项目宣布投产:● 上汽通用五菱:青岛电驱项目正式落地投产,年产能30万台;● 菲仕科技:赣州电驱项目投产,年产能12万台,供应小鹏汽车。五菱电驱项目投产年产能30
1月20日晚,联创电子科技股份有限公司(以下简称“联创电子”)发布了其2024年度业绩预告。           数据显示,联创电子预计2024年实现营业收入92.7亿元至103亿元,同比变化区间为-
一凡 发自 副驾寺智能车参考 | 公众号 AI4Auto给Cybercab装上方向盘,不就是Model Q?网友们的设想和期盼,似乎成真了,就在最近,有博主拍到特斯拉Cybercab居然有方向盘了,引
近日,纳芯微宣布推出全新基于AMR(各向异性磁阻技术)的轮速传感器NSM41xx系列。该系列产品通过集成先进的磁性传感敏感单元与ASIC技术,能够精准监测车轮转速,为防抱死制动系统(ABS)、车身电子