从全球AI测试榜单,谈平头哥玄铁CPU布局及RISC-V未来

智能计算芯世界 2022-04-18 00:00



4月7日,全球权威AI基准测试MLPerf发布最新榜单,在聚焦低功耗、高能效的IoT领域Tiny v0.7榜单中,基于平头哥玄铁RISC-V C906处理器的软硬件联合优化方案,取得了全部4个指标的第一,并且达到了其他竞品同类最优性能的10倍以上。这也意味着,玄铁RISC-V C906处理器成为了目前最高能效比的AIoT计算内核。


RISC-V合集:
2021年RISC-V行业概览
ARM系列处理器应用技术完全手册
CPU和GPU研究框架合集
面向AIoT的RISC-V原生操作系统研究
深度报告:RISC-V异构IoT全新架构
RISC-V芯片产业指令集架构研究
玄铁C910实现RISC-V用户自定义指令
面向AIoT的RISC-V原生操作系统研究

RISC-V手册开源指令集指南


在该测试结果公布的次日,芯智讯专访了阿里平头哥副总裁孟建熠,以及平头哥生态负责人杨静,希望为大家揭开平头哥玄铁RISC-V C906处理器此次在AI基准测试当中以绝对优势获得4项全球第一背后的秘密。同时,对于平头哥在RISC-V领域最新的技术及生态进展,以及对于RISC-V产业未来的发展,孟建熠与杨静也做了进一步的分享。


RISC-V架构的新机遇:CPU的高能效AI计算


众所周知,目前在CPU市场,英特尔的X86架构及Arm架构仍然是最为主流的指令集架构。其中,x86架构统治着PC及服务器市场,而Arm架构则完全占据了移动市场。不过,在IoT(物联网)市场,由于需求非常碎片化、对功耗、成本也更为敏感,目前不论是X86架构还是Arm架构的处理器,都难以很好的满足IoT市场各种定制化的需求。


相比之下,近几年来兴起的RISC-V架构,由于具有指令非常精简、模块化、可扩展、开源、免费等优点,使得它在IoT市场有着天然的优势,可以更容易地针对物联网市场开发出低功耗、高能效、低成本、满足各种定制化需求的处理器产品。更为关键的是,在IoT市场,x86或Arm都没有绝对的生态上的优势,RISC-V的发展并不会受到压制。再加上开源的RISC-V既能让企业参与全球RISC-V技术协同创新,又能满足相对独立的自主可控发展需求,使得RISC-V受到了众多中国厂商的追捧。


近年来,随着边缘计算以及人工智能(AI)技术的兴起,更多原本放在云端的AI计算被下放到边缘端,这样一方面可以减少对于网络带宽的消耗,同时也能降低数据处理的延时,保障用户数据的安全性,提升用户的整体的AI体验。在此背景之下,AIoT(智能物联网)市场对于边缘AI的能力也提出了更高的要求。


由于AIoT芯片对于成本和功耗都比较敏感,不同的细分市场也有着不同的个性化的需求,这也使得AIoT芯片大多无法像云端或移动端的芯片那样,直接外挂或集成定制的AI加速来负责AI计算,更多是依赖于CPU来进行AI计算。


孟建熠也表示,面对IoT领域的AI需求,其实很多场景都不需要用AI加速器去做,尤其是在面对1Tops以下算力需求的应用当中,通过优化提升CPU的AI能力就已经可以应对,这对于芯片的成本、功耗、可调试性、可开发性都是非常友好的。


相对于x86及Arm等CPU架构来说,由于RISC-V架构CPU本就有着低功耗、低成本的优势,这也使得进一步挖掘RISC-V CPU的AI能力,成为了不少AIoT芯片厂商重点拓展的新方向。特别是在控制功耗的前提下,RISC-V CPU的AI能效的表现则更为关键。


玄铁C906夺得四项AI测试全球第一,意义何在?


此次平头哥半导体玄铁RISC-V C906参与的MLPerf基准测试,是目前全球最权威的AI基准测试之一。Tiny是MLPerf近年新增的聚焦于低功耗、高性价比的IoT场景的性能测试分类,主要用于展示各芯片厂商在应用日益广泛的IoT智能市场情景中的软硬件性能和优化能力。


据了解,此次在本次Tiny v0.7的测试中,参与竞争的CPU架构多样,涵盖了Arm、RISC-V架构和自研架构等。在不使用加速器的情况下,阿里基于平头哥玄铁RISC-V C906处理器内核——全志D1提交的软硬件性能优化结果,在满足精度要求的同时,刷新了全部4个benchmark(主要是视觉唤醒、图像分类、语音唤醒及异常监测)性能指标的纪录,创造了RISC-V架构在MLPerf Tiny基准测试有史以来的最好成绩。


△MLPerf网站展示的玄铁C906的四项测试


从Tiny v0.7推理性能数据对比来看,玄铁C906的四项测试得分分别达到了其他机构最优性能的12.6倍、20.8倍、16.2倍和10.9倍以上。足见玄铁C906在AIoT领域的性能优势。


△权威AI榜单MLPerf Tiny V0.7性能数据对比


据了解,在AI Benchmark领域,过去大家看重的都是芯片的AI性能,在这块MLPerf已经做到了国际公认的权威。经过近几年的发展,特别是在IoT领域,芯片的AI能效表现越来越受到重视,MLPerf也对应的推出了针对IoT领域的AI能效的基准测试Tiny。


孟建熠告诉芯智讯:“由于此前阿里在AI能效方面一直有较多的布局和积累,当Tiny这个测试推出之后,我们自然就想来反映一下自身的能力,于是就去参与了测试,结果四个指标都拿到了第一,证明了我们的技术路线是正确的。”


需要特别指出的是,该测试成绩是在不使用加速器的情况下取得的,也就是说,这个测试的成绩完全反映的是平头哥C906的AI处理能力。


软硬协同优化是关键


那么,平头哥玄铁C906此次成功拿下四项AI测试的全球第一,并且相比友商的最优性能得分均高出了10倍以上,其背后又有着哪些秘密呢?


据介绍,此番玄铁C906这一成绩的取得,主要是得益于阿里软硬件协同创新优化的实力,包括了从硬件,到编译,到算法,再到应用的各个方面。


首先,在硬件层面,玄铁C906处理器是业界最早量产的向量扩展RISC-V指令集处理器。采用5~8级流水线设计,配备性能优异的单双精度浮点和128位矢量运算单元,支持INT8 / INT16 / INT32 / INT64 以及 BF16 / FP16 / FP32 / FP64多种格式的矢量运算。同时,C906在数据预取上也做了优化,采用多通道多模式的数据预取技术,可大幅提升数据访问带宽


其次,在编译层面,平头哥进一步优化了针对玄铁CPU平台的神经网络模型部署工具集HHB(Heterogeneous Honey Badger) 及开源神经网络加速库CSI-NN2,将AI算子更好地与硬件适配,使得玄铁CPU实现了AI性能升级。目前,HHB及CSI-NN2均已开源。


第三,在算法层面,借助阿里云震旦异构计算加速平台SinianML对各个benchmark的神经网络进行了压缩、蒸馏、伸缩、网络结构搜索等多方位的优化,在保证达到要求精度目标的情况下,得到远高于标准模型的计算效率,同时集成阿里IoT、蚂蚁IoT、达摩院语音实验室等在各自领域的优化经验和能力,进一步拓展细分领域的优化的效果。


第四,在应用层面,玄铁RISC-V处理器经过数年的发展,目前已覆盖低功耗、高能效、高性能等各类场景,并支持了OpenXuantie的多操作系统(AliOS、FreeRTOS、RT-Thread、Linux、Android等),广泛应用于智能家电、车载、工业控制、边缘计算等领域。这也使得玄铁RISC-V处理器能够针对各种不同应用端的需求进行持续优化。


总结来说,玄铁RISC-V的硬件更多的是处理器这块,而软件则更多的是AI的编译框架以及上层的网络结构优化的工具。软硬协同优化,则得益于阿里云AI团队与平头哥团队之间的协同。


目前包括平头哥玄铁RISC-V E902、E906、C906、C910等4款量产处理器IP,以及针对玄铁RISC-V处理器AI方面的神经网络模型部署工具集HHB和神经网络加速库CSI-NN2,都是完全开源开放的。所以,在此基础上,客户在面向特定领域的时候,还可以自己做更深度的优化。


RISC-V在移动及服务器市场的未来


正如我们在前文当中所指出的,由于RISC-V所具有的低功耗、低成本的优势,使得其非常适合IoT市场。目前RISC-V生态的发展也主要是围绕着各种IoT的应用。但是,这并不代表RISC-V就没有机会进入Arm架构统治的移动市场,以及x86架构统治的服务器市场。


2021年10月13日,平头哥就宣布其基于RISC-V架构的玄铁C910成功兼容安卓系统,可运行Chrome浏览器等应用。这也是当时业界首次实现RISC-V架构对安卓的支持,意味着RISC-V架构有望打破场景壁垒,成为移动端芯片设计的新选择。


目前平头哥正持续推动基于RISC-V CPU架构的Android生态发展,未来将有更多新的进展和发布值得期待。


虽然,RISC-V的高能效、低成本等优势,可能会给移动设备带来更好的体验以及成本的降低。但是,RISC-V的劣势也很明显,因为它是一个新的架构,不论是在移动端、还是在PC/服务器端都缺乏生态的支持。


另外,RISC-V架构的完备性和处理的能力也需要进一步完善,以适应移动市场或PC/服务器市场的要求。但是,随着RISC-V CPU内核不断向高性能方向发展,以及各种复杂功能的加入,可能也会将使得RISC-V CPU内核变得越来越臃肿,功耗也会大幅增加,开发的门槛也会大幅提高。目前高性能的RISC-V CPU IP也主要是由一些RISC-V开发商(比如SiFive、平头哥)通过IP授权形式提供的。在此情况下,RISC-V原本的指令精简、低功耗、低成本的优势或将不再明显,恐怕很难与在移动市场占据绝对生态优势的Arm架构进行竞争,也难以在服务器市场与x86架构竞争。



据了解,目前RISC-V基金会已经有超过2000家会员企业,其内部有着多达60个左右的技术委员会,都在积极的从各个维度来完善RISC-V技术。这其中不仅有硬件的开发人员,还有软件开发者,以及各行各业里原来就在用Arm架构的芯片厂商。就连x86架构的处理器大厂英特尔也加入了RISC-V基金会。同时,英特尔和AMD也都投资了知名的RISC-V IP厂商SiFive。


RISC-V IP未来路在何方?


近两年来,随着RISC-V架构的火爆,以及资本的追捧,市场上涌现出了众多的RISC-V IP供应商,比如平头哥、SiFive、芯来、晶芯、赛昉等。


但是从市场角度来看,半导体IP市场规模本并不大,特别是在CPU IP领域。即便是垄断了整个移动市场CPU IP的Arm,其2020年的营收规模也只有19.80亿美元左右。更何况市场上本就有很多的开源RISC-V IP,还有一些终端厂商选择自研RISC-V IP。这些都将使得未来的RISC-V IP市场或将面临极为激烈的竞争。


RISC-V合集:
2021年RISC-V行业概览
ARM系列处理器应用技术完全手册
CPU和GPU研究框架合集
面向AIoT的RISC-V原生操作系统研究
深度报告:RISC-V异构IoT全新架构
RISC-V芯片产业指令集架构研究
玄铁C910实现RISC-V用户自定义指令
面向AIoT的RISC-V原生操作系统研究

RISC-V手册开源指令集指南


开启国产CPU和AI芯片的腾飞之路

CPU和GPU研究框架合集

1、行业深度报告:GPU研究框架

2、信创产业研究框架

3、ARM行业研究框架

4、CPU研究框架

5、国产CPU研究框架

6、行业深度报告:GPU研究框架


本号资料全部上传至知识星球,更多内容请登录智能计算芯知识(知识星球)星球下载全部资料。




免责申明:本号聚焦相关技术分享,内容观点不代表本号立场,可追溯内容均注明来源,发布文章若存在版权等问题,请留言联系删除,谢谢。



电子书<服务器基础知识全解(终极版)>更新完毕。

获取方式:点击“阅读原文”即可查看182页 PPT可编辑版本和PDF阅读版本详情。



温馨提示:

请搜索“AI_Architect”或“扫码”关注公众号实时掌握深度技术分享,点击“阅读原文”获取更多原创技术干货。


智能计算芯世界 聚焦人工智能、芯片设计、异构计算、高性能计算等领域专业知识分享.
评论
  • 自动化已成为现代制造业的基石,而驱动隔离器作为关键组件,在提升效率、精度和可靠性方面起到了不可或缺的作用。随着工业技术不断革新,驱动隔离器正助力自动化生产设备适应新兴趋势,并推动行业未来的发展。本文将探讨自动化的核心趋势及驱动隔离器在其中的重要角色。自动化领域的新兴趋势智能工厂的崛起智能工厂已成为自动化生产的新标杆。通过结合物联网(IoT)、人工智能(AI)和机器学习(ML),智能工厂实现了实时监控和动态决策。驱动隔离器在其中至关重要,它确保了传感器、执行器和控制单元之间的信号完整性,同时提供高
    腾恩科技-彭工 2025-01-03 16:28 170浏览
  •     为控制片内设备并且查询其工作状态,MCU内部总是有一组特殊功能寄存器(SFR,Special Function Register)。    使用Eclipse环境调试MCU程序时,可以利用 Peripheral Registers Viewer来查看SFR。这个小工具是怎样知道某个型号的MCU有怎样的寄存器定义呢?它使用一种描述性的文本文件——SVD文件。这个文件存储在下面红色字体的路径下。    例:南京沁恒  &n
    电子知识打边炉 2025-01-04 20:04 100浏览
  • PLC组态方式主要有三种,每种都有其独特的特点和适用场景。下面来简单说说: 1. 硬件组态   定义:硬件组态指的是选择适合的PLC型号、I/O模块、通信模块等硬件组件,并按照实际需求进行连接和配置。    灵活性:这种方式允许用户根据项目需求自由搭配硬件组件,具有较高的灵活性。    成本:可能需要额外的硬件购买成本,适用于对系统性能和扩展性有较高要求的场合。 2. 软件组态   定义:软件组态主要是通过PLC
    丙丁先生 2025-01-06 09:23 85浏览
  • 本文介绍Linux系统更换开机logo方法教程,通用RK3566、RK3568、RK3588、RK3576等开发板,触觉智能RK3562开发板演示,搭载4核A53处理器,主频高达2.0GHz;内置独立1Tops算力NPU,可应用于物联网网关、平板电脑、智能家居、教育电子、工业显示与控制等行业。制作图片开机logo图片制作注意事项(1)图片必须为bmp格式;(2)图片大小不能大于4MB;(3)BMP位深最大是32,建议设置为8;(4)图片名称为logo.bmp和logo_kernel.bmp;开机
    Industio_触觉智能 2025-01-06 10:43 87浏览
  • 根据环洋市场咨询(Global Info Research)项目团队最新调研,预计2030年全球无人机锂电池产值达到2457百万美元,2024-2030年期间年复合增长率CAGR为9.6%。 无人机锂电池是无人机动力系统中存储并释放能量的部分。无人机使用的动力电池,大多数是锂聚合物电池,相较其他电池,锂聚合物电池具有较高的能量密度,较长寿命,同时也具有良好的放电特性和安全性。 全球无人机锂电池核心厂商有宁德新能源科技、欣旺达、鹏辉能源、深圳格瑞普和EaglePicher等,前五大厂商占有全球
    GIRtina 2025-01-07 11:02 68浏览
  • 村田是目前全球量产硅电容的领先企业,其在2016年收购了法国IPDiA头部硅电容器公司,并于2023年6月宣布投资约100亿日元将硅电容产能提升两倍。以下内容主要来自村田官网信息整理,村田高密度硅电容器采用半导体MOS工艺开发,并使用3D结构来大幅增加电极表面,因此在给定的占位面积内增加了静电容量。村田的硅技术以嵌入非结晶基板的单片结构为基础(单层MIM和多层MIM—MIM是指金属 / 绝缘体/ 金属) 村田硅电容采用先进3D拓扑结构在100um内,使开发的有效静电容量面积相当于80个
    知白 2025-01-07 15:02 75浏览
  • 根据Global Info Research项目团队最新调研,预计2030年全球封闭式电机产值达到1425百万美元,2024-2030年期间年复合增长率CAGR为3.4%。 封闭式电机是一种电动机,其外壳设计为密闭结构,通常用于要求较高的防护等级的应用场合。封闭式电机可以有效防止外部灰尘、水分和其他污染物进入内部,从而保护电机的内部组件,延长其使用寿命。 环洋市场咨询机构出版的调研分析报告【全球封闭式电机行业总体规模、主要厂商及IPO上市调研报告,2025-2031】研究全球封闭式电机总体规
    GIRtina 2025-01-06 11:10 104浏览
  • 这篇内容主要讨论三个基本问题,硅电容是什么,为什么要使用硅电容,如何正确使用硅电容?1.  硅电容是什么首先我们需要了解电容是什么?物理学上电容的概念指的是给定电位差下自由电荷的储藏量,记为C,单位是F,指的是容纳电荷的能力,C=εS/d=ε0εrS/4πkd(真空)=Q/U。百度百科上电容器的概念指的是两个相互靠近的导体,中间夹一层不导电的绝缘介质。通过观察电容本身的定义公式中可以看到,在各个变量中比较能够改变的就是εr,S和d,也就是介质的介电常数,金属板有效相对面积以及距离。当前
    知白 2025-01-06 12:04 173浏览
  • 每日可见的315MHz和433MHz遥控模块,你能分清楚吗?众所周知,一套遥控设备主要由发射部分和接收部分组成,发射器可以将控制者的控制按键经过编码,调制到射频信号上面,然后经天线发射出无线信号。而接收器是将天线接收到的无线信号进行解码,从而得到与控制按键相对应的信号,然后再去控制相应的设备工作。当前,常见的遥控设备主要分为红外遥控与无线电遥控两大类,其主要区别为所采用的载波频率及其应用场景不一致。红外遥控设备所采用的射频信号频率一般为38kHz,通常应用在电视、投影仪等设备中;而无线电遥控设备
    华普微HOPERF 2025-01-06 15:29 127浏览
  • 在智能家居领域中,Wi-Fi、蓝牙、Zigbee、Thread与Z-Wave等无线通信协议是构建短距物联局域网的关键手段,它们常在实际应用中交叉运用,以满足智能家居生态系统多样化的功能需求。然而,这些协议之间并未遵循统一的互通标准,缺乏直接的互操作性,在进行组网时需要引入额外的网关作为“翻译桥梁”,极大地增加了系统的复杂性。 同时,Apple HomeKit、SamSung SmartThings、Amazon Alexa、Google Home等主流智能家居平台为了提升市占率与消费者
    华普微HOPERF 2025-01-06 17:23 145浏览
  • By Toradex 秦海1). 简介嵌入式平台设备基于Yocto Linux 在开发后期量产前期,为了安全以及提高启动速度等考虑,希望将 ARM 处理器平台的 Debug Console 输出关闭,本文就基于 NXP i.MX8MP ARM 处理器平台来演示相关流程。 本文所示例的平台来自于 Toradex Verdin i.MX8MP 嵌入式平台。  2. 准备a). Verdin i.MX8MP ARM核心版配合Dahlia载板并
    hai.qin_651820742 2025-01-07 14:52 45浏览
  • 大模型的赋能是指利用大型机器学习模型(如深度学习模型)来增强或改进各种应用和服务。这种技术在许多领域都显示出了巨大的潜力,包括但不限于以下几个方面: 1. 企业服务:大模型可以用于构建智能客服系统、知识库问答系统等,提升企业的服务质量和运营效率。 2. 教育服务:在教育领域,大模型被应用于个性化学习、智能辅导、作业批改等,帮助教师减轻工作负担,提高教学质量。 3. 工业智能化:大模型有助于解决工业领域的复杂性和不确定性问题,尽管在认知能力方面尚未完全具备专家级的复杂决策能力。 4. 消费
    丙丁先生 2025-01-07 09:25 80浏览
  • 随着市场需求不断的变化,各行各业对CPU的要求越来越高,特别是近几年流行的 AIOT,为了有更好的用户体验,CPU的算力就要求更高了。今天为大家推荐由米尔基于瑞芯微RK3576处理器推出的MYC-LR3576核心板及开发板。关于RK3576处理器国产CPU,是这些年的骄傲,华为手机全国产化,国人一片呼声,再也不用卡脖子了。RK3576处理器,就是一款由国产是厂商瑞芯微,今年第二季推出的全新通用型的高性能SOC芯片,这款CPU到底有多么的高性能,下面看看它的几个特性:8核心6 TOPS超强算力双千
    米尔电子嵌入式 2025-01-03 17:04 55浏览
  • 彼得·德鲁克被誉为“现代管理学之父”,他的管理思想影响了无数企业和管理者。然而,关于他的书籍分类,一种流行的说法令人感到困惑:德鲁克一生写了39本书,其中15本是关于管理的,而其中“专门写工商企业或为企业管理者写的”只有两本——《为成果而管理》和《创新与企业家精神》。这样的表述广为流传,但深入探讨后却发现并不完全准确。让我们一起重新审视这一说法,解析其中的矛盾与根源,进而重新认识德鲁克的管理思想及其著作的真正价值。从《创新与企业家精神》看德鲁克的视角《创新与企业家精神》通常被认为是一本专为企业管
    优思学院 2025-01-06 12:03 119浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦