从全球AI测试榜单,谈平头哥玄铁CPU布局及RISC-V未来

智能计算芯世界 2022-04-18 00:00



4月7日,全球权威AI基准测试MLPerf发布最新榜单,在聚焦低功耗、高能效的IoT领域Tiny v0.7榜单中,基于平头哥玄铁RISC-V C906处理器的软硬件联合优化方案,取得了全部4个指标的第一,并且达到了其他竞品同类最优性能的10倍以上。这也意味着,玄铁RISC-V C906处理器成为了目前最高能效比的AIoT计算内核。


RISC-V合集:
2021年RISC-V行业概览
ARM系列处理器应用技术完全手册
CPU和GPU研究框架合集
面向AIoT的RISC-V原生操作系统研究
深度报告:RISC-V异构IoT全新架构
RISC-V芯片产业指令集架构研究
玄铁C910实现RISC-V用户自定义指令
面向AIoT的RISC-V原生操作系统研究

RISC-V手册开源指令集指南


在该测试结果公布的次日,芯智讯专访了阿里平头哥副总裁孟建熠,以及平头哥生态负责人杨静,希望为大家揭开平头哥玄铁RISC-V C906处理器此次在AI基准测试当中以绝对优势获得4项全球第一背后的秘密。同时,对于平头哥在RISC-V领域最新的技术及生态进展,以及对于RISC-V产业未来的发展,孟建熠与杨静也做了进一步的分享。


RISC-V架构的新机遇:CPU的高能效AI计算


众所周知,目前在CPU市场,英特尔的X86架构及Arm架构仍然是最为主流的指令集架构。其中,x86架构统治着PC及服务器市场,而Arm架构则完全占据了移动市场。不过,在IoT(物联网)市场,由于需求非常碎片化、对功耗、成本也更为敏感,目前不论是X86架构还是Arm架构的处理器,都难以很好的满足IoT市场各种定制化的需求。


相比之下,近几年来兴起的RISC-V架构,由于具有指令非常精简、模块化、可扩展、开源、免费等优点,使得它在IoT市场有着天然的优势,可以更容易地针对物联网市场开发出低功耗、高能效、低成本、满足各种定制化需求的处理器产品。更为关键的是,在IoT市场,x86或Arm都没有绝对的生态上的优势,RISC-V的发展并不会受到压制。再加上开源的RISC-V既能让企业参与全球RISC-V技术协同创新,又能满足相对独立的自主可控发展需求,使得RISC-V受到了众多中国厂商的追捧。


近年来,随着边缘计算以及人工智能(AI)技术的兴起,更多原本放在云端的AI计算被下放到边缘端,这样一方面可以减少对于网络带宽的消耗,同时也能降低数据处理的延时,保障用户数据的安全性,提升用户的整体的AI体验。在此背景之下,AIoT(智能物联网)市场对于边缘AI的能力也提出了更高的要求。


由于AIoT芯片对于成本和功耗都比较敏感,不同的细分市场也有着不同的个性化的需求,这也使得AIoT芯片大多无法像云端或移动端的芯片那样,直接外挂或集成定制的AI加速来负责AI计算,更多是依赖于CPU来进行AI计算。


孟建熠也表示,面对IoT领域的AI需求,其实很多场景都不需要用AI加速器去做,尤其是在面对1Tops以下算力需求的应用当中,通过优化提升CPU的AI能力就已经可以应对,这对于芯片的成本、功耗、可调试性、可开发性都是非常友好的。


相对于x86及Arm等CPU架构来说,由于RISC-V架构CPU本就有着低功耗、低成本的优势,这也使得进一步挖掘RISC-V CPU的AI能力,成为了不少AIoT芯片厂商重点拓展的新方向。特别是在控制功耗的前提下,RISC-V CPU的AI能效的表现则更为关键。


玄铁C906夺得四项AI测试全球第一,意义何在?


此次平头哥半导体玄铁RISC-V C906参与的MLPerf基准测试,是目前全球最权威的AI基准测试之一。Tiny是MLPerf近年新增的聚焦于低功耗、高性价比的IoT场景的性能测试分类,主要用于展示各芯片厂商在应用日益广泛的IoT智能市场情景中的软硬件性能和优化能力。


据了解,此次在本次Tiny v0.7的测试中,参与竞争的CPU架构多样,涵盖了Arm、RISC-V架构和自研架构等。在不使用加速器的情况下,阿里基于平头哥玄铁RISC-V C906处理器内核——全志D1提交的软硬件性能优化结果,在满足精度要求的同时,刷新了全部4个benchmark(主要是视觉唤醒、图像分类、语音唤醒及异常监测)性能指标的纪录,创造了RISC-V架构在MLPerf Tiny基准测试有史以来的最好成绩。


△MLPerf网站展示的玄铁C906的四项测试


从Tiny v0.7推理性能数据对比来看,玄铁C906的四项测试得分分别达到了其他机构最优性能的12.6倍、20.8倍、16.2倍和10.9倍以上。足见玄铁C906在AIoT领域的性能优势。


△权威AI榜单MLPerf Tiny V0.7性能数据对比


据了解,在AI Benchmark领域,过去大家看重的都是芯片的AI性能,在这块MLPerf已经做到了国际公认的权威。经过近几年的发展,特别是在IoT领域,芯片的AI能效表现越来越受到重视,MLPerf也对应的推出了针对IoT领域的AI能效的基准测试Tiny。


孟建熠告诉芯智讯:“由于此前阿里在AI能效方面一直有较多的布局和积累,当Tiny这个测试推出之后,我们自然就想来反映一下自身的能力,于是就去参与了测试,结果四个指标都拿到了第一,证明了我们的技术路线是正确的。”


需要特别指出的是,该测试成绩是在不使用加速器的情况下取得的,也就是说,这个测试的成绩完全反映的是平头哥C906的AI处理能力。


软硬协同优化是关键


那么,平头哥玄铁C906此次成功拿下四项AI测试的全球第一,并且相比友商的最优性能得分均高出了10倍以上,其背后又有着哪些秘密呢?


据介绍,此番玄铁C906这一成绩的取得,主要是得益于阿里软硬件协同创新优化的实力,包括了从硬件,到编译,到算法,再到应用的各个方面。


首先,在硬件层面,玄铁C906处理器是业界最早量产的向量扩展RISC-V指令集处理器。采用5~8级流水线设计,配备性能优异的单双精度浮点和128位矢量运算单元,支持INT8 / INT16 / INT32 / INT64 以及 BF16 / FP16 / FP32 / FP64多种格式的矢量运算。同时,C906在数据预取上也做了优化,采用多通道多模式的数据预取技术,可大幅提升数据访问带宽


其次,在编译层面,平头哥进一步优化了针对玄铁CPU平台的神经网络模型部署工具集HHB(Heterogeneous Honey Badger) 及开源神经网络加速库CSI-NN2,将AI算子更好地与硬件适配,使得玄铁CPU实现了AI性能升级。目前,HHB及CSI-NN2均已开源。


第三,在算法层面,借助阿里云震旦异构计算加速平台SinianML对各个benchmark的神经网络进行了压缩、蒸馏、伸缩、网络结构搜索等多方位的优化,在保证达到要求精度目标的情况下,得到远高于标准模型的计算效率,同时集成阿里IoT、蚂蚁IoT、达摩院语音实验室等在各自领域的优化经验和能力,进一步拓展细分领域的优化的效果。


第四,在应用层面,玄铁RISC-V处理器经过数年的发展,目前已覆盖低功耗、高能效、高性能等各类场景,并支持了OpenXuantie的多操作系统(AliOS、FreeRTOS、RT-Thread、Linux、Android等),广泛应用于智能家电、车载、工业控制、边缘计算等领域。这也使得玄铁RISC-V处理器能够针对各种不同应用端的需求进行持续优化。


总结来说,玄铁RISC-V的硬件更多的是处理器这块,而软件则更多的是AI的编译框架以及上层的网络结构优化的工具。软硬协同优化,则得益于阿里云AI团队与平头哥团队之间的协同。


目前包括平头哥玄铁RISC-V E902、E906、C906、C910等4款量产处理器IP,以及针对玄铁RISC-V处理器AI方面的神经网络模型部署工具集HHB和神经网络加速库CSI-NN2,都是完全开源开放的。所以,在此基础上,客户在面向特定领域的时候,还可以自己做更深度的优化。


RISC-V在移动及服务器市场的未来


正如我们在前文当中所指出的,由于RISC-V所具有的低功耗、低成本的优势,使得其非常适合IoT市场。目前RISC-V生态的发展也主要是围绕着各种IoT的应用。但是,这并不代表RISC-V就没有机会进入Arm架构统治的移动市场,以及x86架构统治的服务器市场。


2021年10月13日,平头哥就宣布其基于RISC-V架构的玄铁C910成功兼容安卓系统,可运行Chrome浏览器等应用。这也是当时业界首次实现RISC-V架构对安卓的支持,意味着RISC-V架构有望打破场景壁垒,成为移动端芯片设计的新选择。


目前平头哥正持续推动基于RISC-V CPU架构的Android生态发展,未来将有更多新的进展和发布值得期待。


虽然,RISC-V的高能效、低成本等优势,可能会给移动设备带来更好的体验以及成本的降低。但是,RISC-V的劣势也很明显,因为它是一个新的架构,不论是在移动端、还是在PC/服务器端都缺乏生态的支持。


另外,RISC-V架构的完备性和处理的能力也需要进一步完善,以适应移动市场或PC/服务器市场的要求。但是,随着RISC-V CPU内核不断向高性能方向发展,以及各种复杂功能的加入,可能也会将使得RISC-V CPU内核变得越来越臃肿,功耗也会大幅增加,开发的门槛也会大幅提高。目前高性能的RISC-V CPU IP也主要是由一些RISC-V开发商(比如SiFive、平头哥)通过IP授权形式提供的。在此情况下,RISC-V原本的指令精简、低功耗、低成本的优势或将不再明显,恐怕很难与在移动市场占据绝对生态优势的Arm架构进行竞争,也难以在服务器市场与x86架构竞争。



据了解,目前RISC-V基金会已经有超过2000家会员企业,其内部有着多达60个左右的技术委员会,都在积极的从各个维度来完善RISC-V技术。这其中不仅有硬件的开发人员,还有软件开发者,以及各行各业里原来就在用Arm架构的芯片厂商。就连x86架构的处理器大厂英特尔也加入了RISC-V基金会。同时,英特尔和AMD也都投资了知名的RISC-V IP厂商SiFive。


RISC-V IP未来路在何方?


近两年来,随着RISC-V架构的火爆,以及资本的追捧,市场上涌现出了众多的RISC-V IP供应商,比如平头哥、SiFive、芯来、晶芯、赛昉等。


但是从市场角度来看,半导体IP市场规模本并不大,特别是在CPU IP领域。即便是垄断了整个移动市场CPU IP的Arm,其2020年的营收规模也只有19.80亿美元左右。更何况市场上本就有很多的开源RISC-V IP,还有一些终端厂商选择自研RISC-V IP。这些都将使得未来的RISC-V IP市场或将面临极为激烈的竞争。


RISC-V合集:
2021年RISC-V行业概览
ARM系列处理器应用技术完全手册
CPU和GPU研究框架合集
面向AIoT的RISC-V原生操作系统研究
深度报告:RISC-V异构IoT全新架构
RISC-V芯片产业指令集架构研究
玄铁C910实现RISC-V用户自定义指令
面向AIoT的RISC-V原生操作系统研究

RISC-V手册开源指令集指南


开启国产CPU和AI芯片的腾飞之路

CPU和GPU研究框架合集

1、行业深度报告:GPU研究框架

2、信创产业研究框架

3、ARM行业研究框架

4、CPU研究框架

5、国产CPU研究框架

6、行业深度报告:GPU研究框架


本号资料全部上传至知识星球,更多内容请登录智能计算芯知识(知识星球)星球下载全部资料。




免责申明:本号聚焦相关技术分享,内容观点不代表本号立场,可追溯内容均注明来源,发布文章若存在版权等问题,请留言联系删除,谢谢。



电子书<服务器基础知识全解(终极版)>更新完毕。

获取方式:点击“阅读原文”即可查看182页 PPT可编辑版本和PDF阅读版本详情。



温馨提示:

请搜索“AI_Architect”或“扫码”关注公众号实时掌握深度技术分享,点击“阅读原文”获取更多原创技术干货。


智能计算芯世界 聚焦人工智能、芯片设计、异构计算、高性能计算等领域专业知识分享.
评论 (0)
  • 你是不是也有在公共场合被偷看手机或笔电的经验呢?科技时代下,不少现代人的各式机密数据都在手机、平板或是笔电等可携式的3C产品上处理,若是经常性地需要在公共场合使用,不管是工作上的机密文件,或是重要的个人信息等,民众都有防窃防盗意识,为了避免他人窥探内容,都会选择使用「防窥保护贴片」,以防止数据外泄。现今市面上「防窥保护贴」、「防窥片」、「屏幕防窥膜」等产品就是这种目的下产物 (以下简称防窥片)!防窥片功能与常见问题解析首先,防窥片最主要的功能就是用来防止他人窥视屏幕上的隐私信息,它是利用百叶窗的
    百佳泰测试实验室 2025-04-30 13:28 538浏览
  • 随着电子元器件的快速发展,导致各种常见的贴片电阻元器件也越来越小,给我们分辨也就变得越来越难,下面就由smt贴片加工厂_安徽英特丽就来告诉大家如何分辨的SMT贴片元器件。先来看看贴片电感和贴片电容的区分:(1)看颜色(黑色)——一般黑色都是贴片电感。贴片电容只有勇于精密设备中的贴片钽电容才是黑色的,其他普通贴片电容基本都不是黑色的。(2)看型号标码——贴片电感以L开头,贴片电容以C开头。从外形是圆形初步判断应为电感,测量两端电阻为零点几欧,则为电感。(3)检测——贴片电感一般阻值小,更没有“充放
    贴片加工小安 2025-04-29 14:59 340浏览
  • 在全球制造业加速向数字化、智能化转型的浪潮中,健达智能作为固态照明市场的引领者和智能电子以及声学产品的创新先锋,健达智能敏锐捕捉到行业发展的新机遇与新挑战,传统制造模式已难以满足客户对品质追溯、定制化生产和全球化布局的需求。在此背景下, 健达智能科技股份有限公司(以下简称:健达智能)与盘古信息达成合作,正式启动IMS数字化智能制造工厂项目,标志着健达智能数字化转型升级迈入新阶段。此次项目旨在通过部署盘古信息IMS系统,助力健达实现生产全流程的智能化管控,打造照明行业数字化标杆。行业趋势与企业挑战
    盘古信息IMS 2025-04-30 10:13 33浏览
  • 网约车,真的“饱和”了?近日,网约车市场的 “饱和” 话题再度引发热议。多地陆续发布网约车风险预警,提醒从业者谨慎入局,这背后究竟隐藏着怎样的市场现状呢?从数据来看,网约车市场的“过剩”现象已愈发明显。以东莞为例,截至2024年12月底,全市网约车数量超过5.77万辆,考取网约车驾驶员证的人数更是超过13.48万人。随着司机数量的不断攀升,订单量却未能同步增长,导致单车日均接单量和营收双双下降。2024年下半年,东莞网约出租车单车日均订单量约10.5单,而单车日均营收也不容乐
    用户1742991715177 2025-04-29 18:28 302浏览
  • 浪潮之上:智能时代的觉醒    近日参加了一场课题的答辩,这是医疗人工智能揭榜挂帅的国家项目的地区考场,参与者众多,围绕着医疗健康的主题,八仙过海各显神通,百花齐放。   中国大地正在发生着激动人心的场景:深圳前海深港人工智能算力中心高速运转的液冷服务器,武汉马路上自动驾驶出租车穿行的智慧道路,机器人参与北京的马拉松竞赛。从中央到地方,人工智能相关政策和消息如雨后春笋般不断出台,数字中国的建设图景正在智能浪潮中徐徐展开,战略布局如同围棋
    广州铁金刚 2025-04-30 15:24 283浏览
  • 贞光科技代理品牌紫光国芯的车规级LPDDR4内存正成为智能驾驶舱的核心选择。在汽车电子国产化浪潮中,其产品以宽温域稳定工作能力、优异电磁兼容性和超长使用寿命赢得市场认可。紫光国芯不仅确保供应链安全可控,还提供专业本地技术支持。面向未来,紫光国芯正研发LPDDR5车规级产品,将以更高带宽、更低功耗支持汽车智能化发展。随着智能网联汽车的迅猛发展,智能驾驶舱作为人机交互的核心载体,对处理器和存储器的性能与可靠性提出了更高要求。在汽车电子国产化浪潮中,贞光科技代理品牌紫光国芯的车规级LPDDR4内存凭借
    贞光科技 2025-04-28 16:52 339浏览
  •  一、‌核心降温原理‌1、‌液氮媒介作用‌液氮恒温器以液氮(沸点约77K/-196℃)为降温媒介,通过液氮蒸发吸收热量的特性实现快速降温。液氮在内部腔体蒸发时形成气-液界面,利用毛细管路将冷媒导入蒸发器,强化热交换效率。2、‌稳态气泡控温‌采用‌稳态气泡原理‌:调节锥形气塞与冷指间隙,控制气-液界面成核沸腾条件,使漏热稳定在设定值。通过控温仪调整加热功率,补偿漏热并维持温度平衡,实现80K-600K范围的快速变温。二、‌温度控制机制‌1、‌动态平衡调节‌控温仪内置模糊控制系统,通过温度
    锦正茂科技 2025-04-30 11:31 30浏览
  • 想不到短短几年时间,华为就从“技术封锁”的持久战中突围,成功将“被卡脖子”困境扭转为科技主权的主动争夺战。众所周知,前几年技术霸权国家突然对华为发难,导致芯片供应链被强行掐断,海外市场阵地接连失守,恶意舆论如汹涌潮水,让其瞬间陷入了前所未有的困境。而最近财报显示,华为已经渡过危险期,甚至开始反击。2024年财报数据显示,华为实现全球销售收入8621亿元人民币,净利润626亿元人民币;经营活动现金流为884.17亿元,同比增长26.7%。对比来看,2024年营收同比增长22.42%,2023年为7
    用户1742991715177 2025-05-02 18:40 48浏览
  • 在智能硬件设备趋向微型化的背景下,语音芯片方案厂商针对小体积设备开发了多款超小型语音芯片方案,其中WTV系列和WT2003H系列凭借其QFN封装设计、高性能与高集成度,成为微型设备语音方案的理想选择。以下从封装特性、功能优势及典型应用场景三个方面进行详细介绍。一、超小体积封装:QFN技术的核心优势WTV系列与WT2003H系列均提供QFN封装(如QFN32,尺寸为4×4mm),这种封装形式具有以下特点:体积紧凑:QFN封装通过减少引脚间距和优化内部结构,显著缩小芯片体积,适用于智能门铃、穿戴设备
    广州唯创电子 2025-04-30 09:02 336浏览
  • 在CAN总线分析软件领域,当CANoe不再是唯一选择时,虹科PCAN-Explorer 6软件成为了一个有竞争力的解决方案。在现代工业控制和汽车领域,CAN总线分析软件的重要性不言而喻。随着技术的进步和市场需求的多样化,单一的解决方案已无法满足所有用户的需求。正是在这样的背景下,虹科PCAN-Explorer 6软件以其独特的模块化设计和灵活的功能扩展,为CAN总线分析领域带来了新的选择和可能性。本文将深入探讨虹科PCAN-Explorer 6软件如何以其创新的模块化插件策略,提供定制化的功能选
    虹科汽车智能互联 2025-04-28 16:00 243浏览
  • 文/郭楚妤编辑/cc孙聪颖‍越来越多的企业开始蚕食动力电池市场,行业“去宁王化”态势逐渐明显。随着这种趋势的加强,打开新的市场对于宁德时代而言至关重要。“我们不希望被定义为电池的制造者,而是希望把自己称作新能源产业的开拓者。”4月21日,在宁德时代举行的“超级科技日”发布会上,宁德时代掌门人曾毓群如是说。随着宁德时代核心新品骁遥双核电池的发布,其搭载的“电电增程”技术也走进业界视野。除此之外,经过近3年试水,宁德时代在换电业务上重资加码。曾毓群认为换电是一个重资产、高投入、长周期的产业,涉及的利
    华尔街科技眼 2025-04-28 21:55 213浏览
  • 文/Leon编辑/cc孙聪颖‍2023年,厨电行业在相对平稳的市场环境中迎来温和复苏,看似为行业增长积蓄势能。带着对市场向好的预期,2024 年初,老板电器副董事长兼总经理任富佳为企业定下双位数增长目标。然而现实与预期相悖,过去一年,这家老牌厨电企业不仅未能达成业绩目标,曾提出的“三年再造一个老板电器”愿景,也因市场下行压力面临落空风险。作为“企二代”管理者,任富佳在掌舵企业穿越市场周期的过程中,正面临着前所未有的挑战。4月29日,老板电器(002508.SZ)发布了2024年年度报告及2025
    华尔街科技眼 2025-04-30 12:40 302浏览
  • ‌一、高斯计的正确选择‌1、‌明确测量需求‌‌磁场类型‌:区分直流或交流磁场,选择对应仪器(如交流高斯计需支持交变磁场测量)。‌量程范围‌:根据被测磁场强度选择覆盖范围,例如地球磁场(0.3–0.5 G)或工业磁体(数百至数千高斯)。‌精度与分辨率‌:高精度场景(如科研)需选择误差低于1%的仪器,分辨率需匹配微小磁场变化检测需求。2、‌仪器类型选择‌‌手持式‌:便携性强,适合现场快速检测;‌台式‌:精度更高,适用于实验室或工业环境。‌探头类型‌:‌横向/轴向探头‌:根据磁场方向选择,轴向探头适合
    锦正茂科技 2025-05-06 11:36 36浏览
  • 一、gao效冷却与控温机制‌1、‌冷媒流动设计‌采用低压液氮(或液氦)通过毛细管路导入蒸发器,蒸汽喷射至样品腔实现快速冷却,冷却效率高(室温至80K约20分钟,至4.2K约30分钟)。通过控温仪动态调节蒸发器加热功率,结合温度传感器(如PT100铂电阻或Cernox磁场不敏感传感器),实现±0.01K的高精度温度稳定性。2、‌宽温区覆盖与扩展性‌标准温区为80K-325K,通过降压选件可将下限延伸至65K(液氮模式)或4K(液氦模式)。可选配475K高温模块,满足材料在ji端温度下的性能测试需求
    锦正茂科技 2025-04-30 13:08 442浏览
  • 多功能电锅长什么样子,主视图如下图所示。侧视图如下图所示。型号JZ-18A,额定功率600W,额定电压220V,产自潮州市潮安区彩塘镇精致电子配件厂,铭牌如下图所示。有两颗螺丝固定底盖,找到合适的工具,拆开底盖如下图所示。可见和大部分市场的加热锅一样的工作原理,手绘原理图,根据原理图进一步理解和分析。F1为保险,250V/10A,185℃,CPGXLD 250V10A TF185℃ RY 是一款温度保险丝,额定电压是250V,额定电流是10A,动作温度是185℃。CPGXLD是温度保险丝电器元件
    liweicheng 2025-05-05 18:36 49浏览
我要评论
0
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦