1987年台积电成立,以代工模式改变了“芯片制造”的生产关系;1990年Arm成立,以授权模式改变了“芯片设计”的生产关系。2015年开始开源ISA的RISC-V,作为一种新兴指令集,以其开源、开放、简洁、灵活等特性,在此轮芯片产业周期中发展迅速,即将改变“芯片架构”的生产关系。
数据显示,截至2023年,RISC-V在主流应用中占比约30%,在主流市场年增长率超过40%,几乎用10年时间完成了Arm架构30年的历程。
从软件到硬件,开源已经成为数字产业的大势所趋。作为一种新兴开源芯片架构的发展历程,RISC-V以其开放、模块化和可扩展的核心特性,极大地降低了开发者参与创新的技术门槛,为整个半导体产业带来了前所未有的机遇。随着新型算力需求激增,RISC-V发展迎来蝶变,即将进入应用爆发期。目前,全球70多个国家和地区已经投入到RISC-V领域,软硬件生态日趋成熟,AI爆发对算力的极大需求也给RISC-V带来了更大的想象空间。
2023年,RISC-V架构在更多实际应用场景中得以落地生根,从物联网设备、边缘计算逐渐迈向AI计算、高性能计算等“深水区”,产生代表性的应用案例。同时,RISC-V软件生态的逐步完善,也令其应用规模和适配程度不断提高。
在近日由阿里巴巴达摩院举办的玄铁RISC-V生态大会上,多位业内专家接受了媒体的采访,畅谈RISC-V的产品突破、生态发展及潜力应用。
由左至右:主持人-达摩院公关负责人萧良善、知合计算技术(深圳)有限公司CEO孟建熠、达摩院玄铁RISC-V团队资深技术专家李春强、比科奇微电子(杭州)有限公司芯片研发副总裁沈钲、北京忆芯科技有限公司合伙人朱旭涛
为什么选择RISC-V?
RISC-V最适合的应用是什么?这是很多持观望态度的终端厂商最想知道的问题,当前RISC-V已经从一项技术走向实实在在的产品,几位嘉宾现身说法,从5G通信、高性能处理器和 AI芯片的方面,阐述了RISC-V的优势。
李春强表示,RISC-V开源开放架构的最大特点是可定制、可扩展,所以被大家认为是“为AI而生的架构”。达摩院玄铁团队在RISC-V方向上做了很多AI相关的工作,包括前期的C910 Vector 0.7到C920 Vector 1.0扩展指令设计实现,到进一步定义Matrix指令集,从性能方法学上,实现了以开源开放的方式把RISC-V AI芯片性能做得更好。
“包括玄铁C907在内的产品已经实现对AI大模型的支持,我们希望通过这种扩展定义的方式,把AI算法模型快速、便捷地跟RISC-V CPU高效融合。” 李春强说道,后续达摩院还将与产业下游合作,在终端产品中把基于RISC-V的 AI应用扩展开,并且在芯片层面把RISC-V和AI算力的架构做得更好。
孟建熠原是阿里旗下芯片业务平头哥副总裁,2023年平头哥拆分独立后,成立了知合计算并担任CEO。在自我介绍时他表示,除了是知合计算CEO外,他的“另一个身份仍是达摩院和玄铁的一员,因为前期(玄铁)对于把IP往更高性能走的规划,我一直在参与。”基于RISC-V的高性能通用可扩展计算芯片,也正是知合计算所专注并正与达摩院合作的方向。
谈到达摩院对RISC-V IP的定位,孟建熠认为是往稳定、可靠、高性能的方向做,“AI也是达摩院的主要方向之一。”他透露达摩院目前针对AI算力提升的产品尚未对外发布,“但从整个架构和潜力来看,在业界都是既有技术领先性,又能结合行业实践反馈的,加速非常快。”
对于进军高性能领域,孟建熠认为RISC-V还有几件事要做好:一是AI,因为AI的扩展性允许把更多的硬件资源做为计算能力,所以天生就应该做好;二是找到高性能处理器技术能力的边界。
体系结构的发展历程中,积累了大量非优化的“遗存”。例如过去的软件普遍依赖硬件,借助ISA(指令集架构)发挥作用,RISC-V得以脱颖而出的原因之一是采用软硬协同创新,如此带来了十倍以上的性能收益。原因之二是计算原语(Compute Primitive)、存储架构(Memory Hierarchy)都是相通的,所以计算架构的演进需要共性技术基地;原因之三是业界对软件生态统一的迫切需求,生态的本质是降低全行业使用成本,纵观目前主流的x86/Arm/Cuda、自研架构和开源架构,唯有通过开源生态的共同投入才能“聚沙成塔”,而RISC-V是当前唯一可支撑起全链路生态的架构。
“从过去来看,现在缺少真正能够在产业里大规模量产的高性能RISC-V芯片,这样的需求会反馈到玄铁生态。可以在未来的RISC-V处理器上用上更好的IP,玄铁才能打造一个正向循环的生态体系。” 孟建熠说道。
比科奇专注5G小基带芯片,其中物理层基带处理器选择了RISC-V架构,为何不用Arm或其他架构?沈钲表示,因为物理层基带主要面向的天线数据处理,“2018年立项之初我们也考虑过用Arm和其他架构,但我们出于基带处理对CPU的需求特性,在架构上选择了RISC-V,现在来看我们的选择也是很对的。”
据沈钲介绍,基带处理需要CPU的地方主要包括两方面,一是做高层次通量的协议解析,因为信息量很大且分为多个小任务,有很强的并行处理的要求,所以大量RISC-V小核在合理调度的情况下,比一个单一的大核效率更高。“我们采用两个处理器,每个里面分别是16个小核,总共相当于32个小核在SoC中。其中16核做高层次协议栈的消息解析,每个消息的解析相对独立,另外16小核主要做空口数据包的处理。”
第二点,基带处理更倾向做数据的运算,让DSP有更强的矢量并行能力,但是这种做法对于消息解析来说有些浪费。比科奇根据不同任务的类型、处理特征进行划分,需要大量并行处理的部分采用CEVA DSP,在并行消息处理的地方则用RISC-V核。“现在RISC-V也有矢量扩展功能,包括定制指令,我们希望在下一代产品当中,把DSP也换成RISC-V。” 沈钲说道。
不得不谈的AI
谈到具体的应用,就不得不提时下最火的AI。由于在大模型训练方面英伟达GPU一家独大,所以AI芯片厂商们大多把目光放在了推理应用方面,尤其是端侧推理。对于RISC-V而言,主要从CPU IP的角度加入AI做融合计算,以及在指令集扩展的维度上做更多定义以及标准的制定。
“在这点上,达摩院之前在Vector 1.0已经实现,后续也有Matrix扩展指令定义在国际基金会推广。从处理器IP的角度,如何把制定的指令集在CPU IP中研发出来后,推广到下游的合作伙伴,帮助他们把芯片做得更好很重要。” 李春强说道,上层软件、大模型、算法都牵引着CPU硬件的研发,达摩院本身也在积极尝试大模型算法部署,争取快速把算法在RISC-V上跑起来,相关开发工具做出来。
李春强表示,从大模型的维度上来说,这种新兴事物对RISC-V来说是非常好的机会,因为大家都是从零起步,后期将会看更多会类似RISC-V多核并行计算、多核通信以及存储带宽应用,“因为大模型的瓶颈除了算力之外还有存储,我们也会在这方面做一些前期布局。”
鉴于多家手机、PC大厂力推的端侧大模型,以及谷歌开始支持安卓(Android)on RISC-V,开发者也开始想象与大模型结合的RISC-V是否可以助力终端产品加速进入“后智能机时代”,迎来一个全新的杀手级硬件应用和生态。
李春强认为,RISC-V的确正以生态的方式来做这件事,无论是AI大模型,还是安卓之后的下一代智能终端,都存在想象空间。“以往的AI形态大多基于类似GPGPU的架构,RISC-V则考虑怎样做CPU+AI架构,基于可定制、可扩展的特性可以衍生出包括像机器人在内的更多创新可能性。”
孟建熠也认为就现在的RISC-V来说,AI一定是最重要的方向,而且RISC-V架构在端侧大模型推理方面有先天优势。“很重要的一点是,无论相比英特尔x86或其他架构,RISC-V能效都更好。目前还很难说RISC-V能促进端侧大模型能力快速迭代,因为还有很多的兼容性问题。但RISC-V可以在比较低的功耗下处理比更多计算,意味着在有限的能量下可以做更多。”
汽车等其他领域的应用落地
除了AI,RISC-V这两年在工业、汽车应用方面也有一些动作。李春强表示,达摩院本身也在布局高可靠性、高实时处理器,比如面向高可靠、高实时性的计算新需求的玄铁R910产品,同时支持 Cache 以及 TCM 存储架构,可选配快速及一致性外设接口,在保持高可靠的基础上大幅提升系统实时性,可应用在存储控制、网络通信、自动驾驶等领域。
据孟建熠透露,达摩院玄铁在汽车方面早有布局,目前已有头部客户在使用相关产品,但鉴于这些客户较为低调,外界并没有相关消息传出。“如今RISC-V在全球的汽车领域都在突破,而国内的新创公司走得更快,基本都是带着RISC-V在走的,区别只是具体用在哪里。”
展望今年,RISC-V最大的变化是在应用落地上。数据显示,仅安卓和RISC-V适配这一项工作,工程师就调整了12万行代码,落地带来如此大的工作量,李春强表示主要因为安卓对于RISC-V架构而言,是个全新的操作系统,与处理器紧密相关,需要做新的适配和性能优化。
“玄铁团队从2021年开始,对RISC-V跟安卓的适配投入了很多资源,重点包括内核、编译工具、基础库等。在整个前期过程中,产业也看到了玄铁在这方面所作的努力,加上看到RISC-V与安卓结合带来的潜力,谷歌也在后来参与到RISC-V国际基金会中,一起推动RISC-V与安卓生态的发展。” 李春强说道。
生态问题
生态是RISC-V发展永远绕不开的问题,也是与x86和Arm相比仍比较薄弱的环节。但RISC-V的优势在于开源开放,遵循从开源软件到开源硬件的发展大趋势,所以RISC-V并不像有些人说的“外面看着很红火,里面很冷”。
李春强认为,RISC-V本身已经具备生态热度,如今很多RISC-V应用从开源开放指令集到产业落地就说明了这一点。包括玄铁团队在内的参与者,也一直在做指令集的标准制定和处理器之外的工具、操作系统等软件研发工作。在这样的基础上,还与产业链上其他厂家进行更多的合作,包括国产操作系统中的OpenKylin、OpenAnolis、OpenEuler、OpenHarmony等,以及国际操作系统Ubuntu、Debian等。RISC-V与主流操作系统更紧密地结合,才能推动软硬件的产业生态。
四年前,达摩院就启动了安卓系统跟RISC-V的融合工作,“是因为我们知道,RISC-V处理器要走出去,必须跟操作系统的各个社区和生态结合,才能碰撞出更多的火花。” 李春强以安卓为例指出,在行业内拥有大量开发者的应用生态基础跟RISC-V结合之后,能够起到很好的促进作用。
未来还将看到更多开源操作系统跟玄铁处理器的结合,带来产业上的落地。这个过程不仅是简单的移植,还包括性能、功耗的优化,产品化的推进等。李春强认为,目前这项工作还只是阶段性的,后续往产业化推进中还有更多事情要做,“最终目标是让合作伙伴在RISC-V生态圈真正赚到钱,在RISC-V做更多的原生应用,包括操作系统。”
达摩院作为阿里巴巴集团的下属机构,在有很多应用场景方面具有落地的优势,围绕着例如钉钉体系这样的场景做产品,不仅会被优先快速采用,还能形成灯塔效应。“为了推动RISC-V往产业化发展,我们在方式、方法、策略上会有所选择,集团内如果有更好的应用场景,我们肯定会优先使用。”但李春强指出,玄铁RISC-V CPU不止服务集团内部,这次生态大会以“开放·连接”为主题也强调了这一点,更多还是会向国际基金会和整个RISC-V生态中做贡献,最终目标是带动生态的力量和资源来一起做这件事。
在这件事上朱旭涛比较有心得,忆芯科技是一家固态硬盘(SSD)解决方案公司,主要产品是SSD主控芯片。由于过去几年SSD接口从最早的SATA到各代PCIe节节攀升,现在PCIe接口的SSD主控芯片工艺已经卷到了6、7纳米。“我们刚开始进入这个行业时,并没有追求这么先进的工艺,而是停留在相对比较成熟的节点上。尤其在企业级应用侧,SSD对power(功耗)并不是特别关注,早年在芯片上采取低功耗设计甚至被认为是鸡肋。”
时至今日,大家都开始在芯片内部堆核心数,因为SSD内部的任务处理需要跟每个核有一致性的关联操作,这就与早年的设计理念形成了冲突——当无限追性能时,Power侧就失控了,大家开始对功耗越来越关注。以前大家在为了提高兼容性、灵活性,有很多方案是用软件做的,如今无论是在消费级、数据中心还是企业级SSD芯片中,CPU的选型变得更重要。
朱旭涛表示,在很多协议相对定型的情况下,主控芯片企业希望不同的东西可以固化,在CPU上朝着更精简的指令集方向发展。“我们更关注CPU在实时性上的提升,包括使用效率上跟业务有实际的贴合度,在这一点上,我们的客户端需求得到了玄铁团队非常好的支持。”
客户对RISC-V的认同度如何?
一个完整的生态闭环,除了技术研发和产品落地,还需要最终赢得客户的认可和大量采用。RISC-V目前在终端用户处的接受度如何了?如何让客户也相信RISC-V?是大家都想知道的。
沈钲表示,之所以选择RISC-V架构,是因为比科奇是一家整体解决方案的提供商,“为了让5G基带处理器中CPU的执行效率发挥到最高,我们去掉了很多中间件,将上下游应用和底部打通。对于下游的系统集成商客户而言,会把我们的芯片和协议栈芯片做成一块完整的板子,到手的就是一个整体解决方案。”
整体解决方案使用RISC-V是因为它相对来说更透明,无需考虑用的是什么CPU内核;而对于芯片本身来说,RISC-V带来的好处是能效比很高,“能够在峰值情况下实现功耗小于10W,是我们相对于很多竞争对手的优势。” 沈钲认为,如今RISC-V对于顶层应用而言已经做得很好了,“对于应用跑在平台上,其实底层CPU是什么架构影响没那么大,这也得益于整个RISC-V生态的发展。”
朱旭涛对此表示认同,忆芯科技也是一家整体解决方案商,不仅自己做芯片,也做终端产品。“我们基于客户体验在 RISC-V平台上开发自己的硬件以及应用系统,客户更关注兼容性、硬件稳定性和产品可靠性的体验。所以我们从开发的阶段就很关注软件层面的体验,包括指令集执行的效率、指令密度和编译系统对用户的友好性等。”
进入10到100的爆发期
如今,高质量的CPU IP正推动RISC-V赋能千行百业的芯片产品,高端标杆应用持续增强产业对RISC-V的信心。随着计算架构进入到一个新的黄金十年,基于RISC-V的创新架构不断涌现,已进入“10到100”的爆发期。
“1到10阶段,是保持理想和信念的阶段,四年来达摩院的坚持不懈,让谷歌相信安卓可以在RISC-V上得到发展,变成了生态的主动推动者。而今天大会要推动的主题是10到100。开放·连接中的‘连接’,就是连接各个生态。” 孟建熠说道,当安卓生态跟RISC-V生态结合在一起,后续安卓再往前发展的时候,它与RISC-V的关系就不需要达摩院两头推进了,更多是由谷歌做。“而谷歌的投入,就是让RISC-V从10到100,今天我们正在见证的事,也是基于达摩院在1-10阶段做的诸多贡献。”
孟建熠认为,无论1-10还是10-100,其核心本质都是生态产生的裂变。“对此我深有体会,自己做东西只能做到1-10,因为别人都不跟进。而达摩院认为这件事能够慢慢走向10-100的底气,是源于越来越多的客户在使用RISC-V技术——不仅达摩院在做,别的生态都在做。”RISC-V生态的接受度越来越高,给10-100奠定了基础。
虽然还没有具体数据佐证,但老牌企业坚持使用Arm等架构大多因为背负着历史兼容性的包袱,但新公司选择RISC-V的概率在大幅提升。去年IP企业完成了历史最佳的RISC-V授权量就是最好的说明。
“芯片是一个烧钱的行业,如果每家投入一个亿,按照50-100家公司计算,就投入了50-100亿,对下游投入的增多就会带动10-100阶段的出现。” 孟建熠回忆上一届玄铁生态大会时,还在讲要让RISC-V触手可及,更多的是讲让更多开发者体验RISC-V,“而今天我们讲的是让更多客户用上RISC-V,因为现在用RISC-V的芯片和软件越来越多,我们要帮助他们连接更多的生态。这是我们在产业化过程当中,实际感受到的。”
李春强从软件上来谈了裂变,达摩院玄铁团队的职责更多是在1-10阶段,把与RISC-V处理器内核紧密相关的技术做出来,“我们的力量是有限的,各种操作系统的适配更多是OS厂家和开发者在做。刚开始谁也想象不到他们会有这样推进速度,所以推动RISC-V往前走的力量正是来自这样的生态裂变。”