自2023年以来,生成式AI的火爆带动了芯片行业的增长,尤其是AI加速器市场规模增长最快。大模型催生了算力需求,而异构计算范式与RISC-V技术优势高度契合,让RISC-V架构SoC受到了市场广泛关注。
据SHD Group数据预测,预计到2030年,全球RISC-V芯片市场的规模将达到927亿美元,相比2023年增长276.8%,2023-2030年年复合增长率高达47.4%。其中,用于AI加速器的RISC-V芯片市场规模预计将达到420亿美元,年复合增长率达高达49.2%。
2021-2030年RISC-V SoC市场总营收
从具体出货量来看,到2030年,预计RISC-V芯片的出货量将达到161.81亿个,相比2023年增长了135.0%,2023-2030年年复合增长率达44%。其中,用于AI加速器的RISC-V芯片预计将达到41亿个,年复合增长率高达51.9%。
2021-2030年RISC-V SoC市场总出货量
从上图能够看到,无论是出货量还是销售额,AI领域的RISC-V芯片市场规模和增速都遥遥领先。
行业巨头、初创公司也在RISC-V上纷纷落子。
谷歌在其人工智能芯片中使用SiFive的X280作为协处理器,并计划在下一代人工智能系统中继续采用SiFive设计;Meta首发的AI MTIA芯片中使用两颗AX25-V100核心处理器,其RISC-V IP内核已获认可,且第二代MTIA芯片将继续采用并增加核心数量;特斯拉的Project Dojo芯片核心包含一个整数单元,采用了部分RISC-V架构指令。
初创公司方面,Tenstorrent将基于RISC-V架构技术和SF4X工艺开发下一代AI芯片;Untether.Al推出的BoqueriaAl速器拥有1458个RISC-V核心,可在由低至高功耗设备间灵活适配;Rivos的AI芯片结合高性能RISC-V CPU和针对LLM及数据分析优化的GPGPU。
就连ChatGPT母公司OpenAI也启动了RISC-V AI造芯计划——Rain AI公司获得OpenAl CEO的山姆奥特曼(Sam Altman)的投资,即将流片第一批基于RISC-V开源架构的芯片。
如今,英伟达是全球AI芯片毫无疑问的一哥,其成功不仅仅在于其芯片,更在于其软件栈CUDA的成功,英伟达已累计为CUDA生态投入120亿美元,自2020年以来,CUDA开发者数量从180万激增至450万,增长了150%。
国外在AI芯片和算力软件生态上,本就生态壁垒高筑,如今大举投资RISC-V AI芯片,很明显是看中了RISC-V作为一个开源的指令集架构,近年来产业生态逐渐完善,其微架构的灵活性和可扩展性,将为AI芯片带来很大的技术创新空间和产业化自由度。作为追赶者和挑战者的中国AI芯片企业,要如何应对这波挑战,把握RISC-V技术在生成式AI硬件算力时代的发展机遇?
在日前举办的第四届滴水湖中国RISC-V产业论坛上,多位行业专家围绕RISC-V在边缘计算领域的发展机遇展开了深入讨论。
图中由左到右依次为,主持人:
戴伟民,中国RISC-V产业联盟理事长、芯原股份创始人、董事长兼总裁;
圆桌嘉宾:
段建钢,英特尔亚太研发有限公司研发总监
梁中书,达摩院(上海)科技有限公司研发总监
彭剑英,中国RISC-V产业联盟秘书长、芯来智融半导体科技(上海)有限公司CEO
汪志伟,芯原股份高级副总裁、定制芯片平台事业部总经理
谢涛,北京大学讲席教授、RISC-V国际基金会人工智能与机器学习专委会主席
张晓东,乌镇智库理事长
RISC-V+AI可以“撼动”CUDA生态?
戴伟民首先抛出一个问题,RISC-V可扩展、可定制的特性,为RISC-V + AI领域带来哪些机会?对CUDA生态会产生哪些影响?
谢涛教授提出了一个形象的比喻,即将RISC-V与AI的融合比作“大房子”与“小房子”的结合,两者紧密相连共同完成复杂的任务。“‘AI+RISC-V’相当于一个CPU加上协处理器。‘协处理器’不一定是小房子,也可能是一个大房子,而且可能是有很多个,形成集群的概念。”
RISC-V+AI的Integrated模式(紧耦合),协处理器之于CPU,就像集成在大房子上的小房子
谢涛认为RISC-V的可扩展性、可定制性可以与AI加速器形成良好的设计组合,实现高性能和高效率,同时在一定程度上对CUDA生态产生影响。(关于谢涛教授演讲更详细的报道,请参考《电子工程专辑》文章:《“RISC-V+AI”和“AI+RISC-V”并不一样,谈国产AI芯片破局之道》)
对于有没有可能借助RISC-V来解决CUDA生态依赖的问题,《人工智能简史》、《理解图灵》的作者张晓东表示,“开源挑战闭源”生态,有的行业并没有做好,RISC-V能否成功建立生态的关键在于是否有明确的需求和产品作为支撑。
张晓东提出了两个问题:一是如何在没有明确需求的情况下建立标准,二是现有AI生态体系与RISC-V之间的关系和相互作用。“如果凭空制造一个标准,然后希望拉做产品的人来遵守,这个挑战要比在没标准的情况下做产品更大。”
如今的AI生态其实是分裂的,例如今年年初英特尔推了自己的AI PC标准后,微软也定义了一个自己的AI PC标准。可以预见的是,未来苹果可能也会有“苹果AI生态”,谷歌也会有自己的AI生态。大家都希望在自己的操作系统或更大的应用层面形成生态,而不像过去,软件厂商只是给硬件厂商提供“武器”。
张晓东指出,CUDA更多的用户在训练侧,而还不是在端侧。“现在业界讨论的重点是训练侧和端侧的算力将来比例会是多少。现在大概是1:1,因为大家还在不停的投入大模型的训练;两三年后,可能会是1:10或差得更多。可以预见的是,将来端侧对人们的影响力更大。”
“我们要去推动标准的建立,过去有一些标准是偏学术的,企业没有深度参与。”谢涛回应称,以往企业都是自说自话,因为大家都是友商,做的产品都是竞品,所以RISC-V国际基金会推动的标准是“自底向上”的过程,企业通过共同追求目标团结在一起。
“中国企业不是只推中国标准,而是RISC-V国际基金会的标准。RISC-V可以团结起其他企业,共同构建开放开源的Triton生态,与现有的CUDA生态形成互补而非对立。” 谢涛说道,推成标准不是目的,而是手段,推成标准后各大国际开源主流社区就自然支持大家的更新迭代和维护了,能够为芯片企业省去一大笔开支。“只有看到足够大的红利,大家才会把自己的小私心放一边,小一些的企业才能聚集起来,形成跟随效应。”
英特尔虽然以x86架构为人所熟知,但他们同时也作为RISC-V国际组织的首席成员 (premier member)积极参与相关标准的指定工作,并在2023年被认可为RISC-V国际组织的RISC-V开发合作伙伴 (development partner)。
段建钢分享了英特尔对RISC-V的支持及其在AI领域的探索,他认为英特尔在寻找RISC-V和AI的交集,因为AI是一个不断发展的领域,未来AI的样子还没有被定义。“一个还没被很好定义的领域,意味着有很多创新机会。对于AI来说,需要大量软硬件结合的优化解决方案,软件方面,已经出现了Triton和新型编程工具。”
据介绍,英特尔与行业合作伙伴共同创建了RISC-V Software Ecosystem(RISE),以加快RISC-V软件生态的就绪。“我们专注于基础软件层面的开发工作, 包括内核/虚拟化、编译器、固件和仿真技术,并在2023年为超过10个项目做出了贡献,被接受的补丁超过300个。” 段建钢认为,AI领域仍然在快速发展中,存在着许多创新机会,RISC-V与AI的结合可以通过寻找软件与硬件的最佳结合点来推动创新。
至于怎么定义“撼动CUDA生态”,段建钢认为从用户的角度,越往端侧的用户越多,但现在AI应用还没有起来。“还没有厂商从AI端侧挣到钱,等商业模式更清晰的时候,如果真的有一个应用领域实现盈利,从那个领域切入更有机会。但如果说要找到跟CUDA达到一样效果的软件栈,技术上确实很难。”
梁中书之前在英伟达工作,如今是阿里巴巴达摩院的技术专家,他坚定地认为RISC-V现在最重要的方向就是AI。早年大家更关注“训练”,但从现在的趋势来看,未来几年AI“推理”的需求会更旺盛。
“RISC-V+AI是大势所趋,从硬件角度如何做好RISC-V+AI的生态?” 梁中书认为,首先AI追求算力能效比,算力必然走向端用化,也就是谢涛教授所说的“紧耦合”模式;反之AI大算力芯片,形态应该是“松耦合”模式。AI应用要追求最佳性能,需要做很多特定优化,“所以我觉得AI某种程度上是个性化的应用,要支持好这种加速器模式,需要提供高效、完整的扩展指令接口,工具链的支持以及基本软件库的适配。”
在探讨RISC-V+AI生态何时可以“撼动”或达到CUDA生态的规模的现场投票中,观众们给出的结果如下:
5年内(12.5%),5-10年(51.79%),10年以上(26.79%),无法达到CUDA的规模(8.93%)
教育领域的AI应用是个蓝海
如今,教育领域不再强调应试教育,而更倡导个性化教育。麦肯锡数据预测,到2045年左右,有50%的工作将被AI替代,比此前的估计加速了10年。但与此同时,具有创造力、深度思考且具备AI 使用能力的人才,以及相应的工作需求将会增加。
世界经济论坛发布的《未来就业报告2023》显示,未来5 年内,人工智能、商业智能分析师、数据科学等大数据相关职位的需求增长最快。就业市场需求的变化,意味着教育体系需要推出符合 AI 时代需求的学科、人才素养评价体系,从而为生产力变革提供适用的复合型人才。
“我们更需要会提问题、解决问题的人才,而不是背答案的人才。”戴伟民认为,AI引起未来很多职业规划的变革,教育也需要新方法以适应新形势,教育领域智能化转型迫在眉睫,AI-Pad作为智能教育硬件有很大潜力,也存在挑战。
根据艾媒数据中心,2017-2023年中国教育智能硬件市场规模整体呈现上升趋势,2023年中国教育智能硬件市场规模达807亿元,同比增长29.53%。学习机配套的AI人工智能正逐渐成为家庭教育的强力助手,从多个学习场景中辅助孩子完成学习任务。
2023 年,全球 AIGC+教育赛道共发生 45 笔投融资,其中半数项目来源于美国,且多集中在 K12教育及职业培训两个细分领域内。目前美国多个在线教育学习平台已接入GPT-4 模型,包括语言学习平台多邻国、Speak,授课平台可汗学院,在线作业辅导平台 Chegg 等。
“AI-Pad是一个很好的切入点,可以颠覆传统的教育方式,实现个性化教育。” AIGC 和大模型技术的进一步成熟将从根本上改变“老师-机器-学生”的教学形态关系,从而推动个性化教学、增强学生的自主学习能力,戴伟民强调,AI-Pad需要足够的算力和软件支持,同时还需要能够运行Android操作系统(这个不容易)。
汪志伟认为,过去人们所谓的“智能教育”,其智能化程度是偏低的,因为过去属于硬件领先软件,现在则变成软件领先硬件。“从另一个角度说,现在硬件能力相对于智能化需求是偏弱的。AI-Pad要想在教育领域发挥作用,需要提升硬件能力,尤其是AI算力。一方面我们可以借助RISC-V这种开放、灵活、可扩展的CPU架构来扩展AI算力;另一方面,通过附加AI引擎和算力单元,让AI-Pad硬件方案或芯片方案更有竞争力。”
汪志伟还提到,AI-Pad需要支持Android操作系统,以便开发者能够开发更多应用程序。应用软件在智能化方面要有进一步提升,例如跟学生的互动方面。越是低年龄段对于智能的要求更高,不仅是传统的搜索,对于语音、手势等姿态交互能力也需要提升。“教育很多时候是为了解决问题,是一个提出并解答问题的过程。当前大部分教育软件都是直接给出答案,但并没有给出解题思路分析。如果有智能化的评价系统,帮助小朋友和家长一步步地推导出解题过程,也会对于我们的教育有更大的帮助。”
2023年,中国学习平板市场全渠道销量达到了472.1万台,同比2022年增长8.1%。AI大模型等新兴技术与电子教育的深度融合,将成为中国学习平板市场竞争的重要阵地。“现在RISC-V做IoT方面没有问题了。国产的RISC-V方案有没有可能用在Pad上?因为平板电脑要求要比IoT要高一点。” 戴伟民问道。
RISC-V生态这几年快速发展,CPU内核在算力、在性能上不断提升。“最早都是用在物联网,因为这类市场应用领域相对封闭。近两年随着RISC-V性能不断攀升,大家开始从微架构着手提升性能,国内已经推出超高算力的超级扩展代码序列。” 彭剑英表示,RISC-V的发展“从低到高”是必然趋势,要考虑的是从什么智能终端场景落地。
为什么RISC-V要上AI PC、安卓手机很难?是因为这类产品已经背负了太多的软件包袱。其实RISC-V的CPU性能已经足以往主流应用走,可扩展性对于RISC-V来说也是巨大的机会,如今所有的智能终端都在向智能化靠拢,AI-Pad与过去的Pad差异重点就在CPU性能上。
彭剑英认为,RISC-V的最大优势在于可扩展性,可以提供AI的能力。“2000-3000元的AI-Pad是‘小房子’,5000-6000元的AI-Pad是‘大房子’,不同智能终端的产品定位,对SoC架构会有不一样的需求。AI-Pad最关键的不是CPU性能有多高,而是能不能支撑未来在AI上的扩展。”
那么AI-Pad的应用场景有哪些呢?可以分为以下几个:
- 教学应用:利用自然语言处理(NLPNLP)和机器视觉技术,与学生进行深度对话式教学,以及基于视觉的互动学习,内置AI 训练模型提供定制化的学习体验、配置最优质的教育资源和精准教育评估;
- 学习应用:提供编程、设计、数据分析等与AI 相关的课程和工具;
- 能力测评:内置AI 模型能够对学习成效进行实时评估,并据此自动优化学习难度和内容,使学生能在最适合自己的水平上进步,并提升了学习体验的互动性和趣味性;
- 规划管理:包括智能升学生涯规划和智能职业生涯规划,通过大数据分析,从学生能力、学习偏好、学科水平、大学报考条件限制等维度帮助其进行选课、选科、选校等生涯规划。
iiMedia Research(艾媒咨询)数据显示,近七成的受访者比较看重智能学习机的AI 功能,超五成的受访者比较看重智能学习机学习资源,对小孩的意愿考虑程度较低。艾媒咨询分析师认为,智能学习机的智能程度和学习资源直接决定了小孩的知识接受度和学习效率,中国消费者普遍较为看重。
段建钢从家长的角度出发,希望AI-Pad能够提供一个安全可控、帮助孩子去探索和了解世界的渠道。“小朋友需要一个渠道理解世界,但是他们理解世界的方式和大人不太一样。可能小朋友文字能力不太行,我们就需要AI具备语言对话能力,针对有限的领域和知识集引导他们。另一方面,给家长提供一个参与和了解孩子探索过程的辅助能力。这些创新和应用需要新的软件、模型和算力,未来的AI-Pad如果能够满足这些需求,我觉得家长是愿意去支持的。”
从家长角度出发,希望AI-Pad有哪些功能呢?现场观众们给出的投票结果如下:
排名前三的分别是“自适应的学习计划”(17.42%)、“学习监测、反馈和建议”(14.39%)以及并列第三的“个性化的互动和参与感提升”(11.36%)、“作业与考试自动批改”(11.36%)。
大家对于AI-Pad的合理价位心理预期,投票结果如下:
2000元以内(20.59%),2000-5000元(64.71%),5000-10000元(14.71%),10000元以上(无)
RISC-V芯片何时可以在汽车上获得普遍采用?
2023 年 12 月 22 日,高通、博世、英飞凌、恩智浦、北欧半导体(Nordic)共同投资组建的专注于 RISC-V 生态的初创企业Quintauris正式获批。该公司总部位于德国慕尼黑,初期专注于为车用芯片,未来将扩大至包括手机及物联网等领域。
2024年6月24-28日,2024 RISC-V 欧洲峰会在德国慕尼黑举行,欧洲企业将RISC-V 视为欧洲芯片设计崛起的最好机遇,几乎每一个国家都在增加RISC-V 相关投入。同时,全球各大汽车半导体知名厂商在峰会上也表达了对RISC-V
上车的决心,英飞凌、博世、瑞萨、Quintauris 等企业介绍各自的产品进展与在汽车电子芯片领域的布局。
原本被认为只能在物联网等中低端领域发展的RISC-V,为何摇身一变,反而在汽车电子、服务器等高大上的领域频频发力?除了在成本上相较于x86和Arm的优势外,开放性和可扩展性更是被一众半导体大厂看好。
“汽车企业对RISC-V 的接受度如何?高端车规芯片到底应该是SoC 单芯片还是基于Chiplet的SiP?”戴伟民抛出了问题。
彭剑英分享了RISC-V在汽车电子领域的进展,特别是英飞凌等公司对RISC-V的投入。此前英飞凌的汽车芯片一直采用自研,但如今他们也投资了其他公司,从各种信息可以看到,其下一代ECU或车规平台就是基于定制化的RISC-V。
为什么英飞凌占据汽车半导体世界第一的位置,依然有决心投入RISC-V?大多数的人认为车对安全等的要求很高,而英飞凌又有积累的优势,为什么在RISC-V上车的早期去做这个投入?彭剑英认为,汽车电子行业以前相对封闭,而如今软件定义汽车芯片成为未来趋势,行业面临巨大转型。“之前大家追求的是性能,例如MCU从16位升级到32位,现在强调的是软件和AI。相比比消费电子,汽车电子迭代会晚一点,如今新能源汽车推动电气架构变化,如果不主动拥抱变化,会被市场抛弃。”
至于为什么选择RISC-V,因为RISC-V生态是一个开放的环境,可扩展性、可模块化适用于未来一颗芯片或整个汽车电子不同模块的芯片,都可以用同一个ISA、不同微架构实现的核心来统一满足需求。也就是说,软件生态只有一套,但是可以有不同的硬件实现来满足不同需求。
以汽车ECU为例,系统管理配备一个核心,计算、加速器配备1-4个核心,AI-ECU则可能会有N个核心。彭剑英表示,“对于RISC-V来说软件都是兼容的,这是巨大的优势。虽然车载ECU对CPU的性能不再是简单地对标MCU,但会考虑到一系列的覆盖问题,这就不仅仅是IP选型的问题,而是整个软件生态兼容性的问题。”
其实不仅是英飞凌,另一家头部汽车半导体厂商瑞萨也在尝试RISC-V项目研究。可以看出在汽车电子行业的大转型阶段,对RISC-V来说是巨大的机会。据介绍,芯来科技2021年开始做车规产品,从2021年9月到2023年7月份,公司的NA900成为全球首个获得ISO 26262 ASIL D认证的RISC-V CPU IP产品,后来NA300系列也拿到了认证。
“我们会有从车身控制、车规产品到高端的全系列产品和解决方案。” 彭剑英认为,“汽车电子的国产化,就是要从IP开始一直到汽车芯片、主机厂提供整套的自主可控方案。目前搭载芯来ASIL-B和ASIL-D IP的芯片,已经应用于国内、国际头部的激光雷达、毫米波雷达产品并量产。”
同时,基于Chiplet的解决方案在自动驾驶领域有着很大的应用潜力。第一代特斯拉FSD芯片,单颗只有36TOPS算力,如今已经来到500TOPS,未来可能需要更高的算力。汪志伟认为,为了满足汽车电子领域对算力的需求,Chiplet技术是一个可能的解决方案。
“芯原在这方面已经取得了进展,能够提供满足自动驾驶需求的解决方案。为了满足进一步的算力需求,我们跟RISC-V四大芯片厂中的两家都讨论过芯片切割的问题。要解决可靠性、散热、安全等问题,就要回到Chiplet上车的初衷是为了解决什么问题。” 汪志伟说道。
当前AI芯片面临适配神经网络,尤其在大模型LLaMA、推理方面有很多工作要做,而无论在边缘端还是车端,最紧迫的还是AI算力不足。汪志伟表示,拓展算力需要在芯片中再加上一颗NPU的Chiplet,由此可以带来300TOPS、500TOPS甚至1000TOPS的算力提升。“可能还要再加一个AI ISP的Chiplet,因为有些芯片的AI算力最多只能支持6路、8路摄像头的AI计算,但现在新能源车上摄像头越来越多,12路已经很普遍。所以我们现在认为,2颗-3颗Chiplet是针对自动驾驶比较现实可行的解决方案。”
在关于“RISC-V芯片何时可以在汽车上获得普遍采用?”的投票中,现场观众的意见如下:
3年以内(40.63%),3-5年(31.25%),5年以上(28.13%)
在“基于Chiplet的高端车规芯片预计何时会成为主流?”的投票中,现场观众的意见如下:
3年以内(6.9%),3-5年(41.38%),5-8年(44.83%),8年以上(6.9%)
圆桌论坛最后,戴伟民总结道,RISC-V用于AI-Pad,将来的市场不可限量,其关键在于Pad方案厂商要充分联合教育软件公司。如果这线上线下教育软件企业能够配合把软件生态做起来,AI-Pad才能真正做成智慧平板,而不是智障平板。在RISC-V汽车芯片方面,芯来科技的小MCU已经“上车”成功了,未来行业期待自动驾驶上的Chiplet方案能尽快得到推动。