作为本系列文章的开篇,本文首先需要定义一下什么是“AI芯片”。因为实际上,当代的数字芯片中,MCU也能够在指令集层面做AI加速,如Arm Helium技术——有MCU企业推出了对应的芯片产品,且应用到嵌入式领域的轻度AI加速。
而且至少到目前为止,CPU仍然是市场上最重要的做AI计算的芯片类型。所以我们常规的fabless行研呈现——AI芯片研究部分,必须缩限“AI芯片”的定义。那么我们势必要找个参考系。
今年8月,证监会官网消息上海燧原科技股份有限公司在上海证监局办理上市辅导备案,由中金作为辅导机构,启动其A股IPO。很多媒体说,如果燧原科技成功上市将成为“AI芯片第二股”——第一股说的自然是已经在2020年上市的寒武纪。
换句话说,在常规认知里“AI芯片”也存在局限。参考Aspencore Fabless 100行业分析报告系列,去年的AI芯片报告对60家国产AI芯片企业进行了汇总。我们统计的这60家企业中,已经上市的至少包括有寒武纪、北京君正、全志科技。那么为什么还说燧原科技是“AI芯片第二股”,而不是第四、第五股呢?
北京君正这两年在宣传中提到“普惠AI视频处理器”,包括其T系列、A系列产品。典型如T41,INT8算力1.2TOPS,面向视频处理。而全志科技——基于我们去年的采访,这家公司也在近两年宣传AI芯片,聚焦在AI语音与AI视觉,已上市的AI芯片产品NPU算力2-3TOPS,规划中的也有6-8TOPS算力产品。
常规认知之所以不将这两家公司视作“AI芯片公司”,可能一方面在于这两家企业的业务范围并不单纯在AI芯片上;另一方面则在于嵌入式应用+片上加入小规模AI加速单元,或许在大多数人看来只是既有应用的AI扩展。
他们不像燧原科技或寒武纪那样,有如此明确的AI标签。我们的讨论,也将主要集中在专门的AI加速器芯片之上,且偏向于高算力(本系列报告若长期延续,我们将在后续的系列文章里做出更明确的定义)。
与国际大厂的差距
国内外不少AI芯片企业,通常在其AI芯片发布会上——主要是面向数据中心(包括边缘数据中心)的AI芯片(包括GPU)——总是倾向于将其芯片算力、效率,与英伟达竞品做对比,以表现其技术优势。
既然要了解国产AI芯片企业现状,那么首先就必须搞清楚这些企业与国际一线大厂之间的差距。直接的技术对比或很难成行,所以不妨用财务数据做个简单、粗暴的比较——即便这可能对初创企业而言仍是不公平的。
既然“第二股”还没有完成IPO,那么就看看“第一股”寒武纪的情况。另外还有个我们认为可代表当前诸多国产AI芯片现状的企业:思必驰科技股份有限公司。这家公司曾在去年年中冲击IPO,但最终未能成功。
中科寒武纪科技股份有限公司今年8月底公布2024年半年度报告(2024年1月1日至2024年6月30日)。今年上半年其营业收入6476.53万元人民币,较去年同期缩减43.42%;扣非净利润约-6.09亿元人民币。
我们知道半导体行业有其周期性,企业的营收与利润会受到市场大环境的影响。故此处还统计了寒武纪自上市以来每个季度的营收与扣非净利润变化情况,具体如下图:
我们认为,寒武纪的营收与扣非净利润变化是能够反映国产AI芯片市场参与者的整体情况的:虽然各企业的营收数字量级未必相同,但营收存在不确定性,亏损现状暂无改善迹象,可能是广泛存在的。不过或许因为统计周期较短,趋势反映情况并不明晰:这家公司2020-2023年度营收的变化分别是+3.38%、+57.12%、+1.11%、-2.7%。
如果说寒武纪一家的情况不能说明问题,那么思必驰此前冲击IPO之时公开的招股书更说明这一现状。当时的招股书显示,思必驰2020-2022年的营业收入分别为2.37亿元、3.07亿元、4.23亿元人民币,虽然在量级上与寒武纪有差距,但同比增长趋势放缓也很明确。
而且这家公司2020-2022年净利润分别是-2.15亿、-3.35亿、-2.97亿元人民币——总体反映的情况和寒武纪是类似的。
这两家公司的支出大头都在研发费用上。寒武纪2019-2023的研发费用分别是5.43亿、7.68亿、11.36亿、15.23亿、11.18亿元人民币。反映到营收上,研发费用占到营收的比例分别是122%、167%、158%、209%、158%。
思必驰没有这么夸张,但其2020-2022的研发费用在营收中的占比也分别达到了86.3%、93.3%、74.0%。这对任何半导体领域的企业而言,都是绝对的高占比。
一方面说明了国内的AI芯片企业,即便是思必驰、寒武纪这些相对老牌和公认具备实力的企业,现阶段仍然处在疯狂烧钱阶段;另一方面也说明AI技术的新生和高速发展属性:体现在市场参与者众多、初创企业扎堆、大多处在初期高投入阶段、即便是头部也不例外的现状。
作为对比,可以看看AI芯片领域全球头部的英伟达目前的营收规模、利润和研发投入情况。英伟达FY2024(截至2024年2月28日的过去1年)财年年度营收609亿美元——营收量级相对国内企业是没有任何可比性的。
即便我们只看英伟达Q4’FY24一个季度,仅数据中心业务的营收也有184亿美元(该业务全年营收475亿美元)。然后还可以看看英伟达的R&D投入——其FY24年度R&D投入86.75亿美元,Q4一个季度的R&D投入就有24.65亿美元。
《国际电子商情》2021年10月刊封面故事统计的英伟达营收与净利润变化趋势
可能部分读者会认为英伟达毕竟是家GPU企业,数据中心业务也并不单纯在AI方向,又是行业头部,没什么可比性。那么我们也可以选择目前在AI HPC计算市场上表现并不理想、且加速计算入局较晚的Intel做比较。
前两年,Intel还将加速与图形计算单独划分为一个业务部门(Accelerated Computing Systems and Graphics,AXG)做业绩结算。该业务2022 Q4的营收为2.47亿美元,AXG业务于2022的年度总营收8.37亿美元——虽然营业收入处在亏损状态倒也反映了相同的市场状况…(在此财季以后,AXG业务的不同组成部分归并到了Intel的其他业务中,所以无法再获得后续数据)
总的来说,即便不看技术层面,从财务数据也能看出中国AI芯片企业与国际巨头之间存在的量级差距。
市场潜力巨大,但不确定性多了一筹
过去两年《国际电子商情》与《电子工程专辑》杂志/书刊的封面故事/系列文章中,提及AI芯片的篇章多番展望了AI的市场机会。如《与AI有关的芯事——生成式AI时代的角力》。
市场价值规模之类的数据普通人很难有量级感知。对于AI芯片的市场潜在机会,这里提供两个更容易感知的事实:
行业分析师和业内人士原本普遍认为,半导体市场价值会在2030年突破1万亿美元;但因为2019年生成式AI技术爆发并高速发展,诸多咨询与研究机构将行业突破万亿的时间点前移了(例如IBS认为2028年就能达成该值)。
另一个可反映AI市场潜力的事件是,今年初华尔街日报报道Sam Altman可能针对潜在AI芯片需求筹集5万亿-7万亿美元。虽然Sam Altman(OpenAI CEO)并未就此做出正面回应,但他的确在自己的推特上提到了“世界需要更多的AI基础设施,fab产能、数据、数据中心等等,比人们现在建的更多”。
今年的Intel Foundry活动上,Pat Gelsinger(Intel CEO)与Sam Altman对话也调侃式地提到了“7万亿美元”计划。这两位半导体行业内的关键人物都在本次对话中提到,并不清楚对于潜在AI需求还需要投入多少基础设施成本;
但Pat Gelsinger的说法是:“3年以前,生成式AI还没爆发,普遍预测是半导体行业会增长至1万亿美元。当时甚至还有一些分析师对这个数字持怀疑态度,认为1万亿太过激进。现在再看看生成式AI,应该不会有人再认为万亿级别有多夸张。甚至很多人还会认为这是低估了行业的发展。”
所以国际市场上,头部AI市场参与者,无论是芯片企业还是模型、技术、解决方案供应商大部分这一年都在投资核电基础设施建设。这都表明了行业参与者对于包括AI芯片在内的AI基础基建有着十分激进的增长预期,且可能远超我们对半导体行业的想象——无论其发展是否也将存在泡沫,并遭遇潜在的思科时刻。
呈现上述信息是为了表明,AI芯片的潜在发展空间还非常大。这也更能说明寒武纪、思必驰现阶段经历的合理性。与此同时,还有个业界共识是不可忽视的:即便现阶段在AI芯片领域内,英伟达仍然一家独大,这种局面不会长期维持;或者至少可以认为,英伟达一家吃不下这么大的市场,会出现更有力的潜在竞争者。
本文不对AI芯片技术问题做深入挖掘,不过在很多人认知的“英伟达生态优势不可撼动”这一根本点上,这里做个简单的解释。一方面,即便加速和专用计算这些年正全面铺开,但从市场保有量的角度来看,CPU仍然是很重要的AI处理器类型(虽然这不在本系列研究报告的讨论范围内)。
另一方面,AI发展早期“CUDA护城河”形成AI加速器领域的碾压优势是客观存在的,包括推理和训练两方面。但现阶段很多流行的AI模型框架开始提供更多样化的后端支持;同时AI这条链路上不同层级的参与者都在尝试“去CUDA化”,无论是Triton的存在,还是类似OpenAI打算自己造AI芯片这样的传言。
所以我们认为,英伟达虽然仍在企业AI解决方案与服务的易用性、性能方面暂时远高于其他竞争对手,但已经不再是“不可撼动”的。毕竟不止是国内AI芯片及生态参与者,就连国外的参与者也不希望英伟达一家独大。
回到国内,原本在去年美国停止向中国提供英伟达等公司的先进AI芯片以后,国产AI芯片理应迎来更多的发展机会,也利好国内的AI HPC芯片企业与生态发展。
寒武纪5年股票走势变化;来源:Google
所以如果我们观察寒武纪的股票走势,还是能够发现市场对于这家企业的发展信心的,尤其是从2023年下半年开始。只不过近期这一向好的局势又有了新变数。
最近国内外媒体普遍报道,美国商务部致函台积电,从11月11日起开始对运往大陆的某些7nm或需要更先进工艺的复杂芯片实施出口限制,主要是AI与GPU。这对国内AI芯片的发展无疑又是个巨大的坏消息,也将影响一众AI芯片初创企业的发展。
目前我们获悉的信息仍然不多,仅知本次限制针对的就是先进制造工艺的AI芯片——有行业分析师认为,不在实体清单上、专用于推理的AI芯片可能不会受到影响,但显然AI训练芯片的境况就相当糟糕了。
仅从≤7nm工艺的角度来看,Aspencore 2024中国IC设计Fabless 100排行榜的TOP 10 AI芯片公司里,可能受到影响的企业包括寒武纪、瀚博半导体、壁仞科技、黑芝麻。
另外不在这份榜单上,但受到影响的至少还有华为海思(昇腾)、燧原科技、沐曦、天数智芯、摩尔线程、地平线等。燧原科技与寒武纪是在我们看来,于这波竞争中面临压力最大的两家企业。
百花齐放的局面在持续,新技术也在推进中
绝大部分边缘与端侧AI芯片并不采用先进或尖端半导体制造工艺,所以此前Aspencore统计的60家国产AI芯片企业,大部分不会受到影响。
此处再行给出这份名单。受限于时间,我们未能对这60家企业的所有产品与技术做深入和更新,尤其是相对更为碎片化、同时竞争也很激烈的边缘与端侧AI推理芯片,包括应用于汽车ADAS与座舱的AI芯片。
边缘与端侧市场相比HPC AI又是另一番景象。在未来的系列文章或报告中,我们将对其中重要参与者的企业融资、产品与技术特色、生态发展与应用落地情况等做逐一研究与呈现。
另外值得一提的是,AI芯片领域能看到两个可能在未来将发挥关键作用的新技术:存内计算与光通信/计算。
以亿铸科技预备推向市场的存算一体AI大算力芯片为例,基于ReRAM打造的“全数字存算一体芯片”。关注存算一体或存内计算技术的读者应该了解,这类技术的核心理念是解决传统冯诺依曼体系的存储墙问题;基于存储器基础结构,在“存内”做计算,大幅减少数据通信开销。
这类方案格外适用于高并行度需求的AI计算,所以市场上也涌现了包含亿铸在内的不少企业准备借助AI的东风大力发展此类可能具备市场潜力的芯片架构。据说这类架构还有个关键优势,即在性能、功耗表现上,以成熟制造工艺比肩基于先进工艺的冯诺依曼架构传统芯片。
亿铸去年表示点亮了基于ReRAM的存算一体AI大算力PoC芯片。今年的采访中,亿铸表示其实际表现“远超竞争对手”,芯片量产“处于设计冲刺阶段”。
光通信/计算技术方面,国产AI芯片中比较具有代表性的产品来自曦智科技。其OptiHummingBird推理卡是一款基于片上光网络的AI推理卡——其中的核心计算系统采用先进封装,将硅光芯片与微电子芯片通过中介层进行垂直封装。硅光芯片有U型片上光网络,数据通过U型波导传输,能够实现电芯片之上64个计算核之间的all-to-all全通道互联。
今年WAIC世界人工智能大会上,曦智科技也展示了光子计算评估板,其中的光芯片可编程,旨在挖掘潜在应用,据说是目前已知精度最高的光芯片;另外还展示了PACE光子计算处理器和片间光互联解决方案等产品。
实际上硅光芯片也是国外AI芯片企业,尤其是HPC AI领域内的国际大厂正在做前沿研究的关键技术。现阶段,其商业化目标也主要着眼在缓解存储和通信墙问题——尤其在生成式AI大模型涉及跨芯片、跨板卡、跨节点通信和计算的当下。
在fabless行研AI处理器系列文章的未来篇章中,我们还将追踪去全球化大潮之下AI芯片市场的发展变数,就AI芯片技术与市场做更深入的探讨,尤其是本文涉及不多的边缘与端侧AI芯片,包括汽车ADAS与座舱芯片。
相关阅读:
2023年TOP50 国产处理器(CPU/GPU/FPGA/DSP/多媒体SoC)厂商调研与市场分析报告
AspenCore 2024中国IC设计Fabless100排行榜