鸣谢:特别感谢Imagination对本报告的支持!
2023年版Top 50 国产处理器厂商调研与市场分析报告涵盖CPU、GPU、FPGA、DSP和多媒体SoC等处理器芯片类别,分别从全球和中国市场趋势、处理器技术发展,以及国产处理器芯片行业现状的方面,对国际巨头和50家国产处理器厂商进行了全面而详尽的分析。
报告目录
一、CPU、GPU、FPGA市场综述
- 1.1 探讨CPU、GPU与FPGA的基础
- 1.2 国产CPU、GPU与FPGA的市场地位
二、主流处理器市场及技术
- 2.1 CPU市场新趋势
- 2.2 前沿CPU技术热点及转变
- 2.3 RISC-V架构CPU前瞻
- 2.4 CPU发展桎梏与GPU的崛起
- 2.5 GPU的弹性缩放与chiplet化
- 2.6 数据中心GPU探索与未来
- 2.7 FPGA市场需求的增长
三、国产CPU主要厂商及应用
- 3.1 国产CPU性能水平探讨
- 3.2 国产CPU主要厂商及应用市场
四、国产GPU主要厂商及应用
- 4.1 国产GPU的起点
- 4.2 GPU的生态问题
- 4.3 国产GPU主要厂商及应用市场
五、国产FPGA主要厂商及应用
- 5.1 中国FPGA市场现状及发展趋势
- 5.2 国产FPGA主要厂商及应用市场
六、国产处理器厂商汇编
- 6.1 2023中国IC设计Fabless100排行榜之Top 10国产处理器公司
- 6.2 50家国产处理器(CPU/GPU/FPGA/多媒体SoC)厂商调研统计分析
- 6.3 国产处理器厂商详细信息(核心技术/主要产品/关键应用/竞争力)
附录:参考来源
限于篇幅,本文仅挑选报告的重要部分展示。感兴趣的朋友可以点击链接以免费获取完整PDF版报告,或者扫描下面的二维码。
6月27号举行的Fabless100系列技术和应用直播 – GPU助力数据中心高性能计算和AI大模型的开发,将邀请来自IMG和清微智能的专家一起分享国产处理器行业现状和趋势,以及GPU在数据中心和AI方面的最新应用。
Part 1 CPU、GPU、FPGA市场综述
本报告探讨的CPU、GPU、FPGA芯片并不涵盖嵌入式市场与移动市场,而集中于桌面与数据中心应用,即HPC高性能计算市场。另,本报告主要探讨芯片设计(fabless)与IDM相关企业,虽会部分涉及上游的IP厂商(如CPU的Arm,GPU的Imagination),但这并非报告重点。
CPU市场方面,Counterpoint Research今年最新数据为[1],笔记本PC市场上,2022年全年Intel市场份额70%,AMD市场份额17.6%,Arm架构的CPU占据12.8%的市场——这其中有很大一部分还是被苹果M系列处理器所占据的。这表明,包括RISC-V架构的CPU、国产以及其他CPU在内的所有处理器,在PC市场上的份额都不会超过1%,毕竟这已经是个高度成熟的市场,且年出货量相对稳定。
而数据中心市场,2022年Intel CPU市场份额滑落至70.77%,AMD市场份额19.84%。[2]其余可被单独列出的供应商包括亚马逊自研CPU份额3.16%,还有一家知名的Arm架构CPU供应商Ampere Computing目前也有1.52%的份额在手;其他所有供应商的份额相加为4.71%。所以至少到目前为止,RISC-V架构CPU、国产CPU供应商的处理器产品,在数据中心的市场份额都可忽略不计。
GPU这一类别的处理器,本报告不探讨核显(eGPU/iGPU,这一市场的参与者典型有Intel、AMD、龙芯等)。基于独立GPU的探讨,桌面市场上,Jon Peddie Research的数据是2022年英伟达市场份额85%,AMD占据9%,新入市的Intel占比6% [3](via wccftech)。所有其他市场参与者的份额微不足道。
至于英伟达主场的数据中心,Khaveen Investements的数据为2022年英伟达的份额达到88%,其余的市场基本被AMD和Intel瓜分[4]。“其他”类别的市场参与者现有份额可能连0.1%都不到。只不过这个市场的增长空间仍然很大,且伴随其他专用芯片的市场价值挤占——绝大部分分析机构都认为,英伟达GPU在这部分的未来市场份额将会下降,即便基于市场价值来看,英伟达的业绩仍将持续增长。
FPGA的市场有其独特性,而且本报告探讨的芯片仅限高性能领域,或者高端市场。在高端市场Xilinx(AMD)和Altera(Intel)就是双寡头。虽然算上中低端市场以后,FPGA整体市场的分散程度是比CPU、GPU更高的,但AMD、Intel、Lattice显然就是这一市场的前三强,中国在这方面仍然非常薄弱。本报告仅会稍稍谈及FPGA,不会将其作为重点。
按照类型中国半导体的市场份额。 来源:Gartner
欲窥见国产CPU、GPU、FPGA几个类型的芯片在整个半导体行业的位置,可见Gartner去年发布的报告中,针对不同类型的半导体产品,目前中国的技术和市场水平如上图显示。
这张图的横轴表示2021年的市场营收综合,纵轴为市场份额,不同的点代表不同的半导体产品类型。某一个芯片类型的市场占比超过>10%才谈得上“有话语权”。其中几个技术含量非常高的芯片类型,GPU、FPGA、DRAM、MPU等都处在相当左下角的位置。不到1%的市场价值占比,也与Counterpoint的数据基本吻合。这就表明起码在这些芯片的市场位置上,中国仍然有很长的路要走。
Part 2 主流处理器市场及技术
国际CPU市场的有趣之处就在于,此前十余年,市场都没有太大变化,却在近5年发生了剧烈变化。从市场来看,主要表现为Intel在PC与数据中心市场的霸权地位,遭遇有史以来最为严重的挑战。Intel在CPU领域的市场份额从2018年以来持续走低,PC与数据中心市场皆如是。
CPU市场价值正被加速计算挤压。一般我们认为,CPU、GPU、FPGA、ASIC是不同类型的芯片,它们之间不存在直接的竞争关系。比如英伟达主要还是以销售GPU为主,即便有Grace CPU产品,但那也只用于AI HPC这个细分市场,而不是所有的数据中心;所以英伟达并不与Intel、AMD的CPU产品形成非常直接的竞争关系。
2020-2030年服务器价值占比变化。来源:ARK Investment [8]
但实际上,数据中心的加速计算需求正在逐步增加,而CPU在系统架构中的地位已经不像过去那么绝对。ARK Investment预测,2020至2030年,加速器在服务器内的价值会以21%的CAGR(年复合增长率)增长[8]。
预计2030年加速器的市场价值会达到410亿美元,CPU则为270亿(CAGR -1%),加速器显著压缩了CPU的市场空间。这也是Intel面临的压力之一,亦为Intel当前着力于布局XPU策略,大力发展CPU之外的加速器产品,包括GPU、AI芯片等组成部分的原因之一。
前沿CPU的技术热点及转变
在技术方面,我们总结了几个大方向。虽然国产CPU由于技术及地缘政治等因素,很多都不会应用最先进的制造工艺及周边技术,但总结当前主流市场的CPU技术发展方向,对于我们观察未来国产CPU技术发展方向仍然是有价值的。
Chiplet与先进封装
不止是数据中心大芯片,AMD实则于Zen架构普及之际,就开始在PC处理器上力推基于chiplet的CPU设计。而chiplet设计在民用市场的普及,也拉开了CPU核心大战的序幕。从最显而易见的层面来看,chiplet技术将大芯片“切分”成小die,则基于互联与存储一致性技术,便更利于CPU堆更多的核心。更不用提苹果在面向PC工作站设备时,打造M1/M2 Ultra芯片时选择了台积电InFO-LSI工艺。
今年4月份有消息说受制于美国的技术封锁,飞腾原计划应用7nm制造工艺的腾云S5000搁置,“B计划”的5000C会选择14nm工艺,并基于chiplet来实现多核构建[13]。虽然具体细节我们仍然不清楚,而且这是个缓解方案,但国产CPU大范围应用chiplet应当也只是时间问题。
未来几年,chiplet和先进封装将深刻改变CPU在高性能市场的应用。《电子工程专辑》2023年7月刊封面故事探讨了chiplet对于行业价值链的变革,未来IP供应商的角色都可能发生变化。
CPU的异构
Arm一直都有大小核,甚至大中小核设计的传统。在Arm尚未尝试高性能市场时,人们普遍相信包括PC在内的HPC应用不需要“小核心”。但苹果在Mac设备上采用完全继承自移动设备大小核设计的M系列芯片,以及Intel面向PC的12代酷睿处理器开始采用两种核心设计,就改写了HPC的这一历史。
有关“异构”的话题,在封装层面,PC CPU的更多加速器集成也已经发展好多年了——尤其苹果在思路上在一颗芯片上大量堆料,甚至包括媒体引擎的不计成本,可能是个典型代表。Intel和AMD的处理器产品,虽然也约定俗成地叫做“CPU”,但实质上也是继承了诸多加速器与各类单元的SoC。
而在苹果开始强调集成加速器的重要性之时,Intel和AMD也对应地有了动作。比如AMD的“大核显”概念,以及Intel在媒体引擎上的加强等等。
另外,随端侧AI推理重要性的加剧,PC也成为AI应用的对象之一。AI加速单元也必然在未来的PC CPU上发挥更大的作用。
SoC的更多加速单元集成理论上不会成为对性能有更高要求的数据中心的选择,不过有一个方向的数据中心是值得关注的。Tenstorrent之所以构建CPU团队,很大一部分原因在于他们期望自家的AI芯片能够搭配足够强的companion CPU,因为CPU在AI计算过程里也十分重要[12]。这种设计也是体现了异构集成的。
RISC-V架构CPU前瞻:将吃下数据中心市场
RISC-V的兴起,在很多人的概念里,应该是自嵌入市场而起。但实际上,在高性能计算市场,加速计算的重要性增强,则CPU与其配合的灵活性也变得重要。RISC-V指令集往高性能市场走,在我们看来是一定的。但RISC-V在高性能市场的发展,与Arm可能又将有着很大差异。
其实在2022年国内的滴水湖论坛上,赛昉科技就发布了“全球首款适合主流笔记本/mini-PC应用的RISC-V芯片” 昉·惊鸿8100(JH8100);而此前市面上也出现了基于平头哥TH1520的RISC-V笔记本。[14]
这里我们不探讨赛昉科技与平头哥作为IP供应商时,在市场中扮演的角色。但JH8100这样的芯片的确是桌面PC市场RISC-V的尝试。虽然我们对RISC-V于这一市场的发展暂时还不看好,但chiplet与异构集成技术的发展或许会改变这一点;而且桌面市场也未必是家用PC,还有涉及特定行业或网络安全的桌面领域。
另一方面,数据中心市场的情况就大不一样了。数据中心不同类别的应用,如果再泛化到网络设备,包括networking、存储、HPC、AI等,虽然软件栈依赖仍然不见得少,但对初创企业而言,解决好其中一两个应用市场与生态系统,就有机会将CPU产品做起来,那么企业就有机会存活。这也是亚马逊自研CPU能够快速部署到自家服务器上的重要原因,同样RISC-V也会有这样的机会。
目前我们看到在数据中心高性能领域,RISC-V架构方面有代表性的企业典型如平头哥、Ventana、Tenstorrent等。其中Tenstorrent的CEO是有着“硅仙人”之称、曾经在苹果、Intel、AMD等企业扮演重要角色的Jim Keller。即便RISC-V架构进驻HPC领域的企业大多都还相当年轻,这股力量中的许多新锐都是绝对不容小觑的。
RISC-V与Arm架构CPU在服务器市场的变化预测。来源:ARK Investment
ARK Investment的预测数据认为[8],Arm和RISC-V在云业务领域会取代x86架构。这家机构甚至在报告中提到,“Arm+RISC-V的组合所占据的服务器市场份额将从2020年的0,增加到2030年的71%。”我们认为71%这个数字还是有待商榷,但Arm和RISC-V在数据中心拿下更多市场也是板上钉钉的。
这里列举Ventana的例子:这家公司的RISC-V架构产品是完全面向服务器的。当前其Veyron V1核心可打造的CPU最高配为128核心。从其给出的第一方数据来看,性能水平是能够比肩AMD Genoa的;即便宣传数据掺水分,打八折来看其性能都仍然超过了Intel至强Ice Lake和刚刚出来没多久的Sapphaire Rapids。从单核性能角度,Veyron V1也比肩Arm Neoverse V系列。[15]
配合chiplet,像Ventana这样的公司是开启了新的业务模式。面向客户,Ventana主要提供的就是计算chiplet,而不是整颗芯片。对于下游客户而言,差异化的可能性会很大。比如客户可以专注于开发加速器,不需要在CPU上重复造轮子。在不同层级的灵活性上,RISC-V都有着x86和Arm现阶段很难达成的优势。当然这其中还涉及很多标准问题,比如chiplet的互联标准。
就这个角度来看,chiplet、先进封装、异构集成与RISC-V的灵活性有着天然的适配。有关chiplet与RISC-V将深刻变革半导体行业中IP授权模式这一可能的趋势,实则还有相当大的探讨余地。未来IP供应商的角色都可能因此发生很大变化,不过这并非本报告要探讨的重点。
于是RISC-V自然也成为未来国产CPU企业需要去考量的关键,或许在技术发展的过程里,RISC-V可达成的“自主可控”属性不过是附加价值罢了。
GPU的弹性缩放与chiplet化
从技术层面来看,这两年无论图形GPU,还是GPGPU,都有迁往chiplet的趋势,而且绝对不只是HBM存储部分应用的先进封装这么简单。
GPU作为现如今的大die芯片,是最理所应当转向chiplet的芯片类型。因为即便是应用于PC的游戏GPU,其单die尺寸都在逐步逼近光刻设备可处理的reticle limit[16]。AMD仍然是图形GPU方向上,最早愿意尝试chiplet方案的图形GPU厂商。实际上,在chiplet这个技术的转向上,GPU相比CPU的难度更大。AMD的RDNA 3架构GPU应用chiplet方案应该也是板上钉钉了[17]。
至于数据中心的通用加速GPU,转向chiplet也是主流市场参与者的一致选择。壁仞科技此前发布的首款GPU产品BR100即是将两片die藉由2.5D CoWoS封装到一起的方案,则整体尺寸达到了1000mm²的大规模。[18]
当代GPU架构设计上的另一个重点是可扩展性,但这一点可能从很早之前就成为趋势。而GPU架构的弹性缩放能力,也成为其应用于不同市场的关键,亦与未来更多GPU走向chiplet和先进封装息息相关。虽然IP并非本报告要探讨的重点,但从Imagination Technologies近代的GPU IP还是可以看出GPU的发展思路。
其IMG C系列GPU IP就开始更进一步地强调设计的模块化、层级化,通过一个架构的弹性化扩展,覆盖从手机到服务器的各类需求[20]。这其中的关键在于避免采用过于中心化的逻辑,以及复杂信号设计,而采用相对松散、去中心化的结构。这种设计对于硬件虚拟化,以及诸如汽车功能安全冗余设计,乃至chiplet之间的异步操作都有好处。
我们从准备做数据中心GPU的部分厂商走访中得知,他们都有相似的未来产品预设。GPU的chiplet化与此趋势应该是相辅相成的。
数据中心GPU的走向及市场份额
比较值得一提的是,英伟达近几代GPU产品越来越明确区分图形卡与数据中心加速卡的架构差异。换句话说现在用于HPC/AI的通用加速GPU,和用于游戏和专业视觉的图形GPU,在架构上的差别越来越大,而且不止是前者去掉图形单元这么简单。
比如英伟达最新的Hopper架构GPU,不仅有专门的Tensor核心(着力于AI计算),堆砌了显著多于图形卡的FP64管线,而且还专门加入了Transformer引擎——用于加速现在相当流行的AI“大模型”。从这个角度来看,GPU变得比以往任何时候都更专用了。[21]
若GPU作为一种可编程、更通用的加速器,抛开生态问题不谈,在执行某些特定的工作时,效率是不及部分牺牲通用性的AI芯片的。
就如Valuates Reports的数据中心加速器市场报告中提到的,GPU在2018年占到数据中心加速器市场整体的85%[22]。更为专用的AI芯片在GPU面前还没有做到很大的市场。另一则数据来自Omdia,如果将GPU也算在AI处理器门类,2021年英伟达GPU就占到全球AI处理器营收的80%以上,远超AMD、谷歌、Intel等市场参与者[23]。
FPGA市场需求的增长
FPGA高端市场不像前两者,整体保持高度稳定。而且FPGA也受惠于社会数字化转型大趋势。这一点从Xilinx被AMD收购之前,股票的变化情况可知。
从AMD去年Q4的季报来看,AMD的数据中心业务发展迅速,其中特别提到Xilinx的数据中心和networking产品创下了销售记录。本报告虽不探讨嵌入式应用,但Xilinx的收购实则也大幅拉高了AMD嵌入式业务的营收与营业毛利。
不过FPGA的问题在于其发展趋势基本依托半导体行业大盘涨跌,故表现为高度稳定,没有爆发性应用在短期内突出地拉高其市场价值——这一点就与GPU形成了鲜明对比。
所以FPGA的市场发展仅观察行业常规报告即可。涵盖高中低端全部市场,Global Market Insights的数据显示,FPGA市场2021年规模超过60亿美元,2022-2028的CAGR为12%[24]。AI和机器学习技术是当前市场增长的关键。
不同统计机构的数据量级基本类似,更加权威的Frost & Sullivan前两年的数据是2021年全球FPGA市场容量68.6亿美元,2021-2025的CAGR约在16.4%左右。
我们没有单纯应用于数据中心的高端FPGA市场相关数据。但从历史数据来看,FPGA高中低端市场发展基本同步——通信与数据中心仍是其发展的主力;汽车ADAS、IVI应用方向、5G技术发展以及设计平台与服务都会是推动力。只不过中低端市场的需求会比其高端市场更为旺盛。
FPGA在国内的发展会更多与通信、航天、军工关联。和CPU、GPU一样,这也是保障国家战略安全的重要组成部分。国产FPGA产品当前仍未能进入主流市场,与国际巨头是存在相当大差距的;大多是1000万门级以下的FPGA,主要分布在入门或终端市场上。
Part 3 国产CPU芯片市场及主要厂商
在市场之外要了解技术发展情况,我们来简单探讨处理器性能问题。不过需要明确一点:像CPU、GPU这类处理器产品,绝对性能固然重要,生态以及高层级的系统性能水平可能才是更重要的部分。只是这些问题或许还待更系统的研究才可做进一步的推论。
一般单核性能是考察CPU核心设计的基础,在单核性能的基础上才讨论更系统层面的多核性能或系统性能,最终囊括GPU这类加速器与DPU这样的多节点networking处理器,构成大规模集群的计算能力。
现阶段探讨国产芯片,即便是单核性能都还有非常大的发展空间。不过PC和服务器的考察重点是存在差异的,而部分国产CPU供应商只做服务器CPU,部分则还做桌面CPU,所以某些对象较难直接对比。
虽然目前暂时还没有非常系统的对比来衡量不同国产CPU的性能,而且国产CPU的技术透明度并不算高。但从不同企业对外宣布的信息,以及往上可以获取到的零散的评测数据,可以了解到一些基本事实。
在本报告讨论的CPU范畴内(即嵌入、移动都不在本报告讨论范围内,故紫光展锐等企业不会成为本报告的讨论对象;上游IP供应商也不纳入考量,则如作为IP供应商的平头哥、赛昉科技等企业不会成为讨论重点),国产CPU产品主要有龙芯、兆芯、海光、鲲鹏(海思)、飞腾、申威、倚天(平头哥)等。
这其中鲲鹏、倚天等市场参与者或应单独探讨,部分原因是它们完全面向数据中心服务器(但鲲鹏的情况可能存在特殊性)。因客观原因所致,鲲鹏已经停滞在了Armv8架构。就现有资料来看,鲲鹏920就核心层面性能水平当与Cortex-A76相似(或强于Cortex-A76)——实际与国际巨头的最新一代竞品存在一定差距,虽然它在国内仍出类拔萃。
而倚天710作为结合了行业上下游大成的作品,其发展起点与上述其他市场参与者还是存在较大差异。而且倚天710从架构层面来看,已经是Arm Neoverse的水平(尽管Neoverse N1实则也脱胎自Cortex-A76),SPECint2017达到440分的成绩也证明了其整体性能水平是绝对的第一梯队。5nm工艺与chiplet设计基本是享有了全球最先进的技术。从核心与互联IP,到制造与封装,倚天710都达到了数据中心服务器CPU顶尖水平。[25]
其余国产CPU产品中,可表现最强性能的恐怕就是海光了。这一点建基于海光获得了AMD Zen初代架构授权。而Zen架构,实际上是AMD近代走向成熟,并向Intel正式发起反攻的基础。即便AMD自己已经将Zen架构推进到了第四代,一代授权的意义仍然是相当大的。
所以海光现在的CPU产品,单核性能也依旧超过龙芯、飞腾、兆芯、申威等在内的国内竞争对手。14nm的海光CPU也因此可以认为是现阶段国产CPU的天花板(抛开倚天这样的产品不谈)。
从测试数据来看,海光旗舰级的7285处理器(32核新64线程,3.0GHz睿频,PCIe 3.0 x128,64MB L3 cache,8通道DDR4支持,双socket支持)大约和2020年Intel至强铂金系列主流CPU相似(强于Intel Xeon Platinum 8360HL,第三代至强处理器,14nm,24核、48线程,4.2GHz睿频,TDP 225W)。这便可给出国产CPU与国际竞品差距的参考。[26][27][41]
实际上龙芯的技术资料是相对更全面的,有兴趣的读者可以前往GitHub了解LoongArch架构更详细的信息[28]。我们认为,这可能是目前最能站在国产“自研”角度反映中国CPU设计水平的产品。
国外媒体Chips and Cheese评价龙芯3A5000已经达到了“合格”水平,cache与核心架构也做到了平衡,在部分测试中也得到了每周期相对合理的成绩,单核性能强于兆芯KX-6640MA和飞腾D2000;虽然仍旧和Intel、AMD相去较远;而且在主频方面过低(2.5GHz),从指令集和IP层面都达成更大程度的自主,达成这样的成绩也已经很难得。[29]
另外飞腾的自研核心(最新的是FTC663,兼容Armv8指令集),从此前公开的资料来看,应当也和Arm的公版IP差别较大,是真正走在了自己路子上的CPU产品。最新的飞腾腾云S2500服务器CPU,16nm工艺,总共64个FTC663处理器核心,2.1GHz主频,L2 cache 2MB/4-cores,64MB L3 cache,8个DDR4接口,TDP 150W[30]。
如前所述,飞腾前些年宣布的产品路线图上出现了S5000[31]。奈何美国技术封锁致计划被打乱。原本未来的FTC860核心单核性能提升50%,S5000最多128个核心扩展是能够带来国产CPU相当程度的飞跃的。未来我们需要观察飞腾新品的进一步动向。
从我们可以获取国产CPU应用于桌面客户端或PC的体验信息来看,抛开海光不谈,包括飞腾、龙芯在内的中国芯,结合开源生态的帮助和企业这些年生态的构建,用于办公已经绰绰有余。发烧友DIY市场,基于龙芯3A5000+景嘉微JM7系列GPU+统信UOS的体验也变得可用性很高,甚至能借助Wine来玩一玩早期的3D游戏。这就和早些年的情况就相当不同了。
国产CPU主要厂商及应用市场
至少在现阶段,国产CPU产品及参与者都还是明确的跟随者状态,未来的技术发展基本会沿袭主流市场参与者构建起的经验。这部分已经在2.2章节做了详细阐述。实际在CPU的尖端工艺和技术上,主流市场参与者的步子也基本是趋同的;包括Arm、RISC-V在步入这一市场之后。
不过基于地缘政治和半导体区域化大趋势的影响,在信息安全层面,国产CPU的向前迈进是坚定和必须的——这一点远不止是市场因素。所以国产CPU首先入主的就涵盖了军政、信创等市场。而民用与HPC/AI市场,国际巨头的CPU仍然有着不可替代的市场地位。
另外,实际在谈论CPU时,其软硬生态也理应作为探讨对象。包括软件方面的操作系统及各类应用支持;而硬件生态则在板级、系统级、OEM级支持及对应标准等构成。这些问题应当在专门的CPU报告中再做探讨。需要指出的是,虽然下列企业定位产品市场广泛,但大部分国产CPU厂商产品的市场主要都定位于军政、信创或其他有高安全性要求的市场;商用市场往往都不大。
Part 4 国产GPU芯片市场及主要厂商
除了如景嘉微这样较早加入到GPU战局的国产企业,近些年涌现的国产GPU和CPU的发展起点有显著差异,除了有强有力的IP支撑,以及数据中心GPU市场机遇崛起的时间点明显比较晚,中国国内的半导体产业链建设比过去完善;另外包括“大基金”在内的国家对于半导体行业的投入与各种优惠政策,致大量GPU与AI相关专业人才回流(典型如AMD系的一波人才回国创业),且其中的绝大部分都有多年的顶尖企业工作经验。
与此同时,GPU的微架构设计难度还是要低于CPU的,其难点更多地体现在物理及后续的生态构建层面。所以和CPU市场情况大不一样的是,很多GPU初创企业近些年都以较高的起点和姿态问世。就像壁仞科技发布首款产品,就直接对标英伟达Ampere架构GPU。虽然Ampere已经是英伟达的上代架构,但起点的确不可谓不高。
去年末,Jon Peddie Research的统计数据表明[32],全球已经有18家企业正在开发或制造GPU了,1.1章节已经探讨过其中原因。当然这个数据实则囊括了移动市场,以及上游的GPU IP企业。但即便不统计这些企业,目前来自PC和数据中心的市场玩家依然有11个,其中就包括了不少中国企业:壁仞、瀚博、天数智芯、芯动、沐曦、摩尔线程、登临等。
虽然壁仞科技因为诸多原因,产品问世可能还面临变数。但去年8月的发布会上发布的BR100产品,是将两片相同的die封装到一起(基于2.5D CoWoS-S),7nm制造工艺、770亿个晶体管、1000mm²尺寸,再配上64GB HBM2e内存。光从纸面参数来看,就已经相当豪华。[18]
壁仞科技在宣传中说,“创下全球(通用GPU芯片的)算力记录”“单芯片算力达到PFLOPS级别”“峰值算力是国际厂商在售旗舰产品3倍以上”。从壁仞科技给出的第一方数据来看,BR100对比的是英伟达上一代Ampere架构的A100,这里的“3倍以上”说的应该是其特别引入的TF32+数据格式相较于别家的TF32。但无论如何,这都是个很好的起点。
在图形GPU这边,若以摩尔线程MTT S80为例,这张卡的宣传点涵盖“业内首款PCIe Gen 5显卡”、16GB GDDR6显存、4路8K输出,功能覆盖了3D渲染、多媒体处理、物理仿真与科学计算、AI加速;标称的FP32算力为14.4TFLOPS,显存带宽448GB/s;TDP 255W。[33]
实际从硬件参数来看,这张卡用于消费端的主流桌面市场已经不成问题了,而且对DirectX、Vulkan等都有支持(虽然是DirectX 11)。虽然在生态方面(如驱动质量),对硬件资源的利用率还是很低下——但要知道连Intel初入市场的表现都不是很好,摩尔线程在图形GPU市场依旧大有可为。另外比较难得的是,摩尔线程的图形显卡发布后就在京东销售,接受的也是来自消费端市场的考验。
不过在市场定位上,在更追求全链条的“自主化”程度上,国产GPU面临的问题仍然和国产CPU相似。情况就并不见得乐观了。
在更进一步解决自主可控问题上,这一市场的代表应该是景嘉微。从这个角度来看,国产GPU与英伟达/AMD巨头的差距仍然是不小的,至少图形卡市场是如此。从景嘉微去年发布的JM9系列产品资料来看,媒体报道是“看齐英伟达GeForce GTX 1050”。景嘉微的市场主要在军工和信创方向。
实则从营收的角度也能看出国内GPU企业和国外企业间的差距。国内GPU龙头的景嘉微2022年全年营收11.54亿元人民币,较2021年增长5.56%;而英伟达同期(即英伟达的2023财年)营收269.7亿美元(与上一财年基本持平),差距还是不可谓不大的。虽然这一点就前述全球市场份额来看,是完全不让人惊讶的。
GPU的生态问题
加速器生态问题的本质都在于,包括GPU在内的加速器资源获取,并不是软件层不相关的:即并非某个程序期望加速器来帮助计算,加速器就立刻参与计算了。这其中需要不同层级软件的支持,涵盖驱动、中间件、库和上层应用等组成部分。
以主流图形生态为例,显卡若要对现有3D游戏做出支持,则至少需要对接DirectX、Vulkan等主流API;与此同时,成熟的图形渲染市场各类中间件、加速库、游戏引擎等组成部分,包括代码优化都与底层硬件架构有着很大的关系。这也是为何Intel、摩尔线程等参与者初期在桌面显卡市场要立住脚跟困难巨大的原因。
另外,当代图形计算市场出现了诸多新型技术,如光线追踪、AI超分(super sampling)等——这些同样需要付出巨大努力获得生态支持。英伟达在这些技术上具备先发优势,基于市场统治地位也有相当的标准制定话语权;AMD则有游戏主机生态作为后备。国内市场参与者莫说这些特性在硬件层面都仍未做出支持,开发生态就连八字都没一撇。
而在数据中心、HPC、AI加速卡市场,英伟达的生态构建水平,几乎与其他所有竞争对手都不在一个次元。从底层硬件,到系统软件和加速库,到平台层及上层应用,这种端到端的积累绝非一朝一夕可及。不谈AI方向英伟达在预训练模型、模型训练工具、部署方式、在不同应用市场的覆盖,单说HPC领域:各类科学计算加速库,一些冷门、小众的领域,英伟达甚至都会触达,并在投入软件开发资源以后,轻易占领市场。
国产GPU主要厂商及应用市场
值得一提的是,在图形GPU市场,尤其桌面领域,部分市场玩家也有对应的图形加速器产品,但是以iGPU/eGPU的方式与CPU集成到了一起。近些年,Intel、AMD与苹果这样的巨头,也正尝试加大处理器SoC上的GPU资源配比,尤其AMD提出了“大核显”的概念,苹果更是不惜成本在大面积的一颗芯片上堆足GPU用料,宣传还喊出性能堪比英伟达旗舰GPU的口号。
这种发展方向源于移动市场的高集成度思路——原本它与桌面市场的路线并不契合。但它的确可能成为未来桌面客户端发展的重要路径。国内如龙芯在内的部分CPU厂商也在做集成GPU。但这不在本报告的探讨范围内。而且GPU的高度集成化也不会成为数据中心市场的发展方向。
另外就GPU这个门类值得一提的是,更多应用场景对图形渲染产生了需求,比如说汽车——而且汽车还需要AI,不仅是车内的边缘AI,还在用于训练自动驾驶或数字座舱自动化模型的云上服务器(虽然这仍是数据中心GPU需求),所以汽车未来有机会成为GPU发展的重要市场——英伟达这两年就已经在做积极布局,英伟达CEO黄仁勋说这是下一个有着百亿美元机会的市场[36]。
去年末,Jon Peddie Research的统计数据表明[32],全球已经有18家企业正在开发或制造GPU了。当然这个数据实则囊括了移动市场,以及上游的GPU IP企业。但即便不统计这些企业,目前来自PC和数据中心的市场玩家依然有11个,其中就包括了不少中国企业:壁仞、瀚博、天数智芯、芯动、沐曦、摩尔线程、登临等。
Part 5 国产FPGA芯片市场及主要厂商
有关FPGA本身的技术发展方向,本文未多做着墨。在我们看来,FPGA的发展是反映半导体行业全局平均水平的。包括FPGA走向chiplet,更高的I/O速率支持,以及将其与其他处理器达成异构融合架构,甚至包括在一块芯片上集成FPGA、ASIC、CPU等各种资源——这些反映的其实是整个行业的大局。
人工智能兴起的这波浪潮,的确也惠及了FPGA,但并没有像GPU那样给FPGA/PLD这一门类的芯片带来爆发式增长。FPGA整体是随着半导体行业热潮上下起伏的,所以它本身相对整个行业都比较平稳。这都表现出了FPGA这类型芯片市场的高度成熟。2.7章节已经对FPGA市场做了大致的介绍。
而Intel和AMD相继收购FPGA巨擘实则也能说明这个市场是不可或缺的,Intel最早提出的XPU策略就将FPGA作为重要的加速器类型涵盖其中。未来Xilinx的FPGA在AMD的其他处理产品上或许还会有新的价值产生,。
目前有关FPGA的统计数据都不够新,Frost & Sullivan前两年的报告给出的数据是,2020年中国FPGA市场规模150.3亿元,应用结构占比,32%在工业领域,41%在通信领域,11%为数据中心,6%汽车电子,6%消费电子,4%人工智能。这个数据在2023年的当下恐怕会发生比较大的变化,包括汽车电子、人工智能这两年的发展都显著快于前些年。
2020年中国FPGA应用结构占比。数据来源:Frost&Sullivan
至少在前两年,安路科技上市之际的招股书上,提到中国FPGA芯片市场竞争格局,37%归属于Xilinx(AMD),25%归属于Altera(Intel),23%属于Lattice——也就是说这三家巨擘拿下了中国FPGA 85%的市场;现阶段中高端FPGA芯片要进入主流仍然有距离。[37]
从制造工艺的角度来看,Xilinx的主流工艺已经在16nm的Ultrascale+系列聚合,7nm工艺上也有量产的Versal芯片产品。安路科技作为国产FPGA市场表现出色的企业,完成了28nm制程FPGA量产,且开展了FinFET工艺产品预研——这在国产FPGA芯片市场应该是比较具有代表性的。Altera和Xilinx大约是在2010年开始28nm之战的。Frost & Sullivan的数据显示,FPGA国产化率目前不到5%,未来有着很大的发展空间。
不过以安路科技为代表的国产FPGA企业营收增长迅速,安路科技也表示准备在中高端市场有所作为。从安路科技近两年的年报可知,安路科技FPGA产品2020年营收约在2.74亿元人民币,2021年营收6.42亿元人民币,2022年营收9.89亿元人民币(图x,注:安路科技的业务不仅包含FPGA),当属国内行业内的佼佼者了。
虽然从绝对量来看尚无法与Xilinx这样的竞争对手比较,但这条增长曲线,是比国内FPGA整体市场价值CAGR要更快的;紫光同创、复旦微电的情况也基本类似。这表明国产FPGA正在加速占领国内市场。
与此同时FPGA的重要性和CPU、GPU一样,需要被上升到国家与信息安全的高度。比如说FPGA被广泛应用于航空航天、军事国防等领域,像是军用电子设备,九成都需要FPGA:在一个相控阵雷达阵列里,每一个发射和接收单元都需要FPGA进行信号处理;导弹、战斗机、卫星等设备也需要FPGA进行信号处理和姿态控制等工作;更不用说FPGA也是芯片设计与制造过程中的重要组成部分…
虽然本报告主要关注的是高性能计算市场,但如前所述,国产FPGA尚无力全面在高端市场立足。故FPGA部分的企业列举将不局限于高性能计算。另外下面的资料也不会涉及这些企业的设计软件相关资源——即便这对FPGA企业而言同样非常重要。
国产FPGA芯片主要厂商及应用市场
国内FPGA企业或机构有紫光同创、复旦微电、成都华微电子、中电科58所、航天772所、京微齐力、高云半导体、安路科技、西安智多晶微电子、遨格芯等。
Part 6 国产处理器厂商汇编
2023中国IC设计Fabless100排行榜之Top 10国产处理器公司
入选公司基本信息
50家国产处理器(CPU/GPU/FPGA/多媒体SoC)厂商调研统计分析
AspenCore分析师团队通过市场调研和厂商访谈,大致按CPU、GPU、FPGA、多媒体SoC和DSP等分类,搜集汇总出具有一定实力的Top 50国产处理器芯片厂商。
从以上表格数据可以看出,国产CPU厂商共有13家,除了龙科中心和海光信息等传统CPU公司外,最近几年还出现了以Arm架构为主的服务器CPU初创公司,比如鸿钧微、此芯科技和遇贤微电子等;GPU芯片厂商共有11家,除了景嘉微等以图形渲染为主的CPU芯片供应商外,还有多家以GPGPU和AI加速为主要应用的GPU初创公司;FPGA公司也有11家;DSP芯片厂商有5家,大都以音频信号处理为主;以视频处理为主的多媒体SoC芯片厂商有10家,涉及应用处理器、视频处理器、网络安全处理器等。
国产处理器厂商详细信息(核心技术/主要产品/关键应用/竞争力)
下面我们将从核心技术、主要产品、关键应用和竞争力等方面对这50家公司逐一展示。
中天恒星
- 核心技术:自主GPU架构“天狼星”,支持海量并行线程的统一图形处理架构
- 主要产品:基于“天狼星”GPU架构的AI系列GPU芯片及相关软件和算法
- 关键应用:个人计算机、智慧屏、云端渲染;图形图像终端、虚拟混合现实、元宇宙、数据计算中心
- 竞争力:“天狼星”GPU架构拥有完全自主知识产权,以清华大学超过10年研究基础为依托的自研核心架构,确保产品迭代自主可控;以独立显卡GPU芯片主流产品为突破口;完备的交付能力,上下游产业链准备充分,确保产品量产自主可控。
砺算科技
- 核心技术:砺算自研架构、自主开发、自有知识产权的盘古架构、天图TrueGPU、AI Powered GPU
- 主要产品:天图TrueGPU
- 关键应用:用于从端+云+边的高性能图形渲染
- 竞争力:完成过亿元Pre-A轮融资,研发自有知识产权的国产GPU芯片,覆盖“端+云+边”全域,在显示加速、游戏电竞、数字孪生、元宇宙、VR/AR、超高清视频以及高性能计算、专业设计等多个领域为合作伙伴提供高性能的软硬件解决方案。
限于篇幅,本文仅挑选报告的重要部分展示。感兴趣的朋友可以点击链接以免费获取完整PDF版报告,或者扫描下面的二维码。