现今的半导体产业中可以观察到几个有趣的趋势。一方面,采用最先进工艺的系统单芯片(SoC)不论开发和生产成本都越来越昂贵;另一方面,尽管成本更高,越来越多公司为了与竞争对手区隔,开始选择设计自己的SoC。对于标准化CPU与SoC的制造商(如AMD、Intel、Qualcomm)来说,这个趋势并不有利。但对于其他产业参与者,如EDA软件开发商、IP公司、芯片设计公司,以及晶圆厂来说,却大有好处。
目前带动微电子(microelectronics)发展的几个重大的全球趋势,包含5G、边缘计算(换言之,互连设备的爆发性成长)、自动驾驶与软件定义汽车(SDV)、人工智能(AI)、云端计算,以及高性能计算(HPC)。
AI、云端计算,以及HPC等类似应用绝不会嫌性能太高。它们的瓶颈往往是在数据中心的空间与功耗限制,而非硬件本身的成本。而即便是边缘计算设备,或是自动驾驶与软件定义汽车,也有不少可以善用更多计算性能的空间。但除了功耗和空间以外,它们还会受到更多的成本限制(亦即可使用的芯片数量与芯片大小)。
AWS Graviton 2处理器。
(来源:AWS)
AI、汽车、云端计算、边缘计算,以及HPC。这些虽然是非常不同的应用,但它们都可以透过广泛供应的现成芯片来处理。但另一方面,针对特定工作量身订制的芯片,才能够在更佳的成本与功耗效率下,达到性能或功能上的需求。
Arm基础架构业务线产品解决方案部门VP Dermot O'Driscoll表示:“越来越多公司已经发现,一体适用的解决方案不再能满足他们的计算需求。因此,他们开始探索定制化的SoC专案,确保他们能为对的应用提供适当的计算能力。”
此外,知识产权(IP)保护、功能差异化、设计灵活性,以及供应稳定性等因素比以往都更加重要。这促使了越来越多公司(无论是老牌公司或新创公司)开始研发自家的SoC,或直接向芯片代工厂订购。
“确实有越来越多公司开始自行设计芯片。”Ansys技术长暨工程模拟与EDA软件开发员Christophe Bianchi表示,“定制化芯片的趋势在北美特别明显,但在EMEA以及亚太地区也可以看到变化。”
“定制化SoC代表的是一个整合你所有独特差异化技术的专属解决方案,别人难以复制。”英国芯片设计代工公司Sondrel创办人暨执行长Graham Curren说,“它是芯片既有的一部分,因此等同于保护了公司的知识产权。此外,因为是量身打造,不论在功耗、性能,以及体积方面都能精准地符合任务需求。”
苹果M2 Ultra处理器。
(来源:Apple)
苹果是尝试设计自家SoC的成功案例。从智能手机开始,发展到个人电脑,并最终获得了巨大的好处。
最初,在2000年代后期,苹果先向三星(Samsung)要求在iPhone的处理器中导入一些苹果定制化的技术,随后他们快速地建立起了自家的芯片开发团队,并开始设计高度复杂的移动SoC,其中包含了定制化的CPU微架构与加速器。这为苹果旗下的iPhone、iPad、Apple TV电视盒等产品增加了额外的价值。近年来,苹果开始为旗下的个人电脑打造SoC,并同样导入了各种定制化技术,进一步降低功耗、延长电池寿命,并为高需求应用程式提供更高的性能。
O'Driscoll说:“设计定制化SoC的几个主要目的包含导入特定用途的加速器、导入独特的系统或封装空间设计,或是通过垂直整合最佳化成本。”
苹果M系列SoC为公司实现了庞大的利益。2019年第一季,苹果个人电脑的市占率还只有6.4% (约售出379万台),但到了2022年第一季已成长到9.3% (约售出732万台)。苹果在2022财年上的研发支出为262.51亿美元(2019财年为162.17亿美元),而这个庞大的金额主要就是用在芯片开发。
在过去,只有像IBM、Cisco和Sun (现在的Oracle)这些收益庞大的公司才有能力设计自己的芯片。苹果向全世界展示了消费性电子SoC的潜能,华为(Huawei)与三星等公司也陆续仿效。
到2010年代中期,互联网巨头的规模与获利也已够庞大,可以设计自家的芯片。然而到了今天,汽车制造商也开始走上了苹果的路线。
“近年来,自行设计芯片的公司数量急剧成长。”TechInsights副总裁Dan Hutchenson指出,“原先,这个作法被视为只是旧时代自产ASIC趋势自然的演变结果。当时IBM、Amdahl、Cisco和Sun都开始采用无晶圆厂/委外代工的生产模式。但苹果的涉入,快速地颠覆了整个移动应用处理器的产业。到了2015年,Google、Meta、亚马逊(Amazon)、百度(Baidu)和特斯拉(Tesla)等公司都已经开始设计自家的芯片。随后,创投家开始资助AI与新能源的新创公司。从2021年开始,全球主要的汽车制造商也开始设计自家的芯片。”
Hyperscalers引领产业
目前,苹果是唯一一间设计自家处理器的大规模个人电脑制造商。相较于苹果对于旗下的MacOS拥有完全的掌控权,一般个人电脑制造商对于Windows的开发不具有明显的影响力。当他们的成功与否必须取决于微软(Microsoft)的支持,自然就对开发SoC兴趣缺缺。
不同于个人电脑制造商,超大规模数据中心企业(Hyperscaler)对于硬件和软件都有接近完全的掌控力,因此非常适合开发自己专属的SoC。
Bianchi说:“定制化芯片初期最大的推动因素,就是来自超大规模数据中心企业对AI,以及云端计算的庞大需求。”
Google数据中心。
(来源:Google)
Google提供不少世界上最受欢迎的网络服务,并采用多元化的定制化芯片策略推动其数据中心,包含了运用张量处理单元(TPU)加速AI训练与推论,以及运用图像转码单元(VCU)处理YouTube图片。根据报导,他们也正开发服务器专用SoC。这传闻中的服务器SoC是否会比AMD的Epyc或英特尔(Intel)的Xeon CPU更适合Google使用,还有待观察。
无论如何,TPU与VCU都已经为Google带来了扩充AI与图片服务所需要的性能、功能、延展性,以及成本效益。
产业分析公司Cambrian-AI Research创办人暨首席分析师Karl Freund表示:“成本与定制化的需求推动这些公司开发自己的芯片。”他认为,AI计算是这些超大规模数据中心企业希望透过自家芯片处理的最主要工作之一。
Google的VCU。
(来源:Google)
“超大规模数据中心企业自己做芯片比向外大量购买还要便宜,并省掉了中间商的成本。”EDA工具与知识产权巨头Cadence数位与签核部门VP Kam Kittrell认为,“这些公司通常是自家云端服务的使用者,并且拥有高价值的专门化软件。他们可以针对这些软件打造能源效率更佳的专属硬件。”
亚马逊旗下的“Amazon Web Services”(AWS)是全球最顶尖的云端服务之一。它不只推动亚马逊自家的网络商店,以及仓储管理系统,也运用在如Netflix等各种网络服务。但AWS的芯片策略和Google不同。
为了在可预测电力消耗的前提下,提供客户足够的功能与计算性能,AWS为旗下的数据中心设计了适用于通用计算的服务器级Graviton SoC。AWS的Graviton SoC目前已发展到第三代。
Synopsys解决方案部门的行销与策略副总裁John Koeter表示:“明显有越来越多的公司(尤其是超大规模数据中心)开始选择设计自家芯片,并借此满足数据中心里差异化的工作需求。 ”
在像AWS、百度、Google、Meta,或是Microsoft Azure这类型的公司里,同时运转着大量多样化的工作负载。为了进一步提高效率,这些工作迟早会全部转化为透过定制化芯片运作,且这些公司都拥有开发定制化SoC所需要的雄厚财力。
“我们看到最大的成长是来自于数据基础架构的领域,包含云端、数据中心、网络、储存设备,以及5G基础架构等应用。”Alphawave Semi行销主管Sudhir Mallya表示:“从今天来看,定制化芯片在数据中心基础架构应用上的成长幅度实在惊人。从几年前Google、微软、AWS、Facebook (Meta)等超大规模数据中心企业都纷纷开始设计自家芯片,我们就看到了这个趋势。”
AI与HPC:不一样的策略
与此同时,不少厂商的数据中心级SoC是专门针对AI与HPC应用所开发,其中不论是处理器、SoC,或是多芯片的系统级封装(SiP)皆为定制化。Koeter表示,这些定制化的AI与HPC解决方案往往可以提供非常强大的性能,但制造上也非常困难且昂贵,因为部分芯片已经大到接近一个EUV光罩的尺寸(858mm 2 )。
Google TPU板。
(来源:Top500.org)
老牌厂商提供了不少适用于AI与HPC应用的标准化产品。例如AMD有Instinct计算GPU,以及EPYC处理器(采用chiplet设计),解决AI和HPC工作负载。
Intel则采用多方位策略,运用单体的Habana处理器处理AI应用,多芯片的Data Center GPU Max处理AI及HPC应用,以及多芯片的第四代Xeon可扩充CPU处理其余应用。
相较之下,Nvidia最新的H100产品采用单体(monolithic)设计。这些都是由具备庞大研发预算与人才的公司所设计的现成产品,并且各自具备独特的优势。
尽管如此,仍有许多新玩家准备在未来几年内投入市场,挑战这些产业巨头。
(参考原文:The Golden Age of Custom Silicon Draws Near,by Anton Shilov)