在当前生成式AI大行其道之际,原本该享受时代红利的英国人工智能(AI)芯片独角兽Graphcore却陷入困境了。近日根据彭博社的报道,有着“英国英伟达”之称的Graphcore将将解雇在中国的大部分员工,并停止在中国的销售。这意味着Graphcore将退出中国市场。
据悉,Graphcore之所以退出中国市场,跟美国最新的AI禁令有关。由于美国出台的出口管制新规限制了该公司向中国市场的产品销售,Graphcore决定大幅缩减在华业务。当然,造成Graphcore的困境还有其内部因素。可以说,一系列内外部综合因素以及在企业战略上的失误,导致Graphcore面临巨大的生存压力。
曾为“英伟达竞争对手”之一
据悉,Graphcore在2016年成立,由Simon Knowles和Nigel Toon联合成立,主要研发专用于AI计算的全新处理器IPU(Intelligence Processing Unit),以帮助加速机器智能产品和服务的开发。其中,Nigel Toon担任公司CEO;Simon Knowles担任公司联合创始人、CTO兼执行副总裁。这位联创创始人是连续创业者,也是多年的好友,曾创办芯片公司,最后出售给博通、英伟达。
为了开发出可以利用所有功率但比GPU更节能的芯片,他们设计了一款具有1216个处理器内核的芯片,共有240亿个晶体管。
2018年底,他们研发的首款IPU芯片正式推出,每秒能够检测10000张不同的图像。
图源:Graphcore主题演讲报告
2019年11月,全球最大软件公司微软签署协议采购Graphcore的处理器。
2020年12月,Graphcore宣布E轮融资筹集了2.22亿美元,总融资额超过4.5亿美元,估值达28亿美元,成为欧洲市值最高的芯片初创公司。
Graphcore也是闯入中国AI芯片市场的少数国外独角兽之一,曾与阿里巴巴、百度建立合作。该公司为阿里巴巴的HALO专门定制代码。Graphcore还是百度飞桨硬件生态圈共建计划伙伴之一,主要加速机器视觉、自然语言处理等算法模型与硬件的适配与落地。
图源:Graphcore主题演讲报告
据Graphcore大中华区总裁卢涛在今年3月第二届“碳中和”暨绿色能源电子产业可持续发展高峰论坛上所作的主题演讲报告介绍,与CPU、GPU不同,Graphcore的IPU是针对人工智能计算而设计,计算的特点主要是面向计算图,是以图来作为抽象构建的处理器架构。
CPU使用片外内存,是标量设计,适合应用程序和网络处理程序、数据库、存储等。而GPU是SIMD计算架构,非常适合做密切的连续的数据计算。擅长模型计算,AI模型和数据分布在现存和HBM或者少量的缓存中,应用场景是图形、HPC和相量计算,还有AI。
IPU是一个大规模并行的多指令多数据架构,采用能耗更低的片上SRAM。这样的架构非常适合做一些精细化的高性能计算、人工智能以及图计算。因此,Graphcore的IPU产品能够提供更好的性能,消耗更低的能源。
卢涛当时介绍,Graphcore发布的最新产品采用了台积电的3D晶圆堆叠技术,有1472个独立的运算核心,每个核心有6个线程,处理器有8832个并行的线程,可以处理近9千个不同的任务,支持FP8浮点运点运算数据类型,片内SRAM存储达到900M、速率高达65TB/s,彻底打破了内存墙的瓶颈。
实际上,Graphcore的目标也是使机器能够识别更复杂的数据,从中找到完成给定任务的方法而不仅仅是简单的对象。Graphcore还声称其研发的IPU比GPU更适合AI特定需求。
Simon Knowles也曾表示,“我们现在的一切技术都依赖大量的计算,而提供大量算力的唯一方法是使用大量并行计算,我们不能期冀单个芯片一直在变得越来越快。”
根据研究机构统计,2022年,在全球的AI领域发表的论文数量,IPU排名第二,是除英伟达GPU以外最多的。目前,这家企业主要设计用于数据中心的云端AI芯片,曾被视为英国科技及芯片产业最有前途的创企之一。在前些年,Graphcore甚至被认为是在AI芯片赛道中声量较高的“英伟达竞争对手”之一。
Graphcore为何会陷入困境?
尽管Graphcore受到各大资本机构的青睐,又得到宝马、博世、戴尔、微软、三星等各行业巨头的战略投资,但似乎在失去大客户微软的订单之后,其商业盈利问题一直困扰这家AI芯片初创公司。
数据显示,Graphcore2022年营收为270万美元,同比下降46%,亏损扩大11%至2.046亿美元。2023年10月,Graphcore披露需要筹集资金保持运营,如果不能在2024年5月之前做到,随着亏损增加,该公司将面临能否继续经营的“重大不确定性”。
值得一提的是,据《星期日泰晤士报》此前报道,作为Graphcore最重要支持者之一,风险投资公司红杉资本已将其在这家创企所持股份的价值减记为0。而柏基投资将其投资估值从2022年7月的1190万美元下调至2023年7月的280万美元。甚至多位风投机构认为,“Graphcore要么将自己出售,要么在一笔具有出售特征的交易中筹集新资金,而且不会接近其峰值估值。”
因此,在营收大亏损、风投机构减低估值的情况下,Graphcore未来融资之路将“雪上加霜”,整个经营风险危机也将加大。
关于陷入困境的重要原因,Graphcore被指是高管们在商业和技术战略方面,特别在AI市场快速发展过程中,做出了错误的决策,导致士气低落和人才从公司流失。这一点契合了Graphcore内部员工的一些观点。有Graphcore内部员工表示,“前一周,我们听说我们在追逐这个市场,一个月后,我们又在追逐另一个市场。目标一直在变。”
除了战略策略方面的失误,Graphcore的软件也是其软肋。尽管Graphcore的IPU具有一些独特的优势,但作为一家以硬件为中心的公司,被传在软件方面有点自创风格,甚至被指“软件还没有准备好,有很多漏洞和问题”。这可能是Graphcore失去微软这一大客户的重要原因,尽管Graphcore可能会更好解决软件方面的问题,但无疑需要更多时间。不过,英伟达的软件似乎没有这样的问题,还被认为是业内最容易使用的软件。这也使得Graphcore很难从英伟达手里抢夺订单的重要原因之一。
据悉,困境中的Graphcore还流失了很多顶尖人才,比如Graphcore的前硬件副总裁Jonas Olsson和系统高级副总裁Ola Tørudbakken,目前都加入了Met;Graphcore前北美总经理Saurabh Kulkarni,现入职英特尔。
以上几点表明,Graphcore不仅缺乏长远的战略决策,而且在市场变化和商业模式的调整方面未能及时有效地应对,导致陷入困境。
美国禁令正压垮“英国英伟达”
据悉,美国能源部的国家实验室已经将IPU作为其基础设施的一部分。而英国研究人员可以通过美国阿贡国家实验室申请使用Graphcore IPU。这足见在AI芯片竞争格局日趋白热化下,Graphcore针对AI应用中内存和传输速度的瓶颈,另辟蹊径开发的IPU,契合了AI时代的大算力需求,可谓有用武之地。
图源:Graphcore拟未官网
然而,尽管Graphcore拥有很强的技术实力,特别是在英伟达AI芯片“一家独大”的情况下,还开启新的技术实现路径,但其需要与时间赛跑,在资金耗尽之前,作出一些新的改变,赢得市场和资本的认可。
不过,屋漏偏逢连夜雨,美国新的AI禁令给Graphcore予以重击,特别是未来在中国AI市场的发展潜力。
2023年10月17日,美国商务部工业和安全局(BIS)发布了针对芯片的出口禁令新规,对于中国半导体的制裁进一步升级。新规限制了中国购买重要的高端芯片,包括先进计算半导体、半导体制造设备和超级计算机项目。
这一新禁令对AI芯片巨头英伟达的冲击最大,受管制的包括但不限于英伟达A100、H100、A800、H800、L40、L40S、RTX 4090 以及集成这些高性能计算卡的 DGX/HGX系统。尽管英伟达也在“故技重施”,延续此前提供专供中国市场A800和H800的做法,但仍需获得监管许可。
然而,城门失火,殃及池鱼。Graphcore在美国新一轮的AI禁令中也“深受其害”。Graphcore不仅要裁减大部分中国员工,并停止在华销售。
此前,Graphcore公司CEO Nigel Toon曾表示非常看好中国市场,并将大力发展,特别是英伟达被限制向中国销售产品之后。2022年10月,他在演讲时透露道,来自中国的销售额可能占Graphcore业务的“20%至25%”。但受美国新禁令的影响,Graphcore需要在其他国家找补失去的“20%至25%”销售额。
据悉,为了削减运营成本,Graphcore从2022年9月宣布裁员。根据Dealroom的数据,Graphcore的员工人数从2022年10月的620人减少到2023年10月的418人。
值得一提的是,英国实际上也是非常重视AI技术,11月初还举办了一场全球性的人工智能安全峰会。此前,英国还承诺投入10亿英镑用于发展本土半导体产业,其中1亿英镑用于建立本土芯片储备。但Graphcore已经被排除在1亿英镑的基金之外,因为投标书明确规定了GPU,因此不包括围绕IPU构建的系统。
对此,Graphcore认为,英国AI计算基础设施缺乏技术多样性,可能会让用户走上适合GPU的应用程序的道路,并限制对新的、为AI系统而设计的模型和技术的探索。
因此,无论是美国新AI禁令,还是被排除在英国本土产业扶持资金之外,都可以被理解Graphcore“时运不济”。不过,另辟新的AI技术路线的Graphcore,还有机会在持续爆发的AI算力需求中找寻自己的生存之地。正如Simon Knowles所说“如果我们创建的东西要比人类聪明得多,接下来会发生什么,一切都是未知的”,未来AI有巨大的发展潜力。而Graphcore的产品不仅满足了AI大算力需求,还擅长训练和推理,这正是生成式AI目前新的发展趋势。
对Graphcore而言,时间是非常重要的。2022年5月,Graphcore宣称新一代芯片将在2024年的某个时候上市。届时,Graphcore需要向市场和资本证明自己的发展潜力。这很重要,也很紧迫。