英伟达向中国供应GPU芯片正遭遇新的困境。
美国商务部产业与安全局(BIS) 1017 新规已经在2023年 11 月 16 日生效,英伟达针对中国市场推出的“特供版” A800 和 H800 芯片遭到出口合规限制,无法向中国客户出售。此前消息称,2024年第二季度英伟达将开始量产面向中国市场的H20和其他AI芯片,并一度公开了新的“特供版”芯片详细规格参数。
目前英伟达最新特供版芯片何时发布尚未有确切消息,市场认为,英伟达仍在观望美方官方态度。屋漏偏逢连夜雨,另一边,最新市场消息显示,中国客户对英伟达“一降再降”“特供版”芯片性能表示不满,购买欲不强。当地时间2024年1月7日,美国《华尔街日报》报道称,英伟达的中国云计算大客户对最新降级版的芯片兴趣不强,没有积极购买的打算,甚至有传言称,英伟达的中国客户们有意转单本土AI芯片供应商。
华尔街日报报道《英伟达在中国的新困境:客户不想要它的降级芯片》
图源:华尔街日报
英伟达降级版的GPU正在遭遇什么?国内厂商有机会吗?
据此前公开报道,美方颁布的1017新规是 BIS 推出的第二个版本的限制措施,意在查漏补缺,因而这一版本比此前版本更加严格,对芯片处理的总处理性能(TPP)和性能密度划出限制条件,符合任一条件即认为处于管制范围。
为应对新的1017新规,产业链2023年11月初传出消息,英伟达将推出三款针对中国市场的 AI 芯片,包括 H20、L20 和 L2 ,三款AI芯片产品分别适用于云端训练、云端推理以及边缘推理。
图源:彭博新闻
华尔街日报最新报道指出,自去年11月以来,国内阿里巴巴集团、腾讯等大型云计算企业开始测试新的“降级版”英伟达芯片。但经过测试后,他们向英伟达表明,今年向英伟达订购的芯片数量将远远少于此前原计划购买的、已经被限制出口的英伟达高性能芯片。
市场分析,国内云计算企业对英伟达新的特供版GPU兴致缺缺的主要原因有两个:
首要原因是新的特供版GPU为了符合新规,性能参数被大幅压缩。早前Semianalysis 透露过H20、L20 和 L2 三款芯片的规格参数。
- H20的总处理性能为2368,性能密度仅为 2.9,小于 3.2 的管制许可值;
- L20的总处理性能为1912,但性能密度为 3.1,小于 3.2 的管制许可值;
- L2的性能密度为 5.2,但总处理性能仅为1544,小于 1600 的管制许可值。
在具体应用中,以 H20 为例,这款芯片的峰值算力最大理论值仅为 296 TFLOPs,性能参数还不如消费级游戏显卡,消费级的 RTX 4090 显卡该数值为 661 TFLOPs。与热门的 H100 芯片相差更大,热门的 H100 芯片的这一数值为 1979 TFLOPs。
此外,在新规执行前,供应链曾传出国内各大云计算巨头均大量囤货A800 和 H800,在这两款芯片尚未完全使用完之前,国内客户对新的降级版英伟达芯片需求并不迫切。更重要的是,一再降级后的英伟达GPU特供芯片与大陆本土的产品性能差距正在缩小,大陆厂家在此时得到了国内云计算厂家的更多关注。
其次相比一再受制的英伟达而言,供应更稳定的本土厂商更令人放心。国内云计算企业有意培养本土企业,准备AI芯片的“plan B”方案。
长远来看,鉴于美国监管机构已承诺将定期审查芯片出口管制,并可能进一步收紧相关芯片的性能限制,因而国内买家为避免不断调整技术以适应新的出口管制,不如减少英伟达产品应用,转而使用本土产品。
“如果未来几年限制可能只会变得更加严格,那么你最好现在就开始考虑替代方案,”阿里云的一位高管表示。
调研机构 TrendForce 分析师 Frank Kung 表示,中国云计算企业目前约 80% 的高端人工智能芯片来自 Nvidia,未来五年这一比例可能会下降至 50%-60%。他补充说,未来美国收紧芯片管制将对英伟达在中国的销售造成额外压力。
从供需的角度出发,未来造成英伟达在中国市场中供应比例下降的原因不难理解。
供应方来看,英伟达产品向中国客户供应受限,出货不畅,导致其高价值高端产品供应减少,而低端产品单价低,系统应用总价值不及高端产品,客户也在重新评估产品的满意度,当前来看,满意度并不高。
需求方来看,面对降级版的GPU芯片,国内客户一般有三种选择:一种是对自建云计算需求不强的企业正打消自建算力计划,转而租用大型云计算公司算力,重心转移至开放AI应用;而对自建算力需求强烈的需求方,如云计算企业、电信运营商、相关重点部门的AI计算中心等则考虑转而尝试使用与降级版性能相近的产品,培养国内供应链;或者继续使用此前囤货的 英伟达芯片,再加上购买更多的降级版GPU芯片,以满足构建算力系统的需求。
撇开自建算力不强的企业,后两种选择中,目前在国内培养本土供应链的呼声显然更高。不过,愿望和实际操作是两回事,当前国内的AI芯片能满足需求方们实际应用的需求吗?国内云计算厂家的转单决心又有多坚定,还有待考验。
国内确实活跃着为数不少的GPU芯片企业,甚至其中还包括被英伟达黄仁勋盖章确认的“强大竞争对手”——国内某知名科技企业。但是需要承认的是,即便是在全球范围中,英伟达在AI芯片领域构筑的护城河——CUDA计算平台以及软硬件生态,至今无人能超越,强如AMD,多年来在英伟达面前也只能屈尊“千年老二”。国内的厂家即便是在GPU产品单个性能参数上有所突破,可在整体的应用生态中,短期内仍不可能达到英伟达的高度。
各大AI大模型耗资巨大,国内云计算需求方在实际应用端还是以“稳”为主,引入其它本土厂家产品测试可以,准备“plan B”方案势在必行。但短期内大范围下单国内AI芯片,替代英伟达芯片恐怕又是另一回事了,由此来看,“转单”的实质性行为并不会很快发生。
国内科技公司的工程师也表示,鉴于英伟达更广泛的产品生态系统以及本地替代品仍然供不应求,英伟达的芯片在未来12个月内仍将是采购重点。
不过对冲基金 Interconnected Capital 的创始人凯文·徐 (Kevin Xu) 表示,从长远来看,美国的限制措施可能会促使中国开发自己的技术。“在当前这一阶段的储备完成后,英伟达的中国业务将成为牺牲品。”
参考资料:
1、华尔街日报《Nvidia’s New China Pickle: Customers Don’t Want Its Downgraded Chips》
2、凤凰科技《英伟达中国特供芯片遇冷:阿里、腾讯看不上降级版》
来源:芯师爷