今年6月,就有媒体称,字节跳动今年向英伟达订购了超过10亿美元的GPU,字节到货和没到货的A100与H800总计10万块,仅字节一家公司今年的订单可能已接近英伟达去年在中国销售的商用GPU总和。

当前,AI大模型带来的庞大算力需求,正导致GPU处理器“一芯难求”。近日,据英国《金融时报》援引两位与英伟达关系密切的未具名人士报道称,百度、字节跳动、腾讯和阿里巴巴向英伟达下单订购50亿美元的芯片。

其中,今年英伟达将合计发货约10万块A800芯片,价值10亿美元,另外价值40亿美元的芯片都将2024年交付。不过,对以上消息,英伟达和上述四家国内企业都未予置评。

AI算力需求旺盛

GPU因具备图形渲染和海量数据的并行运算等优势,能够快速准确地处理大量数据,市场价值逐渐凸显,广泛应用于人工智能、图像渲染、科学计算等领域。其中,AI、自动驾驶与游戏市场是GPU需求增长的主要场景。

2022年底,ChatGPT问世后,迅速在全世界掀起了AI风潮。而一直押注AI未来的英伟达,成为AI大模型风潮中收益最大的企业,其市值已高达万亿美元市值。

图源:英伟达官网

今年3月,英伟达在GTC 大会上重磅发布了H100 NVLINK芯片,其是专门为大语言模型(LLM)设计的GPU,采用了Transformer加速解决方案,可用于处理ChatGPT。相较于英伟达的HGX A100 GPU芯片,一台搭载四对H100 和双GPU NVLINK 的服务器速度还要快上10倍,可以将LLM 的处理成本降低一个数量级。

目前,英伟达在高性能GPU方面的技术领先地位,旗下A100和H100两款AI芯片是ChatGPT这样的大语言模型的核心动力。有云计算专业人士介绍,1万颗英伟达A100芯片是一个好的AI模型的算力门槛。而微软为OpenAI构建的用于训练其模型的AI超级计算机就配备了1万颗英伟达的GPU芯片。

近日,英伟达又推出下一代版本的GH200 Grace Hopper超级芯片。该芯片将成为世界上第一个配备HBM3e(High Bandwidth Memory 3e)内存的GPU芯片。与当前一代产品相比,最新版本的GH200超级芯片内存容量增加了3.5倍,带宽增加了3倍;相比最热门的H100芯片,其内存增加1.7倍,传输频宽增加1.5倍。

据GlobalMarketInsights数据,全球GPU市场预计将以CAGR25.9%持续增长,至2030年达到4000亿美元规模。其中AI领域大语言模型的持续推出以及参数量的不断增长有望驱动模型训练端、推理端GPU需求快速增长。

英伟达在一份声明中表示:“消费互联网公司和云供应商每年在数据中心组件上投资数十亿美元,通常会提前几个月下订单。” 英伟达CFO克雷斯也表示,目前AI 算力市场的需求已经超出了公司对未来数个季度的预期,订单已经多到做不过来。

GPU价格一涨再涨

2022年,美国加大了AI芯片对华出口限制。为了规避该政策的限制,英伟达向中国市场专供A800处理器,以取代A100 GPU。不过,在AI大模型算力需求的驱动下,即使性能被限制的“专供版”GPU也是供不应求。

过去几个月,在AI大模型算力需求的带动下,英伟达旗下A100、H100、A800和H800等高性能GPU芯片价格不断上涨。特别是旗舰级芯片H100,4月中旬在海外电商平台就已炒到超4万美元,甚至有卖家标价6.5万美元。同时,英伟达的中国特供版A800和H800芯片也遭到了哄抢。

值得一提的是,此前多家媒体报道,美国政府正酝酿实行新的芯片出口限制,主要涉及英伟达对中国出口的AI芯片。尽管新的限制政策一直未落地,但市场早已“风声鹤唳”,GPU的价格一涨再涨。

7月上旬,据澎湃新闻报道,英伟达在中国一家代理商表示,现在英伟达A800芯片一天一个价,如果购买量多的话可以10多万元/片,少的话没有11万元/片拿不到,“考虑到禁售传闻,大家都比较惜售,一个多礼拜以来涨幅达20%到30%。

7月末,腾讯科技的报道也提到英伟达芯片被哄抢,称在芯片分销圈,英伟达的中国特供版A800和 H800售价从原来的12万元人民币左右,变成了现在的25万甚至30万元,甚至有高达50万元一块。

今年6月,就有媒体称,字节跳动今年向英伟达订购了超过10亿美元的GPU,字节到货和没到货的A100与H800总计10万块,仅字节一家公司今年的订单可能已接近英伟达去年在中国销售的商用GPU总和。有知情人士透露,字节跳动已储备了至少10000张英伟达GPU。字节跳动还订购了近70000张A800芯片,将于明年交付,价值约7亿美元。

英伟达的财务总监在6月份表示,对AI芯片出口到中国的限制“将导致美国产业永久性地失去机会”,并且该公司预计短期内不会受到实质性影响。

目前来看,英伟达订单能见度已至2024年,高端芯片非常紧缺。以现在的排产进度,就连A800/H800都要到今年底或明年才能交货。

责编:Jimmy.zhang
阅读全文,请先
您可能感兴趣
面对AI时代带来的差异化趋势、软件应用及开发时间长、软硬件协同难、高复杂度高成本等挑战,国产EDA仍需不断探索和创新。
股东诉讼指控英伟达的首席执行官黄仁勋隐藏了公司记录性收入增长主要由其旗舰产品GeForce GPU的挖矿销售驱动,而非游戏销售,导致投资者对公司的盈利来源和风险敞口产生错误认知。
今年初的GTC上,黄仁勋就说机器人的“ChatGPT时刻”要来了。也就是说这波AI驱动的机器人热潮要来了...最近的ROSCon China 2024大会似乎也能看到这种迹象...
近日,华为终端BG CEO何刚在和紫牛基金创始合伙人张泉灵的对话中表示,华为Mate 70系列每一颗芯片都有国产的能力。此外,日前在深圳宝安中学的一场讲座中,华为终端BG 董事长余承东也自豪地宣布Mate70实现了芯片的100%国产化。
华为Mate 70系列中的Mate 70搭载了麒麟9010芯片,而Mate 70 Pro/Pro+/RS则首发了麒麟9020芯片。近日,百万粉丝的网红博主@杨长顺维修家 对华为Mate 70 RS进行了拆解……
Intel刚刚发布了新一代桌面显卡Arc B580和B570,关键是还支持AI帧生成和低延迟...
目前,智能终端NFC功能的使用频率越来越高,面对新场景新需求,ITMA多家成员单位一起联合推动iTAP(智能无感接近式协议)标准化项目,预计25年上半年发布1.0标准,通过功能测试、兼容性测试,确保新技术产业应用。
中科院微电子所集成电路制造技术重点实验室刘明院士团队提出了一种基于记忆交叉阵列的符号知识表示解决方案,首次实验演示并验证了忆阻神经-模糊硬件系统在无监督、有监督和迁移学习任务中的应用……
C&K Switches EITS系列直角照明轻触开关提供表面贴装 PIP 端子和标准通孔配置,为电信、数据中心和专业音频/视频设备等广泛应用提供创新的多功能解决方案。
投身国产浪潮向上而行,英韧科技再获“中国芯”认可
‍‍12月18日,深圳雷曼光电科技股份有限公司(下称“雷曼光电”)与成都辰显光电有限公司(下称“辰显光电”)在成都正式签署战略合作协议。双方将充分发挥各自在技术创新、产品研发等方面的优势,共同推进Mi
来源:观察者网12月18日消息,自12月2日美国发布新一轮对华芯片出口禁令以来,不断有知情人士向外媒透露拜登政府在卸任前将采取的下一步动作。美国《纽约时报》12月16日报道称,根据知情人士以及该报查阅
2024年度PlayStation游戏奖今日公布,《宇宙机器人》获得年度最佳PS5游戏,《使命召唤:黑色行动6》获得年度最佳PS4游戏。在这次评选中,《宇宙机器人》获得多个奖项,包括最佳艺术指导奖、最
12月18 日,据报道,JNTC与印度Welspun BAPL就车载盖板玻璃的开发及量产签订了投资引进业务合作备忘录(MOU)。资料显示,JNTC是韩国的一家盖板玻璃厂商。Welspun的总部位于印度
阿里资产显示,随着深圳柔宇显示技术有限公司(下称:“柔宇显示”)旗下资产一拍以流拍告终,二拍将于12月24日开拍,起拍价为9.8亿元。拍卖标的包括位于深圳市龙岗区的12套不动产和一批设备类资产,其中不
 “ 担忧似乎为时过早。 ”作者 | RichardSaintvilus编译 | 华尔街大事件由于担心自动驾驶汽车可能取消中介服务,Uber ( NYSE: UBER ) 的股价在短短几周内从 202
又一地,新型储能机会来了?■ 印度:2032储能增长12倍,超60GW据印度国家银行SBI报告,印度准备大幅提升能源存储容量,预计到2032财年将增长12 倍,超60GW左右。这也将超过可再生能源本身
 “ AWS 的收入增长应该会继续加速。 ”作者 | RichardSaintvilus编译 | 华尔街大事件亚马逊公司( NASDAQ:AMZN ) 在当前水平上还有 38% 的上涨空间。这主要得益
极越汽车闪崩,留下一地鸡毛,苦的是供应商和车主。很多人都在关心,下一个倒下的新能源汽车品牌,会是谁?我们都没有未卜先知的超能力,但可以借助数据管中窥豹。近日,有媒体统计了15家造车新势力的销量、盈亏情
亲爱的企业用户和开发者朋友们距离2024 RT-Thread开发者大会正式开幕仅剩最后3天!还没报名的小伙伴,抓紧报名噢,12月21日不见不散!大会时间与地点时间:2024年12月21日 9:30-1