今年6月,就有媒体称,字节跳动今年向英伟达订购了超过10亿美元的GPU,字节到货和没到货的A100与H800总计10万块,仅字节一家公司今年的订单可能已接近英伟达去年在中国销售的商用GPU总和。

当前,AI大模型带来的庞大算力需求,正导致GPU处理器“一芯难求”。近日,据英国《金融时报》援引两位与英伟达关系密切的未具名人士报道称,百度、字节跳动、腾讯和阿里巴巴向英伟达下单订购50亿美元的芯片。

其中,今年英伟达将合计发货约10万块A800芯片,价值10亿美元,另外价值40亿美元的芯片都将2024年交付。不过,对以上消息,英伟达和上述四家国内企业都未予置评。

AI算力需求旺盛

GPU因具备图形渲染和海量数据的并行运算等优势,能够快速准确地处理大量数据,市场价值逐渐凸显,广泛应用于人工智能、图像渲染、科学计算等领域。其中,AI、自动驾驶与游戏市场是GPU需求增长的主要场景。

2022年底,ChatGPT问世后,迅速在全世界掀起了AI风潮。而一直押注AI未来的英伟达,成为AI大模型风潮中收益最大的企业,其市值已高达万亿美元市值。

图源:英伟达官网

今年3月,英伟达在GTC 大会上重磅发布了H100 NVLINK芯片,其是专门为大语言模型(LLM)设计的GPU,采用了Transformer加速解决方案,可用于处理ChatGPT。相较于英伟达的HGX A100 GPU芯片,一台搭载四对H100 和双GPU NVLINK 的服务器速度还要快上10倍,可以将LLM 的处理成本降低一个数量级。

目前,英伟达在高性能GPU方面的技术领先地位,旗下A100和H100两款AI芯片是ChatGPT这样的大语言模型的核心动力。有云计算专业人士介绍,1万颗英伟达A100芯片是一个好的AI模型的算力门槛。而微软为OpenAI构建的用于训练其模型的AI超级计算机就配备了1万颗英伟达的GPU芯片。

近日,英伟达又推出下一代版本的GH200 Grace Hopper超级芯片。该芯片将成为世界上第一个配备HBM3e(High Bandwidth Memory 3e)内存的GPU芯片。与当前一代产品相比,最新版本的GH200超级芯片内存容量增加了3.5倍,带宽增加了3倍;相比最热门的H100芯片,其内存增加1.7倍,传输频宽增加1.5倍。

据GlobalMarketInsights数据,全球GPU市场预计将以CAGR25.9%持续增长,至2030年达到4000亿美元规模。其中AI领域大语言模型的持续推出以及参数量的不断增长有望驱动模型训练端、推理端GPU需求快速增长。

英伟达在一份声明中表示:“消费互联网公司和云供应商每年在数据中心组件上投资数十亿美元,通常会提前几个月下订单。” 英伟达CFO克雷斯也表示,目前AI 算力市场的需求已经超出了公司对未来数个季度的预期,订单已经多到做不过来。

GPU价格一涨再涨

2022年,美国加大了AI芯片对华出口限制。为了规避该政策的限制,英伟达向中国市场专供A800处理器,以取代A100 GPU。不过,在AI大模型算力需求的驱动下,即使性能被限制的“专供版”GPU也是供不应求。

过去几个月,在AI大模型算力需求的带动下,英伟达旗下A100、H100、A800和H800等高性能GPU芯片价格不断上涨。特别是旗舰级芯片H100,4月中旬在海外电商平台就已炒到超4万美元,甚至有卖家标价6.5万美元。同时,英伟达的中国特供版A800和H800芯片也遭到了哄抢。

值得一提的是,此前多家媒体报道,美国政府正酝酿实行新的芯片出口限制,主要涉及英伟达对中国出口的AI芯片。尽管新的限制政策一直未落地,但市场早已“风声鹤唳”,GPU的价格一涨再涨。

7月上旬,据澎湃新闻报道,英伟达在中国一家代理商表示,现在英伟达A800芯片一天一个价,如果购买量多的话可以10多万元/片,少的话没有11万元/片拿不到,“考虑到禁售传闻,大家都比较惜售,一个多礼拜以来涨幅达20%到30%。

7月末,腾讯科技的报道也提到英伟达芯片被哄抢,称在芯片分销圈,英伟达的中国特供版A800和 H800售价从原来的12万元人民币左右,变成了现在的25万甚至30万元,甚至有高达50万元一块。

今年6月,就有媒体称,字节跳动今年向英伟达订购了超过10亿美元的GPU,字节到货和没到货的A100与H800总计10万块,仅字节一家公司今年的订单可能已接近英伟达去年在中国销售的商用GPU总和。有知情人士透露,字节跳动已储备了至少10000张英伟达GPU。字节跳动还订购了近70000张A800芯片,将于明年交付,价值约7亿美元。

英伟达的财务总监在6月份表示,对AI芯片出口到中国的限制“将导致美国产业永久性地失去机会”,并且该公司预计短期内不会受到实质性影响。

目前来看,英伟达订单能见度已至2024年,高端芯片非常紧缺。以现在的排产进度,就连A800/H800都要到今年底或明年才能交货。

责编:Jimmy.zhang
阅读全文,请先
您可能感兴趣
9月10日,苹果发布了一系列新品,包括iPhone 16系列手机、Apple Watch Series 10智能手表和AirPods 4耳机。发布会后网上响起了一片吐嘈声,带着这些吐槽,我们来看看这次苹果到底有没有新玩意……
不管怎么样,英特尔仍在努力推进18A芯片工艺,以期未来在最先进的芯片工艺上能与台积电、三星有一定的领先优势,毕竟其已经率先拿到ASML两台最先进的High NA(高数值孔径)EUV光刻机。未来,英特尔没有选择,只有抓住任何的可能性,硬着头皮上。
一直听说x86指令集天生做不了低功耗,真的是这样吗?这篇文章着重谈谈酷睿Ultra二代是怎么考量低功耗的,有没有可能做到低功耗...
经营业绩下滑,以及在代工业务上的巨额亏损以及市场需求疲软,也或是英特尔出售Mobileye股份的重要原因之一。
近期,国产GPU企业象帝先遭遇发展困境。尽管公司对外否认了全员解散的传闻,但内部邮件和媒体报道均显示,象帝先已开始实施裁员,并寻求资金解决方案。
Intel昨天正式发布了酷睿Ultra 200V系列新品,也就是面向轻薄本的Lunar Lake处理器,而且本月底就要出货了。在PC处理器市场竞争日益严峻的现在,Lunar Lake还有过人之处吗?
• 得益于西欧、关键亚洲市场和拉丁美洲市场的增长,以及中国品牌的持续领先,全球折叠屏手机出货量在2024年第二季度同比增长了48%。 • 荣耀凭借其在西欧特别强劲的表现,成为最大的贡献者,成为该地区排名第一的品牌。 • 摩托罗拉的Razr 40系列在北美和拉丁美洲表现良好,为其手机厂商的出货量贡献了三位数的同比增长。 • 我们预计,头部中国手机品牌厂商的不断增加将至少在短期内抑制三星Z6系列在第三季度的发布。
AI技术的发展极大地推动了对先进封装技术的需求,在高密度,高速度,高带宽这“三高”方面提出了严苛的要求。
奕斯伟计算2024首届开发者伙伴大会以“绿色、开放、融合”为主题,从技术创新、产品应用、生态建设等方面,向开发者、行业伙伴等相关方发出开放合作倡议,加速RISC-V在各行各业的深度融合和应用落地,共同推动RISC-V新一代数字基础设施生态创新和产业发展。
2024年 Canalys 中国云计算渠道领导力矩阵冠军厂商分别是:阿里云、华为云和亚马逊云科技(AWS)
点击蓝字 关注我们德州仪器全球团队坚持克服挑战,为电源模块开发新的 MagPack™ 封装技术,这是一项将帮助推动电源设计未来的突破性技术。  ■ ■ ■作为一名经验丰富的马拉松运动员,Kenji K
文|德福很多去成都旅游的朋友都有个疑惑——为什么在成都官方的城市标志上看不到熊猫,而是一个圆环?其实这个“圆环”大有来头,它被唤作太阳神鸟,2001年出土于大名鼎鼎的金沙遗址,距今已有三千余年历史。0
‍‍Mobileye 将终止内部激光雷达开发Mobileye 宣布终止用于自动驾驶的激光雷达的开发,并裁员 100 人。Mobileye 认为,下一代 FMCW 激光雷达对可脱眼的自动驾驶来说必要性没
在德国柏林举行的IFA 2024上,AMD计算和图形业务集团高级副总裁兼总经理Jack Huynh宣布,公司将把以消费者为中心的RDNA和以数据中心为中心CDNA架构统一为UDNA架构,这将为公司更有
会议预告向世界展示中国最具创新力、领导力和品牌化的产品与技术!9月27号,“第6届国际移动机器人集成应用大会暨复合机器人峰会”将在上海举行,敬请关注!逐个击破现有痛难点。文|新战略半导体行业高标准、灵
[关注“行家说动力总成”,快速掌握产业最新动态]9月6日,据“内江新区”消息,晶益通(四川)半导体科技有限公司旗下IGBT模块材料和封测模组产业园项目已完成建设总进度的40%,预计在明年5月建成。据了
8月28-30日,PCIM Asia 2024展在深圳举行。“行家说”进行了为期2天的探馆,合计报道了200+碳化硅相关参展企业(.点这里.)。其中,“行家说”还重点采访了骄成超声等十余家企业,深入了
8月28-30日,PCIM Asia 2024展在深圳举行。“行家说”进行了为期2天的探馆,合计报道了200+碳化硅相关参展企业(.点这里.)。其中,“行家说”还重点采访了长飞先进等众多企业,深入了解
9月6日,“智进AI•网易数智创新企业大会”在秦皇岛正式举行,300+企业高管及代表、数字化技术专家齐聚一堂,探讨当AI从技术探索迈入实际应用,如何成为推动组织无限进化的新引擎。爱分析创始人兼CEO金