如日中天的英伟达,下一个目标是抢走云厂商的生意?

阿尔法工场研究院 2023-08-23 08:19

为了确保您每日收到“阿尔法工场”优质的财经内容推送,请进入公众号主页,点击右上角“···”标志,点击第一行“设为星标⭐”。

作者 | 薛良Neil
来源 | 品玩

导语:既然已经卡住了云厂商们的脖子,那何不更进一步?


谁有英伟达GPU,谁就是云公司


关于英伟达总有新的消息让你惊讶。

最近的一则来自美国的一家云初创公司CoreWeave 。

这家公司宣布融资23亿美金,而更让人震惊的是这笔钱的抵押物是其拥有的GPU。在大模型热潮下,GPU俨然成为一种硬通货,而CoreWeave之所以能有如此多的英伟达稀缺物品,是因为它过去的身份——北美最大的以太坊矿工。

那时它有超过五万台GPU用来挖矿,在面对挖矿的不可持续性后,CoreWeave把目光转向AI等需要并行计算的领域,并在ChatGPT爆红之前就采购了大量英伟达芯片——那时芯片的产能还足够充分。

由此,CoreWeave自称是世界上唯一一个可以大规模提供H100算力的公司,也摇身一变成为了一家“云厂商”。


是的,它的GPU供给超越了所有云服务巨头,包括谷歌云、亚马逊云和微软的Azure。

这听上去有些奇特,即使是不谈GPU数量瓶颈,构建数据中心还需要巨量的成本,精巧的空间、能源和散热设计以及十分复杂的软硬件协同,一般来说,能满足这些条件的只能是巨头,而不是刚进行了B轮融资(4.21亿美元)的初创公司。

CoreWeave 能做到这一点,源于一种对数据中心截然不同的理解。

传统的数据中心由CPU构成,它们侧重于通用计算的能力,主要由最开始是英特尔,后来是AMD的芯片所垄断。

但全新的用于加速计算的数据中心则更强调并行计算,这就意味着它需要有更大的内存、带宽以及把所有的加速计算单元密切连接起来的能力,英伟达创始人和CEO黄仁勋称这个过程为“数据中心现代化”,在他看来这是一个将持续10年的周期。

这个新周期的开始预示着整个数据中心的建构方式,软硬件协同乃至电源和散热结构都需要重新设计。这让所有的云服务提供商几乎重回起跑线——针对CPU设计的上一代的数据中心方案几乎完全无法照搬。比如英伟达连接庞大GPU集群所用到的Infinite Band技术需要超过500英里的电缆,这在传统的数据中心设计中根本不存在。

CoreWeave举了另一个例子,相同场地大小,GPU 集群所需要的电力是传统数据中心的 4 倍,因此新数据中心的电力系统和散热系统都需要完全重新设计,这甚至还不算软硬件协同的成本。

抢占先机的CoreWeave由此不仅能提供庞大的H100算力,并且在比其它的云服务快几十倍的同时费用还低80%,能做到这些,我们可以将其归功于它很早就精准践行了黄仁勋有关数据中心的愿景——数据中心正在向加速计算方向转化,而紧缺的算力则通过云供应。

就这样,一家虚拟币挖矿公司就变成了一家当红的云计算公司,只因为它是最忠诚的英伟达门徒。



英伟达云是个什么云


谁有英伟达的GPU谁就是最红的云厂商,那么谁有最多的英伟达GPU?显然是它自己。

于是在扶持类似的云初创企业的同时,英伟达也在建设自己的云。

英伟达亲自下场做云的优势有很多,最明显的是它不受到GPU供需关系的困扰。马斯克曾在公开场合说,获得GPU比获得毒品要难多了,而CoreWeave之所以能提供超大规模的H100算力,据悉也和英伟达的充分供应有关——英伟达在几个月前参与了CoreWeave的B轮融资。

但显然,仅仅投一些初创公司还不够,生成式AI对算力的巨大需求最终让英伟达自己下场。在今年3月的GTC大会上,英伟达推出了自己的云服务DGX Cloud,它已在年中正式上线。

从名字就可以看出,DGX Cloud直接利用了英伟达DGX超级计算机的能力,云的每个实例均配备8个H100或A100 GPU以及640GB内存。

DGX Cloud采用了一种低延迟结构,让庞大的工作流可以在集群之间扩展,于多个计算节点上并行分配。举个例子来说,最先宣布与DGX Cloud合作的甲骨文,它在OCI Supercluster上每个集群可以部署超过3万个A100 GPU,由此大模型可以在云上进行训练。用户在任何地方都能自由访问属于自己的AI超级计算机(英伟达表示算力的分配是独享排他的),打交道的只有前台界面,除了开发过程本身不用再去担心任何和硬件基础设施有关的问题。

这项服务采用月租形式,金额高达近4万美元。当然,相比直接买一台 DGX 服务器 20 万美元的价格来说还是便宜了许多,但不少人都指出,微软的Azure同样8个A100GPU的收费只有不到2万美元,几乎是前者的一半。

为什么这么贵?因为英伟达的云服务和别家不同,它不仅包括算力,还包括一整套AI解决方案。

名为Base Command Platform(基础命令平台)和AI Enterprise的两项服务被集成到了DGX Cloud里。前者是一个管理与监控软件,不仅可以用来记录云端算力的训练负载,提供跨云端和本地算力的整合,还能让用户直接从浏览器访问DGX Cloud。后者则是英伟达AI平台中的软件层,高达数千个软件包提供了各种预训练模型、AI框架和加速库,从而简化端到端的AI开发和部署成本。除此之外,DGX Cloud上还提供名为AI Foundations的模型铸造服务,让企业用户可以使用自己的专有数据定制属于自己的垂直大模型。

这套软硬件组合起来的完整解决方案让DGX Cloud训练速度相比传统的云计算提高了两到三倍,这成为了DGX Cloud与传统云服务最大的不同,它很好的综合了英伟达两方面的强项:AI生态和算力。对于英伟达来说,“软件即服务”这句话似乎应该改成“软硬件一体即服务”,DGX Cloud集中代表了一个硬件厂商向上垂直整合的能力天花板。



黄仁勋的野心和现实


但这并不意味着英伟达就彻底掀了传统云厂商的桌子。它的这项服务是通过传统云厂商来提供的。DGX Cloud最开始被宣布推出在甲骨文云上,随后微软和谷歌跟进,而英伟达与这些云厂商合作的方式显得颇为有趣:英伟达先把GPU硬件卖给这些云合作伙伴,然后再租用这些硬件以便运行DGX Cloud。

有人戏称这叫两边钱一起赚,都不耽误。

实际上,黄仁勋解释过这种模式:“我们从让客户使用我们的计算平台中受益,而客户通过将我们(的计算平台)置于他们(云厂商)的云中而受益。”

如果只听黄仁勋说,这就是个皆大欢喜的双赢结局,然而这只是他一贯的叙事而已。英伟达已经陷入与自己客户的竞争中,并且心知肚明。

DGX Cloud进展告诉我们,黄仁勋并不打算仅仅把它布置于传统云厂商上。在八月的SIGGRAPH 2023上,英伟达先是宣布了与Hugging Face的合作,接着发布了名为AI Workbench的服务。它们都可以让用户便捷创建、测试和定制预训大模型,其背后的算力支持自然都包括了DGX Cloud。

这显然会冲击英伟达和云厂商的关系:最主要的云服务商,包括谷歌、亚马逊和微软,它们同样也是英伟达的大客户,英伟达推广自有云服务势必会抢夺它们的市场份额。特别是我们在第一部分已经谈到,作为数据中心和云服务巨头的它们在构建下一代数据中心的问题上本来就不具备多少优势,如果再考虑到英伟达芯片产能“卡脖子”的问题,英伟达的自有云服务威胁不可谓不小。

黄仁勋不会不知道这一点,因此他对DGX Cloud的态度就显得颇值得玩味了,比如他公开表示,一个恰当的云服务组合比例应该是10%英伟达DGX加上90%的公有云。换而言之,DGX Cloud在黄仁勋的定位里并不是传统云厂商的对手与威胁,而是合作伙伴。

在Q1季度财报公布后的分析师电话会上黄仁勋谈的更多的都是这种合作的好处,“一个巨大的双赢”,黄仁勋如此形容。在他的理解里,DGX Cloud是一个纯粹的英伟达堆栈(pure Nvidia stack),把人工智能开发、大型数据库和高速低延迟网络组合在一起,成为一种便捷的AI 基础设施从而打开全新的、巨大的市场——这个市场的参与者包括了英伟达和传统云厂商,大家将共同受益于生成式AI的爆发。

极力避谈冲突,其实是因为,DGX Cloud恐怕很长时间内都只能维持一个较小的体量。

第一个原因当然是算力的瓶颈。“订单多到不可思议”是黄仁勋形容数据中心业务量时的描述,英伟达的核心要务当然是开发并保证生产尽可能多的符合市场需求的先进芯片,否则云服务的规模是无法扩大的。

尽管台积电在马不停蹄的生产,但值得注意的是算力缺口不是变小而是更大了,因为一旦大模型落地和商业化(比如像ChatGPT那样),其推理成本将随着用户规模的提升指数级升高,长远来看会比训练模型的算力需求大得多(有人给出的倍率是100)。

此外也是考虑到英伟达和传统云厂商合作关系的复杂性。DGX Cloud如果作为一种纯粹的竞品出现,或许会占领可观的市场份额,但势必进一步加速云厂商摆脱对英伟达的依赖——它们本来就已经为了少交点“英伟达税”而不约而同地自研芯片了。

从另一个角度讲,全力扩大DGX Cloud规模可能也不符合英伟达的最佳利益。从芯片到游戏显卡再到服务器和数据中心,英伟达绝少自己制造硬件产品,它更喜欢和OEM厂商合作——以至于许多时候你要采购英伟达芯片都还是得经过OEM厂商。这让英伟达很好的控制成本,维持利润率。

今天英伟达和云厂商之间似乎维持了一种平衡,但平衡就是用来打破的,尤其当一方是英伟达的时候,毕竟眼下才是黄仁勋所谓“下一代数据中心十年”更新周期的第一年。


加入阿尔法工场投资者交流社群 | 添加微信:dlfxs2

阿尔法工场研究院 阿尔法工场旗下研究院.定期发布覆盖A股、美股、港股的上市公司研究报告.
评论 (0)
  • 北京时间3月11日,国内领先的二手消费电子产品交易和服务平台万物新生(爱回收)集团(纽交所股票代码:RERE)发布2024财年第四季度和全年业绩报告。财报显示,2024年第四季度万物新生集团总收入48.5亿元,超出业绩指引,同比增长25.2%。单季non-GAAP经营利润1.3亿元(non-GAAP口径,即经调整口径,均不含员工股权激励费用、无形资产摊销及因收购产生的递延成本,下同),并汇报创历史新高的GAAP净利润7742万元,同比增长近27倍。总览全年,万物新生总收入同比增长25.9%达到1
    华尔街科技眼 2025-03-13 12:23 116浏览
  • DeepSeek自成立之初就散发着大胆创新的气息。明明核心开发团队只有一百多人,却能以惊人的效率实现许多大厂望尘莫及的技术成果,原因不仅在于资金或硬件,而是在于扁平架构携手塑造的蜂窝创新生态。创办人梁文锋多次强调,与其与大厂竞争一时的人才风潮,不如全力培养自家的优质员工,形成不可替代的内部生态。正因这样,他对DeepSeek内部人才体系有着一套别具一格的见解。他十分重视中式教育价值,因而DeepSeek团队几乎清一色都是中国式学霸。许多人来自北大清华,或者在各种数据比赛中多次获奖,可谓百里挑一。
    优思学院 2025-03-13 12:15 121浏览
  • 前言在快速迭代的科技浪潮中,汽车电子技术的飞速发展不仅重塑了行业的面貌,也对测试工具提出了更高的挑战与要求。作为汽车电子测试领域的先锋,TPT软件始终致力于为用户提供高效、精准、可靠的测试解决方案。新思科技出品的TPT软件迎来了又一次重大更新,最新版本TPT 2024.12将进一步满足汽车行业日益增长的测试需求,推动汽车电子技术的持续革新。基于当前汽车客户的实际需求与痛点,结合最新的技术趋势,对TPT软件进行了全面的优化与升级。从模型故障注入测试到服务器函数替代C代码函数,从更准确的需求链接到P
    北汇信息 2025-03-13 14:43 115浏览
  • 文/Leon编辑/cc孙聪颖作为全球AI领域的黑马,DeepSeek成功搅乱了中国AI大模型市场的格局。科技大厂们选择合作,接入其模型疯抢用户;而AI独角兽们则陷入两难境地,上演了“Do Or Die”的抉择。其中,有着“大模型六小虎”之称的六家AI独角兽公司(智谱AI、百川智能、月之暗面、MiniMax、阶跃星辰及零一万物),纷纷开始转型:2025年伊始,李开复的零一万物宣布转型,不再追逐超大模型,而是聚焦AI商业化应用;紧接着,消息称百川智能放弃B端金融市场,聚焦AI医疗;月之暗面开始削减K
    华尔街科技眼 2025-03-12 17:37 220浏览
  • 在海洋监测领域,基于无人艇能够实现高效、实时、自动化的海洋数据采集,从而为海洋环境保护、资源开发等提供有力支持。其中,无人艇的控制算法训练往往需要大量高质量的数据支持。然而,海洋数据采集也面临数据噪声和误差、数据融合与协同和复杂海洋环境适应等诸多挑战,制约着无人艇技术的发展。针对这些挑战,我们探索并推出一套基于多传感器融合的海洋数据采集系统,能够高效地采集和处理海洋环境中的多维度数据,为无人艇的自主航行和控制算法训练提供高质量的数据支持。一、方案架构无人艇要在复杂海上环境中实现自主导航,尤其是完
    康谋 2025-03-13 09:53 118浏览
  • 曾经听过一个“隐形经理”的故事:有家公司,新人进来后,会惊讶地发现老板几乎从不在办公室。可大家依旧各司其职,还能在关键时刻自发协作,把项目完成得滴水不漏。新员工起初以为老板是“放羊式”管理,结果去茶水间和老员工聊过才发现,这位看似“隐形”的管理者其实“无处不在”,他提前铺好了企业文化、制度和激励机制,让一切运行自如。我的观点很简单:管理者的最高境界就是——“无为而治”。也就是说,你的存在感不需要每天都凸显,但你的思路、愿景、机制早已渗透到组织血液里。为什么呢?因为真正高明的管理,不在于事必躬亲,
    优思学院 2025-03-12 18:24 108浏览
  • 文/杜杰编辑/cc孙聪颖‍主打影像功能的小米15 Ultra手机,成为2025开年的第一款旗舰机型。从发布节奏上来看,小米历代Ultra机型,几乎都选择在开年发布,远远早于其他厂商秋季主力机型的发布时间。这毫无疑问会掀起“Ultra旗舰大战”,今年影像手机将再次被卷上新高度。无意臆断小米是否有意“领跑”一场“军备竞赛”,但各种复杂的情绪难以掩盖。岁岁年年机不同,但将2-3年内记忆中那些关于旗舰机的发布会拼凑起来,会发现,包括小米在内,旗舰机的革新点,除了摄影参数的不同,似乎没什么明显变化。贵为旗
    华尔街科技眼 2025-03-13 12:30 155浏览
  • 引言汽车行业正经历一场巨变。随着电动汽车、高级驾驶辅助系统(ADAS)和自动驾驶技术的普及,电子元件面临的要求从未如此严格。在这些复杂系统的核心,存在着一个看似简单却至关重要的元件——精密电阻。贞光科技代理品牌光颉科技的电阻选型过程,特别是在精度要求高达 0.01% 的薄膜和厚膜技术之间的选择,已成为全球汽车工程师的关键决策点。当几毫欧姆的差异可能影响传感器的灵敏度或控制系统的精确性时,选择正确的电阻不仅仅是满足规格的问题——它关系到车辆在极端条件下的安全性、可靠性和性能。在这份全面指南中,我们
    贞光科技 2025-03-12 17:25 136浏览
  • 2025年,科技浪潮汹涌澎湃的当下,智能数字化变革正进行得如火如荼,从去年二季度开始,触觉智能RK3562核心板上市以来,受到了火爆的关注,上百家客户选用了此方案,也获得了众多的好评与认可,为客户的降本增效提供了广阔的空间。随着原厂的更新,功能也迎来了一波重大的更新,无论是商业级(RK3562)还是工业级(RK3562J),都可支持NPU和2×CAN,不再二选一。我们触觉智能做了一个艰难又大胆的决定,为大家带来两大重磅福利,请继续往下看~福利一:RK3562核心板149元特惠再续,支持2×CAN
    Industio_触觉智能 2025-03-12 14:45 42浏览
  • 一、行业背景与用户需求随着健康消费升级,智能眼部按摩仪逐渐成为缓解眼疲劳、改善睡眠的热门产品。用户对这类设备的需求不再局限于基础按摩功能,而是追求更智能化、人性化的体验,例如:语音交互:实时反馈按摩模式、操作提示、安全提醒。环境感知:通过传感器检测佩戴状态、温度、压力等,提升安全性与舒适度。低功耗长续航:适应便携场景,延长设备使用时间。高性价比方案:在控制成本的同时实现功能多样化。针对这些需求,WTV380-8S语音芯片凭借其高性能、多传感器扩展能力及超高性价比,成为眼部按摩仪智能化升级的理想选
    广州唯创电子 2025-03-13 09:26 98浏览
  • 各大Logo更新汇报 | NEW百佳泰为ISO/IEC17025实验室,特为您整理2025年3月各大Logo的最新规格信息。USB™▶ USB Type-C/PD 互操作性MacBook Pro 16英寸(Apple M4 Max 芯片,36GB 内存–1TB SSD–140W USB-C电源适配器)或 MacBook Pro 16英寸(M4 Pro芯片,24GB内存–512 TB SSD–140W USB-C电源适配器),这些型号支持USB4 80Gbps传输速度和 140W EPR功率。需尽
    百佳泰测试实验室 2025-03-13 18:20 121浏览
  • 在追求更快、更稳的无线通信路上,传统射频架构深陷带宽-功耗-成本的“不可能三角”:带宽每翻倍,系统复杂度与功耗增幅远超线性增长。传统方案通过“分立式功放+多级变频链路+JESD204B 接口”的组合试图平衡性能与成本,却难以满足实时性严苛的超大规模 MIMO 通信等场景需求。在此背景下,AXW49 射频开发板以“直采+异构”重构射频范式:基于 AMD Zynq UltraScale+™ RFSoC Gen3XCZU49DR 芯片的 16 通道 14 位 2.5GSPS ADC 与 16
    ALINX 2025-03-13 09:27 85浏览
  • 现代旅游风气盛行,无论国内或国外旅游,导航装置无疑就是最佳的行动导游;在工作使用上也有部分职业(如:外送服务业)需要依靠导航系统的精准,才能将餐点准确无误的送至客户手上。因此手机导航已开始成为现代生活上不可或缺的手机应用之一。「它」是造成产品潜在风险的原因之一外送服务业利用手机导航,通常是使用手机支架固定在机车上,但行进间的机车其环境并不一定适用于安装手机,因行进间所产生的振动可能会影响部分的功能,进而导致受损。您是否曾在新闻报导中看过:有使用者回报在机车上使用手机架导航会造成相机无法开启?苹果
    百佳泰测试实验室 2025-03-13 18:17 124浏览
  • 一、行业背景与需求痛点智能电子指纹锁作为智能家居的核心入口,近年来市场规模持续增长,用户对产品的功能性、安全性和设计紧凑性提出更高要求:极致空间利用率:锁体内部PCB空间有限,需高度集成化设计。语音交互需求:操作引导(如指纹识别状态、低电量提醒)、安全告警(防撬、试错报警)等语音反馈。智能化扩展能力:集成传感器以增强安全性(如温度监测、防撬检测)和用户体验。成本与可靠性平衡:在复杂环境下确保低功耗、高稳定性,同时控制硬件成本。WTV380-P(QFN32)语音芯片凭借4mm×4mm超小封装、多传
    广州唯创电子 2025-03-13 09:24 112浏览
我要评论
0
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦