大型科技企业在AI领域的布局不仅体现在技术研发和产品创新上,还包括对底层硬件基础设施的投资和优化。这种全方位的布局策略显示了各大企业在抢占人工智能时代先机的决心和行动。

在生成式AI浪潮的推动下,英伟达GPU一直处于供需严重失衡状态,造成高性能AI芯片稀缺性持续存在。为了在未来AI技术竞争中处于有利地位,一些大型科技企业除了抢购英伟达GPU之外,也在探索其他的应对措施,减轻AI算力缺口的影响。

7月29日,苹果公司在一份技术论文中表示,其人工智能(AI)系统Apple Intelligence所依赖的两种AI模型是在谷歌设计的云端芯片上进行预训练的。此外,高通、谷歌和英特尔也曾计划联手打造全新的AI软件平台,以提供英伟达CUDA软件平台的潜在客户替代方案。

未来一段时间,AI算力需求将持续大幅增长,在给产业链带来机遇的同时,也将继续对AI芯片供给带来压力。英伟达GPU的硬件替代、AI算力租赁、异构适配……都将成为减少对英伟达依赖的替代选择。

英伟达GPU仍是“芯难求”

随着人工智能(AI)和高性能计算(HPC)的快速发展,特别是生成式AI模型的兴起,对高性能GPU的需求大幅增加。例如,训练大型语言模型需要成千上万颗GPU才能快速高效地完成,这使得市场对英伟达的H100等高端GPU需求居高不下。

图源:英伟达

与微软、谷歌等巨头相比,苹果虽布局AI相对较晚,但放弃造车计划之后,就开始重金押注AI技术,特别是推出了Apple Intelligence。该系统包括几个新功能,比如Siri的全新外观,更好的自然语言处理和文本字段中人工智能生成的摘要。未来一年里,苹果公司还计划推出基于生成式人工智能的功能,包括图像生成、表情符号生成和升级后的Siri,后者可以访问用户的个人信息,并在应用程序中采取行动。

在AI训练上,苹果公司还承认其人工智能系统Apple Intelligence的两个核心模型是在谷歌定制芯片上进行预训练的。具体来说,这些模型在谷歌设计的云端处理器TPU(张量处理单元)上进行了预训练。

公开文件还披露了具体的训练细节:例如,在8192块TPUv4芯片上从无到有训练服务器AFM,使用4096的序列长度和4096个序列的批量大小,进行了6.3万亿token的训练;而端侧AFM则在2048块TPUv5p芯片上进行训练。

实际上,在OpenAI于2022年底推出ChatGPT后不久,科技巨头纷纷布局人工智能(AI)已经成为一种趋势。过去一年多里,全球科技巨头如微软、谷歌和亚马逊等公司都在积极投入AI领域,并且各自展示了不同的进展和成果。这意味着大型科技公司对高性能AI芯片有着巨大的市场需求。

除了市场需求的因素,台积电的CoWoS(Chip on Wafer on Substrate)产能不足也是英伟达GPU短缺的主要瓶颈。CoWoS封装技术是英伟达GPU生产的关键环节,但因新CoWoS设备的交付时间超过6个月,部分设备从接到订单到生产安装需要长达10个月的时间,导致整体供应受限。

根据高盛的分析报告,CoWoS封装技术的产能成为制约AI芯片供应的最大瓶颈。尽管台积电计划从2022年到2026年每年增加60%以上的CoWoS产能,并且已经承诺在2024年大幅增加该技术的产能,但目前仍无法满足市场需求。预计到2024年底,台积电的月产能将达到每月2万片。然而,即便如此,台积电仍然难以完全跟上英伟达等客户的增长需求。

抢占人工智能时代先机

整体来看,生成式AI是当前AI发展的一个重要方向。它不仅在“实验室应用”中取得了显著进展,而且正在逐步走向现实应用。未来几年内,生成式AI预计将继续快速发展,并在各个行业中得到广泛应用。

同时,多模态AI技术的发展也为AI应用带来了新的机遇。这种技术能够实现更加复杂多样化的交互场景,有望在智能家居、智慧城市、医疗诊断和自动驾驶等领域打开全新的应用空间。

因此,从长远的视角来看,全球科技巨头们关注AI技术本身的发展,还竞相加入自研AI超算芯片的竞赛,不仅为了满足新一代AI模型训练和推理场景对大容量算力的需求,更是抢占AI发展的先机。

目前,从谷歌、微软到亚马逊和英伟达等公司,都在通过各种方式加速在人工智能领域的投入和发展。

其中,微软通过与法国AI初创公司MistralAI建立战略合作伙伴关系,将最新的AI模型引入其Azure云服务。此外,微软还与OpenAI保持紧密合作。谷歌此前通过向Anthropic公司投资20亿美元,进一步巩固其在生成式AI领域的领先地位。亚马逊对AI初创公司的投资力度也不容小觑,比如对Anthropic追加超27.5亿美元的投资。

Gartner预测,至2025年,生成式AI将广泛应用且潜力巨大,将在医疗、教育、制造业等领域展现新价值,推动社会经济发展。而Omdia报告也指出,大模型作为强大引擎,不仅提升AI Agent的学习与推理能力,还促进其在更多领域的应用。

对此,Meta首席执行官马克·扎克伯格和Alphabet首席执行官桑达尔·皮查伊最近都发表了评论:尽管行业内企业可能在人工智能基础设施方面存在过度投资,但若不加入的话,商业风险太高。

扎克伯格在与彭博社的艾米丽·张的播客中就表示:“落后的缺点是,你在未来10到15年最重要的技术方面处于劣势。”

租赁AI算力成为趋势

随着人工智能技术的快速发展,企业对AI计算资源的需求呈指数级增长。尤其是大模型训练等需要大量GPU资源的应用场景,使得算力需求远高于供给。这种供需失衡推动了算力租赁市场的兴起和发展。

图源:axis公司

正如上文马克·扎克伯格和桑达尔·皮查伊所提到的,即使AI基础设施存在过度投资,大型科技巨头也只能选择加入战局,落后的代价让这些科技企业无法承担。然而,中小初创科技企业缺资金、缺资源,更是在争夺AI芯片上缺少话语权,强如苹果这样的巨头,也在大模型训练上选择谷歌自主研发的张量处理单元(TPU)进行培训。

毫无疑问,训练生成式AI不仅需要硬件,还要面临大量的数据存储需求和密集的能源消耗。高昂的训练成本不是所有企业都能承担的,而且大量的重复投资也会造成不必要的浪费。因此,低成本、灵活高效的算力租赁成为许多中小企业进行大模型训练的首选解决方案。

值得一提的是,近日OpenAI首席执行官阿尔特曼的亲弟弟Jack Altman主理的Alt Capital领投了SF Compute 1200万美元的种子轮融资。这家名为SF Compute的初创公司通过共享和按需租赁,让用户以较低成本获取所需资源,短时间内使用大量计算能力。

在这种模式下,英伟达H100 GPU一小时的使用权不到21元人民币。根据SF Compute官网信息,当前英伟达H100 GPU的使用价格为2.85美元/小时(约20.7元人民币/小时)。而根据谷歌的网站,谷歌最新的TPU每小时的成本不到2美元,但芯片需要提前三年预订才能使用。

这一领域的其他公司还包括Vast. ai、RunPod,以及获英伟达投资的CoreWeave(据称其估值已接近190亿美元)。这足以说明算力租赁将是一个巨大红利市场。

未来,随着边缘AI市场不断升温,以及越来越多企业加码布局,将加速AI大模型在实际场景中的应用落地,也势必将进一步推升中小企业对AI算力的需求。数据显示,2022年全球算力市场的规模为4053亿美元,预计未来10年GPU市场的复合增长率超过30%。中国算力核心产业的规模为1.8万亿元,位居世界第二。

当然,由于国外严厉的AI芯片出口管制,加上终端巨量的AI应用,中国企业算力缺口更大。为此,中国企业积极在GPU异构适配领域寻求突破,实现AI算力平台的国产化替代和运行效率的大幅提升。中国企业如摩尔线程和景嘉微也在积极研发可以对标英伟达的GPU产品,并通过集群化解决方案来提升算力。

由此可见,大型科技企业在AI领域的布局不仅体现在技术研发和产品创新上,还包括对底层硬件基础设施的投资和优化。这种全方位的布局策略显示了各大企业在抢占人工智能时代先机的决心和行动。而在算力租赁的模式下,一众中小科技企业在AI大模型训练上也将得到足够、高效、灵活的算力支持。

责编:Jimmy.zhang
本文为EET电子工程专辑原创文章,禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
阅读全文,请先
您可能感兴趣
面对AI时代带来的差异化趋势、软件应用及开发时间长、软硬件协同难、高复杂度高成本等挑战,国产EDA仍需不断探索和创新。
股东诉讼指控英伟达的首席执行官黄仁勋隐藏了公司记录性收入增长主要由其旗舰产品GeForce GPU的挖矿销售驱动,而非游戏销售,导致投资者对公司的盈利来源和风险敞口产生错误认知。
今年初的GTC上,黄仁勋就说机器人的“ChatGPT时刻”要来了。也就是说这波AI驱动的机器人热潮要来了...最近的ROSCon China 2024大会似乎也能看到这种迹象...
近日,华为终端BG CEO何刚在和紫牛基金创始合伙人张泉灵的对话中表示,华为Mate 70系列每一颗芯片都有国产的能力。此外,日前在深圳宝安中学的一场讲座中,华为终端BG 董事长余承东也自豪地宣布Mate70实现了芯片的100%国产化。
华为Mate 70系列中的Mate 70搭载了麒麟9010芯片,而Mate 70 Pro/Pro+/RS则首发了麒麟9020芯片。近日,百万粉丝的网红博主@杨长顺维修家 对华为Mate 70 RS进行了拆解……
常情况下,英特尔的CEO在65岁时退休,而现年63岁的基辛格突然被退休,让市场感到意外。为了确保平稳过渡,英特尔董事会立即着手寻找新的CEO人选……
目前,智能终端NFC功能的使用频率越来越高,面对新场景新需求,ITMA多家成员单位一起联合推动iTAP(智能无感接近式协议)标准化项目,预计25年上半年发布1.0标准,通过功能测试、兼容性测试,确保新技术产业应用。
中科院微电子所集成电路制造技术重点实验室刘明院士团队提出了一种基于记忆交叉阵列的符号知识表示解决方案,首次实验演示并验证了忆阻神经-模糊硬件系统在无监督、有监督和迁移学习任务中的应用……
C&K Switches EITS系列直角照明轻触开关提供表面贴装 PIP 端子和标准通孔配置,为电信、数据中心和专业音频/视频设备等广泛应用提供创新的多功能解决方案。
投身国产浪潮向上而行,英韧科技再获“中国芯”认可
投资界传奇人物沃伦·巴菲特,一位94岁的亿万富翁,最近公开了他的遗嘱。其中透露了一个惊人的决定:他计划将自己99.5%的巨额财富捐赠给慈善机构,而只将0.5%留给自己的子女。这引起了大众对于巴菲特家庭
‍‍12月18日,深圳雷曼光电科技股份有限公司(下称“雷曼光电”)与成都辰显光电有限公司(下称“辰显光电”)在成都正式签署战略合作协议。双方将充分发挥各自在技术创新、产品研发等方面的优势,共同推进Mi
来源:观察者网12月18日消息,自12月2日美国发布新一轮对华芯片出口禁令以来,不断有知情人士向外媒透露拜登政府在卸任前将采取的下一步动作。美国《纽约时报》12月16日报道称,根据知情人士以及该报查阅
对于华为来说,今年的重磅机型都已经发完了,而明年的机型已经在研发中,Pura 80就是期待很高的一款。有博主爆料称,华为Pura 80将会用上了豪威OV50K传感器,同时电池容量达到5600毫安时。至
万物互联的时代浪潮中,以OLED为代表的新型显示技术,已成为人机交互、智能联结的重要端口。维信诺作为中国OLED赛道的先行者和引领者,凭借自主创新,实现了我国OLED技术的自立自强,成为中国新型显示产
又一地,新型储能机会来了?■ 印度:2032储能增长12倍,超60GW据印度国家银行SBI报告,印度准备大幅提升能源存储容量,预计到2032财年将增长12 倍,超60GW左右。这也将超过可再生能源本身
扫描关注一起学嵌入式,一起学习,一起成长在嵌入式开发软件中查找和消除潜在的错误是一项艰巨的任务。通常需要英勇的努力和昂贵的工具才能从观察到的崩溃,死机或其他计划外的运行时行为追溯到根本原因。在最坏的情
LG Display  12月18日表示,为加强OLED制造竞争力,自主开发并引进了“AI(人工智能)生产体系”。“AI生产体系”是AI实时收集并分析OLED工艺制造数据的系统。LG Display表
在科技浪潮翻涌的硅谷,马克·扎克伯格不仅是“脸书”帝国的掌舵人,更是以其谦逊低调的形象,在公众心中树立了独特的领袖风范。然而,在镁光灯难以触及的私人领域,扎克伯格与39岁华裔妻子普莉希拉·陈的爱情故事
极越汽车闪崩,留下一地鸡毛,苦的是供应商和车主。很多人都在关心,下一个倒下的新能源汽车品牌,会是谁?我们都没有未卜先知的超能力,但可以借助数据管中窥豹。近日,有媒体统计了15家造车新势力的销量、盈亏情