大型科技企业在AI领域的布局不仅体现在技术研发和产品创新上,还包括对底层硬件基础设施的投资和优化。这种全方位的布局策略显示了各大企业在抢占人工智能时代先机的决心和行动。

在生成式AI浪潮的推动下,英伟达GPU一直处于供需严重失衡状态,造成高性能AI芯片稀缺性持续存在。为了在未来AI技术竞争中处于有利地位,一些大型科技企业除了抢购英伟达GPU之外,也在探索其他的应对措施,减轻AI算力缺口的影响。

7月29日,苹果公司在一份技术论文中表示,其人工智能(AI)系统Apple Intelligence所依赖的两种AI模型是在谷歌设计的云端芯片上进行预训练的。此外,高通、谷歌和英特尔也曾计划联手打造全新的AI软件平台,以提供英伟达CUDA软件平台的潜在客户替代方案。

未来一段时间,AI算力需求将持续大幅增长,在给产业链带来机遇的同时,也将继续对AI芯片供给带来压力。英伟达GPU的硬件替代、AI算力租赁、异构适配……都将成为减少对英伟达依赖的替代选择。

英伟达GPU仍是“芯难求”

随着人工智能(AI)和高性能计算(HPC)的快速发展,特别是生成式AI模型的兴起,对高性能GPU的需求大幅增加。例如,训练大型语言模型需要成千上万颗GPU才能快速高效地完成,这使得市场对英伟达的H100等高端GPU需求居高不下。

图源:英伟达

与微软、谷歌等巨头相比,苹果虽布局AI相对较晚,但放弃造车计划之后,就开始重金押注AI技术,特别是推出了Apple Intelligence。该系统包括几个新功能,比如Siri的全新外观,更好的自然语言处理和文本字段中人工智能生成的摘要。未来一年里,苹果公司还计划推出基于生成式人工智能的功能,包括图像生成、表情符号生成和升级后的Siri,后者可以访问用户的个人信息,并在应用程序中采取行动。

在AI训练上,苹果公司还承认其人工智能系统Apple Intelligence的两个核心模型是在谷歌定制芯片上进行预训练的。具体来说,这些模型在谷歌设计的云端处理器TPU(张量处理单元)上进行了预训练。

公开文件还披露了具体的训练细节:例如,在8192块TPUv4芯片上从无到有训练服务器AFM,使用4096的序列长度和4096个序列的批量大小,进行了6.3万亿token的训练;而端侧AFM则在2048块TPUv5p芯片上进行训练。

实际上,在OpenAI于2022年底推出ChatGPT后不久,科技巨头纷纷布局人工智能(AI)已经成为一种趋势。过去一年多里,全球科技巨头如微软、谷歌和亚马逊等公司都在积极投入AI领域,并且各自展示了不同的进展和成果。这意味着大型科技公司对高性能AI芯片有着巨大的市场需求。

除了市场需求的因素,台积电的CoWoS(Chip on Wafer on Substrate)产能不足也是英伟达GPU短缺的主要瓶颈。CoWoS封装技术是英伟达GPU生产的关键环节,但因新CoWoS设备的交付时间超过6个月,部分设备从接到订单到生产安装需要长达10个月的时间,导致整体供应受限。

根据高盛的分析报告,CoWoS封装技术的产能成为制约AI芯片供应的最大瓶颈。尽管台积电计划从2022年到2026年每年增加60%以上的CoWoS产能,并且已经承诺在2024年大幅增加该技术的产能,但目前仍无法满足市场需求。预计到2024年底,台积电的月产能将达到每月2万片。然而,即便如此,台积电仍然难以完全跟上英伟达等客户的增长需求。

抢占人工智能时代先机

整体来看,生成式AI是当前AI发展的一个重要方向。它不仅在“实验室应用”中取得了显著进展,而且正在逐步走向现实应用。未来几年内,生成式AI预计将继续快速发展,并在各个行业中得到广泛应用。

同时,多模态AI技术的发展也为AI应用带来了新的机遇。这种技术能够实现更加复杂多样化的交互场景,有望在智能家居、智慧城市、医疗诊断和自动驾驶等领域打开全新的应用空间。

因此,从长远的视角来看,全球科技巨头们关注AI技术本身的发展,还竞相加入自研AI超算芯片的竞赛,不仅为了满足新一代AI模型训练和推理场景对大容量算力的需求,更是抢占AI发展的先机。

目前,从谷歌、微软到亚马逊和英伟达等公司,都在通过各种方式加速在人工智能领域的投入和发展。

其中,微软通过与法国AI初创公司MistralAI建立战略合作伙伴关系,将最新的AI模型引入其Azure云服务。此外,微软还与OpenAI保持紧密合作。谷歌此前通过向Anthropic公司投资20亿美元,进一步巩固其在生成式AI领域的领先地位。亚马逊对AI初创公司的投资力度也不容小觑,比如对Anthropic追加超27.5亿美元的投资。

Gartner预测,至2025年,生成式AI将广泛应用且潜力巨大,将在医疗、教育、制造业等领域展现新价值,推动社会经济发展。而Omdia报告也指出,大模型作为强大引擎,不仅提升AI Agent的学习与推理能力,还促进其在更多领域的应用。

对此,Meta首席执行官马克·扎克伯格和Alphabet首席执行官桑达尔·皮查伊最近都发表了评论:尽管行业内企业可能在人工智能基础设施方面存在过度投资,但若不加入的话,商业风险太高。

扎克伯格在与彭博社的艾米丽·张的播客中就表示:“落后的缺点是,你在未来10到15年最重要的技术方面处于劣势。”

租赁AI算力成为趋势

随着人工智能技术的快速发展,企业对AI计算资源的需求呈指数级增长。尤其是大模型训练等需要大量GPU资源的应用场景,使得算力需求远高于供给。这种供需失衡推动了算力租赁市场的兴起和发展。

图源:axis公司

正如上文马克·扎克伯格和桑达尔·皮查伊所提到的,即使AI基础设施存在过度投资,大型科技巨头也只能选择加入战局,落后的代价让这些科技企业无法承担。然而,中小初创科技企业缺资金、缺资源,更是在争夺AI芯片上缺少话语权,强如苹果这样的巨头,也在大模型训练上选择谷歌自主研发的张量处理单元(TPU)进行培训。

毫无疑问,训练生成式AI不仅需要硬件,还要面临大量的数据存储需求和密集的能源消耗。高昂的训练成本不是所有企业都能承担的,而且大量的重复投资也会造成不必要的浪费。因此,低成本、灵活高效的算力租赁成为许多中小企业进行大模型训练的首选解决方案。

值得一提的是,近日OpenAI首席执行官阿尔特曼的亲弟弟Jack Altman主理的Alt Capital领投了SF Compute 1200万美元的种子轮融资。这家名为SF Compute的初创公司通过共享和按需租赁,让用户以较低成本获取所需资源,短时间内使用大量计算能力。

在这种模式下,英伟达H100 GPU一小时的使用权不到21元人民币。根据SF Compute官网信息,当前英伟达H100 GPU的使用价格为2.85美元/小时(约20.7元人民币/小时)。而根据谷歌的网站,谷歌最新的TPU每小时的成本不到2美元,但芯片需要提前三年预订才能使用。

这一领域的其他公司还包括Vast. ai、RunPod,以及获英伟达投资的CoreWeave(据称其估值已接近190亿美元)。这足以说明算力租赁将是一个巨大红利市场。

未来,随着边缘AI市场不断升温,以及越来越多企业加码布局,将加速AI大模型在实际场景中的应用落地,也势必将进一步推升中小企业对AI算力的需求。数据显示,2022年全球算力市场的规模为4053亿美元,预计未来10年GPU市场的复合增长率超过30%。中国算力核心产业的规模为1.8万亿元,位居世界第二。

当然,由于国外严厉的AI芯片出口管制,加上终端巨量的AI应用,中国企业算力缺口更大。为此,中国企业积极在GPU异构适配领域寻求突破,实现AI算力平台的国产化替代和运行效率的大幅提升。中国企业如摩尔线程和景嘉微也在积极研发可以对标英伟达的GPU产品,并通过集群化解决方案来提升算力。

由此可见,大型科技企业在AI领域的布局不仅体现在技术研发和产品创新上,还包括对底层硬件基础设施的投资和优化。这种全方位的布局策略显示了各大企业在抢占人工智能时代先机的决心和行动。而在算力租赁的模式下,一众中小科技企业在AI大模型训练上也将得到足够、高效、灵活的算力支持。

责编:Jimmy.zhang
本文为EET电子工程专辑原创文章,禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
阅读全文,请先
您可能感兴趣
“机器狼群”是一种高度智能化的无人作战系统,由多个不同功能的“机器狼”组成,每个“机器狼”在团队中扮演特定角色,形成高效的协同作战单元。
新发布的酷睿Ultra 200S处理器更节能了,但作为台式机处理器,更低的功耗真的有用吗?
今天我又把同事的七彩虹战斧GeForce RTX 4060 8GB GDDR6显卡给拆了。发现它虽然用料不怎么样,但性能却非常地好。
有分析认为,台积电断供7纳米及更先进工艺的芯片,一方面是回应此前的“白手套”事件,配合美国对中国大陆人工智能产业发展进行限制,以避免进一步的法律和政治风险,另一方面则是向新一任总统特朗普“投诚”,毕竟时间点很微妙。
为了进一步挽救英特尔,美国政府的政策制定者们提供了一个选择,将英特尔的芯片设计业务与 AMD 或 Marvell 等竞争对手合并。当前的这些决策与谈判均出于预防的目的,如果英特尔的财务状况出现持续恶化,美国政府的担忧将变成潜在的备用选择.....
由于较早预判了transformer网络架构的发展,爱芯通元AI处理器原生支持transformer,这也保证了其能效比领先于更高端的AI芯片,更加契合边缘大模型的落地应用。基于爱芯智眸AI-ISP和爱芯通元NPU两大核心技术,爱芯元智在智慧城市、智能驾驶和边缘智能等领域不断落地。
为了更直观地了解FinFET到GAAFET架构世代的差异,本文利用高倍率的电子显微镜影像进行深入的探讨与分析,观察其于结构微观层面上的特征...
汽车技术领域正处于关键的转折点,其未来依托于动态且适应性强的系统,并可通过软件不断提升驾驶体验。
连接标准联盟很高兴宣布 Matter 1.4 现已正式发布,可供设备制造商和生态平台开发应用。这次更新是Matter生态系统迈出的重要一步。Matter 1.4带来了一系列增强功能......
根植雄厚研发实力及物联网领域的深耕实践,汇顶科技面向新兴车载互联应用全力进击。旗下首款高可靠性、高性能车规级低功耗蓝牙SoC——GR5405,已成功通过AEC-Q100 Grade 2认证。
据36氪报道,保时捷负责采购的执行董事傅伦轲(Barbara Frenkel)向其透露,“我正在与电池、ADAS、互联、娱乐系统等方向的中国供应商接触,希望建立新的合作。”今年前三季度,保时捷在中国市
台积电7nm停供中国大陆!集微网报道称,从多个消息源获悉,台积电已经向目前所有中国大陆AI芯片客户发送正式电子邮件,宣布自下周(11月11日)起,将暂停向中国大陆AI/GPU客户供应所有7纳米(nm)
互联网与科技企业每日重点资讯文 | 苏丁巨头动向歌尔股份被曝成为苹果2026年两款新品供应商天风国际分析师郭明錤爆料称,苹果将首次进军智能家居IP Camera(网络摄像头)市场,计划2026年量产,
芯片超人现有1600平米芯片智能仓储基地,现货库存型号1000+,品牌高达100种,5000万颗现货库存芯片,总重量10吨,库存价值高达1亿+。同时,芯片超人在深圳设有独立实验室,每颗物料均安排QC质
 会 议 预 告  活动倒计时 8 天11月20-21日 | 行家说新型显示全产业链年会近期,点莘技术、秋水半导体、纳视智能、睿励科学仪器等4家Micro LED相关企业相继完成新一轮融资,单笔金额最
ABOUT US研鼎公司总部位于上海浦东张江高科技园区,在深圳、北京和韩国设立研发和运营。是影像测试设备与解决方案领军企业,致力于视觉测试设备和分析软件产品的研发,可为客户提供优质的影像实验室Turn
EETOP 11月12日消息,据外媒报道,华为公司已要求美国法官驳回一项联邦起诉书中的大部分指控。该起诉书指控华为试图窃取美国竞争对手的技术机密,并在其伊朗业务问题上误导银行。华为在上周五晚间提交给法
随着铜箔行业上市公司2024年度三季报的陆续发布,整体行业呈现出“增收不增利”的局面,财报数据如表1所示。表1 铜箔上市公司2024年前三季度财报数据面对上述现实,中国电子材料行业协会电子铜箔材料分会
国芯网[原:中国半导体论坛] 振兴国产半导体产业!   不拘中国、放眼世界!关注世界半导体论坛↓↓↓11月12日消息,据报道,面对AMD和NVIDIA的激烈竞争,英特尔计划在2025年通过扩大与台积电
艾迈斯欧司朗今日宣布,推出新一代高性能LED——OSCONIQ® C 3030。这款尖端LED系列专为严苛的户外及体育场照明环境而设计,兼具出色的发光强度与卓越的散热效能。其支持高达