分析丨亚马逊自研造芯,能否复制Graviton的成功经验?

原创 AI芯天下 2024-12-13 20:30

·聚焦:人工智能、芯片等行业

欢迎各位客官关注、转发






前言

亚马逊目前拥有三款自主研发的芯片,分别是CPU芯片Graviton 4,主要与英特尔的产品竞争;


AI训练芯片Trainium 2,与英伟达的A100/H100等高端AI训练芯片竞争;


以及AI推理芯片Inferentia 2,与英伟达的A10等入门级AI推理芯片竞争。



作者 | 方文三
图片来源 |  网 络 


[雷尼尔计划]:构建规模庞大的算力集群


近日,Anthropic公司联合创始人兼首席计算官汤姆·布朗在亚马逊AWS举办的年度全球大会上,正式对外公布了[雷尼尔计划]。


该计划的核心目标在于,Anthropic计划构建一个规模庞大的算力集群,其中将集成数十万枚亚马逊自主研发的芯片,这一数量将是Anthropic现有算力集群的五倍以上。


若[雷尼尔计划]得以实施,Anthropic将跻身全球最大的人工智能算力集群之一。


Anthropic是一家获得亚马逊投资的AI创业公司,其主要竞争对手为微软支持的AI创业公司OpenAI。


Anthropic推出的Claude系列模型在性能上表现出色,是市场上为数不多能与OpenAI旗下GPT-4模型相媲美的产品。


Anthropic选择使用亚马逊自研芯片的一个关键因素在于亚马逊是其主要投资者,两家公司之间存在深度的合作关系。


亚马逊还期望Anthropic能够采用其自研的Trainium系列AI训练芯片和Inferentia系列AI推理芯片来部署其大型模型。


在这样的合作框架下,Anthropic的大量训练和推理算力需求将直接促进亚马逊AWS的收入增长;


并可能吸引一批对生成式AI技术感兴趣的商业客户,进而推动其他基础云服务产品的交叉销售。



[登月]计划:在自身数据中心部署十万颗自研芯片


近日,彭博社报道,为降低对英伟达芯片的依赖,亚马逊已悄然启动一项名为[登月]的计划。


该计划的核心是在其位于德克萨斯州奥斯汀的工程实验室中,加速开发一款名为Trainium2的新型人工智能芯片。


该芯片的开发目标是在亚马逊自身的数据中心内部署十万颗,旨在提升数据处理的效率并降低人工智能芯片的采购成本。


Trainium2的研发始于亚马逊在2015年收购Annapurna Labs之后,该项目便在秘密中进行。


根据亚马逊提供的数据,Trainium2相较于前一代产品,在训练速度上提升了四倍,能效提升了两倍,内存容量更是达到了之前的三倍。


该芯片能够在EC2 UltraClusters中扩展至十万颗芯片,从而在极短的时间内训练基础模型和大型语言模型。


目前,Trainium2芯片正在接受包括Anthropic、Databricks、Stockmark等人工智能初创公司以及德国电信、日本理光等多家客户的测试。


在今年十月,Databricks与亚马逊网络服务(AWS)签署了一项全面的合作协议,承诺采纳AWS的Trainium芯片。


尽管Databricks的AI工具目前主要依赖于英伟达的硬件平台,但该公司已计划逐步以Trainium芯片取代部分现有硬件。


亚马逊AWS的首席执行官马特·加曼近期宣布,计划在2025年量产新一代AI训练芯片Trainium 3。


该芯片采用3纳米工艺,性能是前代产品Trainium 2的两倍,性价比预计提升40%。


Trainium3芯片是为满足下一代生成式人工智能工作负载的高性能需求而专门设计的,它将帮助客户更快速地构建更大规模的模型,并在模型部署时提供卓越的性能。



云厂商自研AI芯片的意愿愈发强烈


目前,亚马逊的AWS和阿里巴巴的云服务已经实现了CPU的大规模量产,有效减少了计算能力的成本。


即便面临更高的成本,为了摆脱对外部技术的依赖,部分云服务提供商仍然坚持自主研发的策略。


数据中心芯片市场主要由CPU芯片和GPU/AI芯片两大领域构成。在GPU/AI芯片市场中,英伟达公司占据了主导地位,其市场份额超过九成,目前受到的影响相对较小。


然而,这种情况可能不会持久。近年来,云服务提供商为了在大型模型这一关键领域占据优势,大量采购英伟达的AI芯片,导致其资本支出大幅增加。


因此,云服务提供商自行研发AI芯片的意愿愈发强烈。


若云服务提供商能够实现自主研发芯片的大规模生产,其采购与运营成本将得以显著降低。


2024年,亚马逊AWS全球新增的CPU算力中,超过一半将基于Arm架构的Graviton系列芯片,其规模已超越x86架构芯片。


第三方数据表明,2023年推出的M7g系列实例中,基于Amazon Graviton的实例已与英特尔、AMD形成三足鼎立之势,这进一步证实了Graviton芯片在通用计算实例中的广泛认可。


根据云成本管理和优化平台Vantage的调查报告,2024年第一季度,在Amazon EC2 M7系列通用实例的成本支出方面,采用Graviton的M7g系列的市场份额已超过三分之一(34.5%)。


至2024年第二季度,在Amazon RDS、Amazon ElastiCache和Amazon OpenSearch等托管服务中,基于Amazon Graviton的选项已超越英特尔,越来越多的客户倾向于选择基于Graviton的托管服务。


包括苹果公司、全球最大的ERP(企业资源管理)软件企业SAP、AI创业公司Anthropic、知名数据分析企业Datadog、社交平台Pinterest在内的多家知名企业,都是亚马逊AWS三款自研芯片云服务的用户。


苹果公司的搜索产品采用了Graviton 4和Inferentia 2的云服务,其机器学习推理工作负载的效率提升了40%以上。



规模优势是降低成本的最优解


若非亚马云科技所具备的规模优势,Amazon Graviton便难以吸引众多用户,其出货量亦不会如此庞大。


规模优势的缺失将导致Amazon Graviton的成本无法降低,正是云服务的规模与芯片制造的规模共同铸就了Amazon Graviton的成功。


云计算的庞大规模为亚马逊云科技提供了硬件研发的坚实基础,而硬件研发的成果又进一步促进了技术创新。


这些创新成果随着规模的扩大而不断放大效益。


同时,技术创新亦反向推动了云计算服务能力的提升,形成了一个良性循环。


规模效应在其他自研芯片上的作用亦不可忽视。


除了Amazon Graviton之外,亚马逊云科技还自主研发了基于ASIC芯片的Amazon Nitro系统,以及专为机器学习训练设计的Amazon Trainium和用于机器学习推理的Amazon Inferentia芯片,这些芯片同样得益于亚马逊云科技的规模优势。


真正的考验在于大规模部署时,用户的实际反馈将决定新芯片的成功与否。


AWS的一个显著优势在于其芯片能够以更低的能耗运行,这使得其数据中心的运行更为高效,从而有助于降低成本。


若将英伟达的GPU比作强大的通用工具,那么亚马逊则能够针对特定任务和服务优化其芯片。


分析师指出,对于大多数企业而言,选择英伟达还是亚马逊并非紧迫问题。


因为大型企业更关注如何从运行人工智能模型中获取价值,而非如何训练它们。


这样的市场趋势对亚马逊而言是利好消息,因为客户不会注意到云服务背后是由哪家芯片厂商提供支持。


定制硬件可以提供非常具体的并行化功能,这可能比通用型GPU的性能更优。



结尾:任何技术路径所面临的挑战都是巨大的


与英伟达的GPU相比,亚马逊的芯片更专注于特定任务的优化,正如小型轿车与全能旅行车的比较,亚马逊的芯片更为精简和高效。


尽管亚马逊投入巨大,但目前AWS和Annapurna在人工智能基础设施市场中对英伟达的影响仍然有限。


此外,由于初期用量低,可能会导致高昂的成本,再加上研发成本,这无疑对公司在推进自研芯片方面构成了挑战。


在软件领域,挑战更为严峻。目前全球主要的通用并行图形处理单元(GPGPU)大多依赖于英伟达的CUDA生态系统,若不兼容则难以部署。


这使得英伟达在软硬件结合方面具有显著的先发优势。重新构建软件生态系统虽然是一条可行之路,但一旦成功,将带来巨大的商业利益。


然而,分析人士认为,亚马逊目前提供的Neural SDK软件工具尚处于起步阶段,尚无法与英伟达的解决方案相抗衡。


总结而言,亚马逊Trainium2芯片的抱负堪比人类登月,一旦成功,其商业回报将是巨大的。然而,如同登月任务充满风险,Trainium2芯片要成功替代英伟达H100,还有很长的路要走。


部分资料参考:财经杂志:《下一个OpenAI+微软?Anthropic将使用数十万枚亚马逊自研芯片》,Z Finance:《亚马逊迎来对英伟达关键一战,正部署10万颗自研二代芯片》,智能进化论:《自研芯片逾十年,亚马逊云科技Graviton系列芯片全面成熟》,雷锋网:《亚马逊自研3nm Trainium芯片,能否成为英伟达之外的第二选择?》,电子发烧友网:《亚马逊启动[登月]计划,目标部署10万颗自研AI芯片》,快客硬核AI:《亚马逊推出自研AI芯片,挑战Nvidia市场霸主地位》


本公众号所刊发稿件及图片来源于网络,仅用于交流使用,如有侵权请联系回复,我们收到信息后会在24小时内处理。



END


推荐阅读:


商务合作请加微信勾搭:
18948782064

请务必注明:

「姓名 + 公司 + 合作需求」


AI芯天下 聚焦人工智能,AI芯片,5G通讯等行业动态
评论 (0)
  • 前言本文主要演示基于TL3576-MiniEVM评估板HDMI OUT、DP 1.4和MIPI的多屏同显、异显方案,适用开发环境如下。Windows开发环境:Windows 7 64bit、Windows 10 64bitLinux开发环境:VMware16.2.5、Ubuntu22.04.5 64bitU-Boot:U-Boot-2017.09Kernel:Linux-6.1.115LinuxSDK:LinuxSDK-[版本号](基于rk3576_linux6.1_release_v
    Tronlong 2025-04-23 13:59 114浏览
  • 文/Leon编辑/cc孙聪颖‍4月18日7时,2025北京亦庄半程马拉松暨人形机器人半程马拉松正式开跑。与普通的半马比赛不同,这次比赛除了有人类选手,还有21支人形机器人队伍参赛,带来了全球首次人类与机器人共同竞技的盛况。参赛队伍中,不乏明星机器人企业及机型,比如北京人形机器人创新中心的天工Ultra、松延动力的N2等。宇树G1、众擎PM01,则是由城市之间科技有限公司购置及调试,并非厂商直接参赛。考虑到机器人的适用场景和续航力各有不同,其赛制也与人类选手做出区别:每支赛队最多可安排3名参赛选手
    华尔街科技眼 2025-04-22 20:10 117浏览
  •   无人机结构仿真与部件拆解分析系统平台解析   北京华盛恒辉无人机结构仿真与部件拆解分析系统无人机技术快速发展的当下,结构仿真与部件拆解分析系统平台成为无人机研发测试的核心工具,在优化设计、提升性能、降低成本等方面发挥关键作用。以下从功能、架构、应用、优势及趋势展开解析。   应用案例   目前,已有多个无人机结构仿真与部件拆解分析系统在实际应用中取得了显著成效。例如,北京华盛恒辉和北京五木恒润无人机结构仿真与部件拆解分析系统。这些成功案例为无人机结构仿真与部件拆解分析系统的推广和应用提
    华盛恒辉l58ll334744 2025-04-23 15:00 175浏览
  • 故障现象一辆2016款奔驰C200L车,搭载274 920发动机,累计行驶里程约为13万km。该车组合仪表上的防侧滑故障灯、转向助力故障灯、安全气囊故障灯等偶尔异常点亮,且此时将挡位置于R挡,中控显示屏提示“后视摄像头不可用”,无法显示倒车影像。 故障诊断用故障检测仪检测,发现多个控制单元中均存储有通信类故障代码(图1),其中故障代码“U015587 与仪表盘的通信存在故障。信息缺失”出现的频次较高。 图1 存储的故障代码1而组合仪表中存储有故障代码“U006488 与用户界
    虹科Pico汽车示波器 2025-04-23 11:22 89浏览
  • 一、技术背景与市场机遇在智能家居高速发展的今天,用户对家电设备的安全性、智能化及能效表现提出更高要求。传统取暖器因缺乏智能感知功能,存在能源浪费、安全隐患等痛点。WTL580-C01微波雷达感应模块的诞生,为取暖设备智能化升级提供了创新解决方案。该模块凭借微波雷达技术优势,在精准测距、环境适应、能耗控制等方面实现突破,成为智能取暖器领域的核心技术组件。二、核心技术原理本模块采用多普勒效应微波雷达技术,通过24GHz高频微波信号的发射-接收机制,实现毫米级动作识别和精准测距。当人体进入4-5米有效
    广州唯创电子 2025-04-23 08:41 143浏览
  • 文/Leon编辑/cc孙聪颖‍在特朗普政府发起的关税战中,全球芯片产业受到巨大冲击,美国芯片企业首当其冲。据报道称,英伟达本周二公布的8-K文件显示,美国政府通知该公司向中国(包括中国香港及澳门)销售尖端芯片(H20)时,需要获得美国政府的许可。文件发布后,英伟达预计会在第一季度中额外增加55亿美元的相关费用计提。随后,英伟达股价单日下跌6.9%,市值一夜蒸发约1890亿美元(约合人民币1.37万亿元)。至截稿时,至截稿时,其股价未见止跌,较前日下跌4.51%。北京时间4月17日,英伟达创始人、
    华尔街科技眼 2025-04-22 20:14 115浏览
  • 一、行业背景与市场需求高血压作为全球发病率最高的慢性病之一,其早期监测与管理已成为公共卫生领域的重要课题。世界卫生组织数据显示,全球超13亿人受高血压困扰,且患者群体呈现年轻化趋势。传统血压计因功能单一、数据孤立等缺陷,难以满足现代健康管理的需求。在此背景下,集语音播报、蓝牙传输、电量检测于一体的智能血压计应运而生,通过技术创新实现“测量-分析-管理”全流程智能化,成为慢性病管理的核心终端设备。二、技术架构与核心功能智能血压计以电子血压测量技术为基础,融合物联网、AI算法及语音交互技术,构建起多
    广州唯创电子 2025-04-23 09:06 156浏览
  •   复杂电磁环境模拟系统平台解析   一、系统概述   北京华盛恒辉复杂电磁环境模拟系统平台是用于还原真实战场或特定场景电磁环境的综合性技术平台。该平台借助软硬件协同运作,能够产生多源、多频段、多体制的电磁信号,并融合空间、时间、频谱等参数,构建高逼真度的电磁环境,为电子对抗、通信、雷达等系统的研发、测试、训练及评估工作提供重要支持。   应用案例   目前,已有多个复杂电磁环境模拟系统在实际应用中取得了显著成效。例如,北京华盛恒辉和北京五木恒润复杂电磁环境模拟系统。这些成功案例为复杂电
    华盛恒辉l58ll334744 2025-04-23 10:29 170浏览
  •   陆地边防事件紧急处置系统平台解析   北京华盛恒辉陆地边防事件紧急处置系统平台是整合监测、预警、指挥等功能的智能化综合系统,致力于增强边防安全管控能力,快速响应各类突发事件。以下从系统架构、核心功能、技术支撑、应用场景及发展趋势展开全面解读。   应用案例   目前,已有多个陆地边防事件紧急处置系统在实际应用中取得了显著成效。例如,北京华盛恒辉和北京五木恒润陆地边防事件紧急处置系统。这些成功案例为陆地边防事件紧急处置系统的推广和应用提供了有力支持。   一、系统架构   感知层:部
    华盛恒辉l58ll334744 2025-04-23 11:22 120浏览
  • 在科技飞速发展的当下,机器人领域的每一次突破都能成为大众瞩目的焦点。这不,全球首届人形机器人半程马拉松比赛刚落下帷幕,赛场上的 “小插曲” 就掀起了一阵网络热潮。4月19日,北京亦庄的赛道上热闹非凡,全球首届人形机器人半程马拉松在这里激情开跑。20支机器人队伍带着各自的“参赛选手”,踏上了这21.0975公里的挑战之路。这场比赛可不简单,它将机器人放置于真实且复杂的动态路况与环境中,对机器人在运动控制、环境感知和能源管理等方面的核心技术能力进行了全方位的检验。不仅要应对长距离带来的续航挑战,还要
    用户1742991715177 2025-04-22 20:42 103浏览
  •   后勤实验仿真系统平台深度解析   北京华盛恒辉后勤实验仿真系统平台依托计算机仿真技术,是对后勤保障全流程进行模拟、分析与优化的综合性工具。通过搭建虚拟场景,模拟资源调配、物资运输等环节,为后勤决策提供数据支撑,广泛应用于军事、应急管理等领域。   应用案例   目前,已有多个后勤实验仿真系统平台在实际应用中取得了显著成效。例如,北京华盛恒辉和北京五木恒润后勤实验仿真系统平台。这些成功案例为后勤实验仿真系统平台的推广和应用提供了有力支持。   一、核心功能   (一)后勤资源模拟
    华盛恒辉l58ll334744 2025-04-23 15:39 138浏览
  •   电磁频谱数据综合管理平台系统解析   一、系统定义与目标   北京华盛恒辉电磁频谱数据综合管理平台融合无线传感器、软件定义电台等前沿技术,是实现无线电频谱资源全流程管理的复杂系统。其核心目标包括:优化频谱资源配置,满足多元通信需求;运用动态管理与频谱共享技术,提升资源利用效率;强化频谱安全监管,杜绝非法占用与干扰;为电子战提供频谱监测分析支持,辅助作战决策。   应用案例   目前,已有多个电磁频谱数据综合管理平台在实际应用中取得了显著成效。例如,北京华盛恒辉和北京五木恒润电磁频谱数
    华盛恒辉l58ll334744 2025-04-23 16:27 163浏览
  •   高海拔区域勤务与装备保障调度系统平台解析   北京华盛恒辉高海拔区域勤务与装备保障调度系统平台专为高海拔特殊地理环境打造,致力于攻克装备适应、人员健康保障、物资运输及应急响应等难题。以下从核心功能、技术特点、应用场景及发展趋势展开全面解读。   应用案例   目前,已有多个高海拔区域勤务与装备保障调度系统在实际应用中取得了显著成效。例如,北京华盛恒辉和北京五木恒润高海拔区域勤务与装备保障调度系统。这些成功案例为高海拔区域勤务与装备保障调度系统的推广和应用提供了有力支持。   一、核心
    华盛恒辉l58ll334744 2025-04-24 10:13 24浏览
我要评论
0
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦