NVIDIA、谷歌、亚马逊、微软,为什么AI厂商都青睐它?

电子工程世界 2025-02-26 08:02
▲ 点击上方蓝字关注我们,不错过任何一篇干货文章!
Arm 基础设施业务负责人 Mohamed Awad 在接受 CRN 的深入采访时谈到了这家英国芯片设计师如何成功说服亚马逊网络服务、谷歌云、微软 Azure 和 Nvidia 使用其芯片技术来设计数据中心的定制 CPU 和其他关键组件。他还透露了 Arm 的下一步计划。
去年 12 月,亚马逊(AWS)高管戴夫·布朗 (Dave Brown) 宣布,这家云计算巨头过去两年采购的CPU中,一半以上来自其基于 Arm 的自主芯片 Graviton 芯片,这表明 AWS 已在很大程度上放弃使用英特尔和 AMD 设计的 x86 处理器,转而大范围使用自主研发的芯片。

这一成功离不开 Arm,日前Arm基础设施业务总经理Mohamed Awad接受了CRN的专访,他负责推动这家英国芯片设计公司与AWS、Microsoft Azure、Google Cloud和Nvidia 等公司的业务往来。这些公司越来越多地采用 Arm 的指令集架构、CPU蓝图和其他模块化技术来设计自己的定制芯片。

“这意义重大,老实说,我当时都觉得‘哇哦’。我知道这很重要。我不确定我是否完全理解这些人的投入程度。我们看到,在很多方面,所有的超大规模企业都做出了类似的投入,”Awad 在去年 12 月接受 CRN 采访时表示,当时距离布朗发表声明仅一周。Awad 是博通的资深员工,曾负责 Arm 的基础设施业务长达四年。

虽然英特尔长期以来一直是数据中心和云基础设施服务器 CPU 的主要供应商,但过去十年来,这家半导体巨头的影响力已经被两股主要力量削弱: 同样基于X86的AMD,以及Arm和背后的大客户们,包括(AWS、微软 Azure、谷歌云以及英伟达)。

2018 年,AWS 率先在其Graviton 芯片中推出基于 Arm 的服务器 CPU。随后,Nvidia 于 2022 年推出了用于 Grace 和 Grace Hopper 超级芯片的Grace CPU。两年后,Microsoft Azure 和 Google Cloud 分别推出了由其 Cobalt 和 Axion CPU 驱动的云芯片。

Awad表示,Arm 2019年推出了服务器级IP Neoverse,并且推出了一系列适配的软件。另外,Amad还认为,由于人工智能需要大量数据和计算,而且受限于功率、空间和资金,这些公司越来越需要在系统层面进行设计,以便优化每个组件,从而实现最佳效率和性能。这导致他们越来越多地构建自己的组件,无论是 CPU、加速器芯片还是网络芯片,这也是转向Arm的关键。

Nvidia 的新款 Grace Blackwell GB200 NVL72,带有 36 个 Grace Blackwell GB200 超级芯片,每个超级芯片包含一个基于 Arm 的 Grace CPU和两个由 Nvidia 设计的 Blackwell GPU。同时还包括 Nvidia 的BlueField-3 数据处理单元(DPU) 和用于网络目的的 NVLink Switch 芯片。

Awad 表示,AWS、Microsoft Azure 和 Google Cloud 正在采取与 Nvidia 类似的战略。

“他们都在开发自己的加速器;都在构建自己的网络;都在开发自己的 CPU。客户开发这些 CPU,现在他们正在围绕Arm开发芯片并优化软件系统,坦率地说,我认为这对 Arm 来说是一个巨大的推动力,”他说。

Awad还表示,Arm正在帮助其他公司开发自己的芯片,无论是初创公司还是大公司。为此,Arm采用的一个关键方法是继续降低开发定制芯片的成本,包括 Neoverse IP、预集成 Neoverse 计算子系统和 Arm Total Design 等不同的业务方式。

“坦率地说,还有很多其他参与者,很多其他大参与者,我们将继续与他们合作,找到降低采用成本的方法,降低他们内部开发的成本,这将是我们关注的重点。”他说。

是什么推动微软、谷歌、亚马逊、英伟达等公司开发自己的 CPU?

我认为归根结底,这归结于三件事。这三件事都在一个完美的时间汇聚在一起。

首先,这是Arm坚持投资的成果。Arm 和更广泛的生态系统至少在软件生态系统中投资了 15 年。所以这一切都是为了专注于云原生的软件,它利用了过去十多年来真正出现的新客户端——服务器范式。我们一直在稳步追逐这个市场。

第二是如何更广泛地处理。Arm先构建了Neoverse CPU核心,当然,这利用了我们在功耗等方面的优势,然后在此基础上添加了基础设施所需的功能和性能。

除此之外,我们最近还在构建 Neoverse计算子系统,可以让市场上的更多参与者能够更容易地获得硅片设计。如果回顾五年或十年前,当您看到谁在为基础设施、服务器构建 Arm 时,这些都是试图使用自己的微架构构建自己的 CPU 内核的人,然后他们必须将所有其他部分组合在一起。然后,在此基础上,他们将获得巨大的软件提升。因此,软件现在处于良好状态。最重要的是,硅片和这些东西的可访问性已准备就绪,因为我们不仅拥有基础设施级内核,而且还将它们与计算子系统集成在一起,使他们可以非常轻松地采用。

第三点就是如今正处在人工智能的巨大转折点,如果从系统级思维思考,因为需要大量的数据和计算,现实情况是数据中心资源是有限的,资本支出是有限的,因此功耗非常重要。

因此,你所看到的这些超大规模公司,如 Nvidia,正在研究他们的整个解决方案。因此,无论是 Google、Microsoft、AWS 还是 Nvidia,都需要从头开始设计,甚至构建完整的芯片组,包括网络交换、加速器以及其他系统。客户需要的是围绕数据中心构建芯片,而不是围绕芯片构建数据中心,因此Arm提供一揽子优化系统效率和性能,从而让客户专注于他们自身的需求。

尤其是 Nvidia,当你看到他们的旗舰 AI 产品时,你会发现非常有趣,它原来是 Grace Hopper Superchip,现在变成了带有 GB200 NVL72 系统的 Grace Blackwell。

我曾见过有人谈论使用 CPU 来处理 AI 工作负载本身,可能更多的是推理。但您对基于 Arm 的 CPU 在 AI 领域的应用有何看法?

所以有几件事。最明显的答案是围绕加速器的管理。加速器就是加速器,无论是 GPU 还是ASIC。如果没有 CPU 的帮助,它就无法运行,CPU 可以帮助完成一些预处理、检查点以及与加速器芯片相关的所有其他工作,这就是为什么会有 Grace Blackwell 或 Grace Hopper 类型的系统以及它们存在的原因。

从历史上看,一个 x86 节点会配备四个加速器,现在,它们的比例是一比一或一比二,除了管理之外,还负责内存一致性等工作。

最终,推理将渗透到计算的各个方面,这意味着它不会只与云端系统相关联,还将渗透到从墙上的温度传感器到数据中心的所有地方。在每种用例中,您都将拥有独特的应用程序,这些应用可以执行推理。模型大小将决定推理的落脚点,根据不同细粒度选择不同的芯片。

对于非常大的推理应用,可能需要Grace Blackwell类的产品,对于最小的推理负载,CPU就可以执行了。所以Arm提供了SVE,[可扩展矢量扩展]。SVE会和 CPU以及其他小型加速器一起处理,与 SOC 内的每个 CPU 内核紧密耦合,因此,随着时间的推移,将会出现各种不同规模的加速器。

您能否谈谈为什么从成本角度来看设计基于 Arm 的处理器对这些公司具有吸引力?

对于内部产品而言,只要 CPU 或芯片可以提供更好的总拥有成本,他就会有一个稳定的客户。

这其中,成本有两个方面构成。第一个方面是设计芯片的实际成本,Arm的Total Design以及计算子系统可以降低开发成本。另外,除了芯片的物理设计之外,还有重要的软件生态投入。包括Oracle、Microsoft、Google、AWS 等,他们不止采用了 Arm,还在积极投资软件生态系统。尤其是“每瓦每美元的性能表现,Arm最出色。”

您如何看待 Arm 在本地边缘服务器领域的发展?

事实上,早在 Neoverse 推出时,我们就关注边缘的节点供应商,他们也在使用类似云原生的软件堆栈,这也是我们如此紧密合作建立 Arm Total Design 生态系统的原因之一,采用Neoverse计算子系统的客户而言你,因为它实际上正在开始创建实际上可互换的芯片。因此,我们有许多这样的团队正在基于我们的计算构建计算芯片,这些芯片看起来与超大规模设计公司正在构建的芯片非常相似,但现在它们可以直接使用低成本且现成的计算子系统,减轻了所有人的负担。

和x86相比,Arm 是什么时候跨越门槛的,从“一样好”到“更好”?

我确实认为我们开始走上这条轨迹,但我真的很难确定跨越这条轨迹的某个时刻。我儿子周一就要满 18 岁了,我想,他是在什么时候成为男人的?我有点不清楚那一刻究竟是什么时候发生的,好像我们突然就到了那里。从某种程度上来说,这感觉就像是同一件事。它已经酝酿了差不多同样长的时间。这是我们长期以来一直在投资的事情。当我想到它时,我想到几个重要的里程碑。

坦率地说,我认为当 AWS 推出第一个 Graviton 实例时,那是一个关键时刻,因为它使基于 Arm 的计算变得广泛可用,因此人们可以以低风险、低成本非常轻松地在云中尝试它。结果很明显,对吧?排名前 50,000 的客户正在使用它,排名前 1,000 的客户中有 90%,排名前 100 的客户全部都在使用 Arm。

我认为 Neoverse 的推出,让我们放弃了这样的想法:过去你要么采用手机处理器IP,尝试拼凑一个CPU,要么使用架构许可证进行完整的从头设计。我们则是通过承担更多工作,简化客户的开发。并且每一代似乎都比前一代好一点。

· END ·


欢迎将我们设为“星标”,这样才能第一时间收到推送消息。

关注EEWorld旗下订阅号:“机器人开发圈”

回复“DS”领取《DeepSeek:从入门到精通》完整版

图片

扫码添加小助手回复“机器人”

进群和电子工程师们面对面交流经验

电子工程世界 关注EEWORLD电子工程世界,即时参与讨论电子工程世界最火话题,抢先知晓电子工程业界资讯。
评论 (0)
  •   陆地边防事件紧急处置系统平台解析   北京华盛恒辉陆地边防事件紧急处置系统平台是整合监测、预警、指挥等功能的智能化综合系统,致力于增强边防安全管控能力,快速响应各类突发事件。以下从系统架构、核心功能、技术支撑、应用场景及发展趋势展开全面解读。   应用案例   目前,已有多个陆地边防事件紧急处置系统在实际应用中取得了显著成效。例如,北京华盛恒辉和北京五木恒润陆地边防事件紧急处置系统。这些成功案例为陆地边防事件紧急处置系统的推广和应用提供了有力支持。   一、系统架构   感知层:部
    华盛恒辉l58ll334744 2025-04-23 11:22 120浏览
  • 一、行业背景与市场需求高血压作为全球发病率最高的慢性病之一,其早期监测与管理已成为公共卫生领域的重要课题。世界卫生组织数据显示,全球超13亿人受高血压困扰,且患者群体呈现年轻化趋势。传统血压计因功能单一、数据孤立等缺陷,难以满足现代健康管理的需求。在此背景下,集语音播报、蓝牙传输、电量检测于一体的智能血压计应运而生,通过技术创新实现“测量-分析-管理”全流程智能化,成为慢性病管理的核心终端设备。二、技术架构与核心功能智能血压计以电子血压测量技术为基础,融合物联网、AI算法及语音交互技术,构建起多
    广州唯创电子 2025-04-23 09:06 156浏览
  • 故障现象一辆2016款奔驰C200L车,搭载274 920发动机,累计行驶里程约为13万km。该车组合仪表上的防侧滑故障灯、转向助力故障灯、安全气囊故障灯等偶尔异常点亮,且此时将挡位置于R挡,中控显示屏提示“后视摄像头不可用”,无法显示倒车影像。 故障诊断用故障检测仪检测,发现多个控制单元中均存储有通信类故障代码(图1),其中故障代码“U015587 与仪表盘的通信存在故障。信息缺失”出现的频次较高。 图1 存储的故障代码1而组合仪表中存储有故障代码“U006488 与用户界
    虹科Pico汽车示波器 2025-04-23 11:22 89浏览
  •   高海拔区域勤务与装备保障调度系统平台解析   北京华盛恒辉高海拔区域勤务与装备保障调度系统平台专为高海拔特殊地理环境打造,致力于攻克装备适应、人员健康保障、物资运输及应急响应等难题。以下从核心功能、技术特点、应用场景及发展趋势展开全面解读。   应用案例   目前,已有多个高海拔区域勤务与装备保障调度系统在实际应用中取得了显著成效。例如,北京华盛恒辉和北京五木恒润高海拔区域勤务与装备保障调度系统。这些成功案例为高海拔区域勤务与装备保障调度系统的推广和应用提供了有力支持。   一、核心
    华盛恒辉l58ll334744 2025-04-24 10:13 18浏览
  •   电磁频谱数据综合管理平台系统解析   一、系统定义与目标   北京华盛恒辉电磁频谱数据综合管理平台融合无线传感器、软件定义电台等前沿技术,是实现无线电频谱资源全流程管理的复杂系统。其核心目标包括:优化频谱资源配置,满足多元通信需求;运用动态管理与频谱共享技术,提升资源利用效率;强化频谱安全监管,杜绝非法占用与干扰;为电子战提供频谱监测分析支持,辅助作战决策。   应用案例   目前,已有多个电磁频谱数据综合管理平台在实际应用中取得了显著成效。例如,北京华盛恒辉和北京五木恒润电磁频谱数
    华盛恒辉l58ll334744 2025-04-23 16:27 163浏览
  • 一、技术背景与市场机遇在智能家居高速发展的今天,用户对家电设备的安全性、智能化及能效表现提出更高要求。传统取暖器因缺乏智能感知功能,存在能源浪费、安全隐患等痛点。WTL580-C01微波雷达感应模块的诞生,为取暖设备智能化升级提供了创新解决方案。该模块凭借微波雷达技术优势,在精准测距、环境适应、能耗控制等方面实现突破,成为智能取暖器领域的核心技术组件。二、核心技术原理本模块采用多普勒效应微波雷达技术,通过24GHz高频微波信号的发射-接收机制,实现毫米级动作识别和精准测距。当人体进入4-5米有效
    广州唯创电子 2025-04-23 08:41 143浏览
  •   无人机结构仿真与部件拆解分析系统平台解析   北京华盛恒辉无人机结构仿真与部件拆解分析系统无人机技术快速发展的当下,结构仿真与部件拆解分析系统平台成为无人机研发测试的核心工具,在优化设计、提升性能、降低成本等方面发挥关键作用。以下从功能、架构、应用、优势及趋势展开解析。   应用案例   目前,已有多个无人机结构仿真与部件拆解分析系统在实际应用中取得了显著成效。例如,北京华盛恒辉和北京五木恒润无人机结构仿真与部件拆解分析系统。这些成功案例为无人机结构仿真与部件拆解分析系统的推广和应用提
    华盛恒辉l58ll334744 2025-04-23 15:00 175浏览
  • 前言本文主要演示基于TL3576-MiniEVM评估板HDMI OUT、DP 1.4和MIPI的多屏同显、异显方案,适用开发环境如下。Windows开发环境:Windows 7 64bit、Windows 10 64bitLinux开发环境:VMware16.2.5、Ubuntu22.04.5 64bitU-Boot:U-Boot-2017.09Kernel:Linux-6.1.115LinuxSDK:LinuxSDK-[版本号](基于rk3576_linux6.1_release_v
    Tronlong 2025-04-23 13:59 114浏览
  •   后勤实验仿真系统平台深度解析   北京华盛恒辉后勤实验仿真系统平台依托计算机仿真技术,是对后勤保障全流程进行模拟、分析与优化的综合性工具。通过搭建虚拟场景,模拟资源调配、物资运输等环节,为后勤决策提供数据支撑,广泛应用于军事、应急管理等领域。   应用案例   目前,已有多个后勤实验仿真系统平台在实际应用中取得了显著成效。例如,北京华盛恒辉和北京五木恒润后勤实验仿真系统平台。这些成功案例为后勤实验仿真系统平台的推广和应用提供了有力支持。   一、核心功能   (一)后勤资源模拟
    华盛恒辉l58ll334744 2025-04-23 15:39 138浏览
  •   复杂电磁环境模拟系统平台解析   一、系统概述   北京华盛恒辉复杂电磁环境模拟系统平台是用于还原真实战场或特定场景电磁环境的综合性技术平台。该平台借助软硬件协同运作,能够产生多源、多频段、多体制的电磁信号,并融合空间、时间、频谱等参数,构建高逼真度的电磁环境,为电子对抗、通信、雷达等系统的研发、测试、训练及评估工作提供重要支持。   应用案例   目前,已有多个复杂电磁环境模拟系统在实际应用中取得了显著成效。例如,北京华盛恒辉和北京五木恒润复杂电磁环境模拟系统。这些成功案例为复杂电
    华盛恒辉l58ll334744 2025-04-23 10:29 168浏览
我要评论
0
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦