Arm近两年在低功耗之外的高性能领域,生态的高歌猛进超出所有人的意料。尽管市场还有国际贸易环境、英伟达收购、RISC-V崛起等不确定因素的掺杂,Arm触及高性能领域而且取得阶段性成果是不容置疑的。

Arm近两年在低功耗之外的高性能领域,生态的高歌猛进超出所有人的意料。尽管市场还有国际贸易环境、英伟达收购、RISC-V崛起等不确定因素的掺杂,Arm触及高性能领域而且取得阶段性成果是不容置疑的。

万物互联的发展趋势,5G、新冠疫情客观上促成基础设施市场的爆发式增长,也在大环境上为Arm在这些领域的发展提供了机会。Arm早已不是5年前那个仅在低功耗领域为众人津津乐道的指令集了。

电子工程专辑近几年见证了这段跌宕起伏的历史,参与到Arm生态扩展至移动与嵌入市场之外的主要角色包括了苹果、高通、英伟达、微软、亚马逊、Ampere Computing、华为、等等。

Arm高性能时代的推进

在x86牢牢统治高性能计算市场之时,众人对Arm有着骨子里“只能做低功耗”的偏见。如果将这种偏见前期与后期做切分,则在前Arm高性能时代已经有Arm可应用于高性能的征兆了:2013年,苹果在iPhone 5s时期就宣称A7芯片的Cyclone架构是“桌面级架构”。

2014年,英伟达透露面向HPC的Arm处理器Denver相关信息,称其能效与Haswell相仿(第4代Intel酷睿)。这两件事情是颇具代表性的,虽然当时谁也没有真正在意过,只觉Arm征战高性能就是个笑话。

而在步入“后Arm高性能时代”,2018年Arm宣称旗下新推Cortex-A76核心“已媲美低压版酷睿i5”,则应当算是颇具标志性意义的分水岭事件。高通随后基于Cortex-A76推出骁龙8cx处理器,面向SuraceProX这样的笔记本产品。直到去年苹果面向MacBook笔记本发布基于Arm指令集的自研M1芯片;同期,Arm面向基础设施覆盖从云到边缘,正式推出Neoverse系列IP,这两件事情正式向世界宣告,Arm面对高性能很认真。

本文以简略的方式回顾2017至今,Arm将影响力扩张至移动/嵌入式市场之外的那段历程。点击文中任意超链接,跳转至相应事件与评论了解电子工程专辑在全过程中留下的文字记录

从试探到几乎全军覆没

“全军覆没”当然还是得打个引号的,毕竟从那个时代存活下来的Arm高性能芯片玩家也有不少。PC市场暂且不论,虽然Arm早在2014年就推出了首个Arm服务器平台标准,但除了英伟达Project Denver这种颇具代表性的前期尝试和失败,在Arm推进高性能之路的过程中,有大量具有标志性的事件都证明Arm前期在这一领域是失败的。比如说其中的一个典型代表:高通Centriq服务器处理器。

高通于2017年11月宣布Centriq 2400服务器处理器出货,有关Centriq处理器的历史最早可以追溯到2014年。那年高通就宣布正在开发一款面向数据中心、基于Armv8-A架构的CPU,核心微架构名为“Falkor”。在具体配置上,芯片配备了至多48个核心,最高主频2.6GHz。

高通当年信誓旦旦地表示,Centriq效率很高,比英特尔至强处理器的功耗明显更低,每瓦性能和价格方面都比英特尔更强。只是Centriq的寿命实在不够长久,2018年年中高通服务器芯片负责人Anand Chandraskher确认离职,短短两个月后Falkor架构设计灵魂人物Dileep Bhandarkar也宣布离职。才半年多的时间,这颗Arm服务器CPU就已经败下阵来

与之配套,国内颇具代表性的例子是华芯通半导体。这家公司是2016年贵州省政府和高通共同投资成立的。2017年,华芯通宣布与合作伙伴共同投资建立基于Arm服务器CPU的数据中心联合实验室。次年年中即宣布要推出一款可商用的通用服务器芯片——这一年的年底,华芯通昇龙4800处理器上市

同样的好景不长,同期伴随高通Centriq芯片的破产,高通减少在数据中心业务上的投入,华芯通宣布于2019年4月关张。事实上,从产品形态来看配套服务器与Centriq 2400和昇龙4800的兼容,这两者的相似程度还是相当之高。这些实则都表明高通在Arm服务器芯片方面的计划步入停滞。

即便不谈周边生态,同时代并不怎么成功的例子还有很多,比如首个推出Armv8服务器芯片的Cavium(后被Marvell收购)。Cavium基于Arm的ThunderX1核心是在2014年末正式发布的。ThunderX初代产品整体上都是不成功的,包括高延迟的L2缓存、高延迟的DRAM访问,都让这颗48核处理器在很多软件中的表现不怎么样,而且低负载下还存在高功耗的问题,远不及当时的Intel Xeon D。

现在在Arm服务器领域比较知名的AmpereComputin前期产品也远远谈不上成功。Ampere比较早的eMa就基于Arm服务器SBSA标准,其Skylark核心来源于AppliedMicro的X-GeneIP,属于比较有年代的Arm64设计了。这段历史在电子工程专辑2018年的杂志文章中 有比较详细的描述。eMag和如今的Altra是完全无法相提并论的。

Applied Micro早年也属于Arm服务器处理器的先锋了,它最终的命运总体上证明了Arm在服务器市场一时是扶不上墙的。前Arm高性能时代掀起的这波Arm欲攻打服务器市场的热潮中,连AMD都开发过Arm服务器芯片;随着主要市场玩家相继被收购,AMD、Marvell、高通等在这方面的投入一时停滞,Arm服务器军团是几近全军覆没的。

PC市场的阶段性胜利

在继续谈基础设施市场之前,喘口气来看看对性能需求同样不低的PC、工作站市场。Arm对PC市场的攻打也从来不是一蹴而就的。微软从2011年起就在不停地给Arm暗送秋波,2012年应用Arm的Windows设备就诞生了。只是时代暂时还不允许这段“感情”发生,Windows RT、Windows 10S的失败仿佛都说明Arm要用于PC还远不是时候。

在持续了10年的各种试探中,Arm始终都没能在PC这个对性能还颇有要求的市场站稳脚跟。大众对Arm的认知普遍是:用在手机上还行,PC设备?还是洗洗睡吧。这段历史在《Arm的十年PC征程,和微软的“暧昧”》一文中有着详细的解释。Windows 10 on Arm以及高通骁龙8cx的推出,标志着Arm在PC市场的阶段性胜利。

Arm在行动上有决心征战PC设备的标志性事件是发布Cortex-X1核心,这是个部分牺牲了芯片面积与功耗,更多专攻性能的核心。包括如今面向HPC市场的Neoverse V1实则也是以Cortex-X1为基础的。要知道,以往的Arm核心IP普遍是以均衡PPA为设计哲学的。

说来也巧,与Cortex-X1推出前后脚,真正标志着Arm应对PC性能需求游刃有余的,还是去年苹果正式面向MacBook推出基于Arm的M1芯片。从2017年传出苹果准备自研Mac芯片的消息,到苹果先后挖角Intel工程师,以及苹果自身起码积累了10年以上的Arm芯片设计经验,才令M1芯片以震撼全场的姿态登场。

M1不仅证明了Arm要在PC和生产力设备上施展拳脚,真的一点毛病都没有,而且还吊打了盘踞该市场二十多年的Intel,不得不说是Arm生态铺陈的一次重大胜利。其原因与苹果自身在Arm芯片设计上十多年的投入、Arm本身的发展都有相当大的关系。业界当下正观望苹果打算以何种方式扩展Arm高性能核心,打造面向Mac Pro这类工作站级别的计算机设备。

在这股力量的推动下,微软向Arm的进一步靠拢似乎也会显现出大势所趋。去年年底就有消息说,微软考虑自Arm处理器,并将其应用于Surface设备和Azure云服务器——算是向苹果和亚马逊同时取经了。即便这则传言的可靠性无法确认,却表明旧时代的生态已经松动。

重整旗鼓的新风潮

回到基础设施侧,亚马逊云AWS先于微软Azure一步,在2018年11月宣布推出Graviton处理器,应用于AWS服务器。Graviton是采用16个Arm Cortex-A72核心的芯片。不过亚马逊自研云服务器CPU真正引人侧目是从Graviton2开始的。

同一时期华为宣布推出型号Hi1620——也就是鲲鹏920的Arm服务器芯片。华为在发布会上说,随着Arm生态逐渐发展,越来越多的应用已向Arm架构迁移;更重要的是,对于多样化的计算任务,找到合适的架构才是最重要的;对于手机普遍适用的Arm芯片,当开发者在云端进行游戏应用开发时,Arm架构比x86架构更好。华为去年还宣布要在投入2亿推动鲲鹏生态发展

2019年12月,基于Arm Neoverse N1核心的Graviton2问世。也是从这个时候开始,Arm应用于服务器的第二次浪潮席卷而来。此事缘起于2018年底,Arm正式宣布面向服务器的Neoverse问世,同时发布了Neoverse N1。这是Arm特别面向基础设施第一次认真推了专门的核心IP产品线。

此后不只是亚马逊,不少面向基础设施市场的芯片设计企业开推Neoverse N1芯片,都取得了相当不错的效果。其中比较具有代表性的是前文提到的Ampere Computing。这家公司基于Neoverse N1推出的Ampere Altra处理器,真正在能效方面和部分性能表现上超越了市场主流的x86产品。

Marvell/Cavium在推基于Arm指令集的ThunderX2/X3,虽然微架构并非来自Arm,却也在性能与能效表现上愈发成熟。2020年,在包括5G、边缘、云等诸多基础设施市场上,Arm头一次做到了全面开花。甚至包括在超算领域,去年年中成为超算第一的“富岳”,其A64FX处理器就是基于Arm。单纯从这些芯片本身的性能和能效来看,都不是前一次Arm服务器芯片风潮可比的。

前不久,Arm更新了Neoverse产品线,包括偏向HPC AI的Neoverse V1与基于更新架构的Neoverse N2。发布会上,Arm特别提到目前Graviton2被亚马逊应用到了更多实例中,这些实例的增量远超x86产品;未来要让Neoverse覆盖所有基础设施。这股风潮有愈演愈烈之势。

几个变量:英伟达、RISC-V、大环境

Arm如今看起来一切都是得意的了。只是在目前这个市场环境下,规避商业风险可能会是更多企业考虑的问题。去年9月,英伟达宣布400亿收购Arm,这对Arm而言是件喜忧参半的事情。

喜的部分在于,以英伟达目前在数据中心的地位,助推Arm在基础设施市场的发展是一拍即合的。或者说传统市场参与者对此应该感觉到真正的白色恐怖。而且今年的GTC大会上,英伟达还宣布即将面向HPC AI市场,推出自家的CPU,基于Arm Neoverse。

而忧的部分则在于,更多原本的Arm合作伙伴正考虑规避因收购可能造成的风险,启用备选项方案。其中RISC-V成为Arm之外的重要竞争对手,加上国际贸易环境变化正在促成RISC-V的快速发展,RISC-V这两年正在崛起。

更多Arm生态参与者鉴于篇幅本文未曾提起,如博通、AMD、飞腾……时代在变,你方唱罢我登场的戏码总在不停上演。当年偏安于低功耗的架构,如今正经历前所未有的巨变。旧时代的市场霸主此刻正使出浑身解数奋力抵抗,战局才刚刚写到最酣畅淋漓之处……

责编:Luffy Liu

本文为EET电子工程专辑原创文章,禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
阅读全文,请先
您可能感兴趣
欧洲在1nm和光芯片技术上的试验线启动,将有助于缩小研究与制造之间的差距,并推动整个半导体生态系统的发展。
过去四年里,美国电子制造业的投资额已经超过此前三十年的总和,整体规划投资约达4500亿美元,堪称美国史上规模最大的半导体制造扩张。
面对未来道路的挑战,新一代汽车的OEM正在积极探索创新之路,努力实现既符合日益严格的法规要求的乘客安全功能,又配备出色音频性能的沉浸式车内娱乐系统,以满足市场和消费者的需求。在这一过程中,OEM可以充分借助TI全新推出芯片产品,重塑车内体验,开启汽车驾乘的新纪元。
尽管市场上有传言称英伟达大幅削减了对台积电CoWoS-S封装的需求,甚至有报告指出砍单幅度高达80%,但台积电和英伟达均对此进行了否认......
很多人以为,今年CES上老黄演讲的主角是GeForce显卡,但其实是他手里握有的机器人相关的“时间宝石”...
尽管Imagination在RISC-V领域取得了一定的成就,但公司似乎认为继续投入资源于RISC-V处理器核心的开发并不符合其长期战略目标。Imagination决定终止其基于RISC-V指令集架构的GPGPU内核的研发工作,并将重心转向其擅长的GPU和AI领域......
对于未来行业发展的增长趋势、行业特征和渠道特点等方面,IDC 总结并给出了2025年中国PC 显示器市场十大洞察……
该存内计算芯片采用全数字设计,能够保证不同位宽配置下的精确计算。为实现不同位宽配置下的高利用率和高能效,团队提出了一种……
西门子数字化工业软件在IDC MarketScape发布的《2024 – 2025全球制造执行系统供应商报告》中被评为MES领导厂商,该报告针对制造业的MES软件厂商进行了综合性评估。
Arm宣布其芯粒系统架构 (CSA) 正式推出首个公开规范,进一步推动芯粒技术的标准化,并减少行业的碎片化。
根据知名数码博主“智慧皮卡丘”透露,今年即将发布的华为Pura80 Ultra将采用自研三摄系统,瞄准影像手机Top1。据悉,华为Pura80 Ultra将采用全新的自研影像软硬架构,后置影像系统由一
动动手指,关注公众号并加星标哦(1)推导MOS管的I/V特性的时候,基本主要是基于下面这三个公式。在文献[1][2][3]中,三个公式中的正负号,作者都安排的不太一样。虽然,这正负号在这三个等式中乱窜
SK海力士近期公布了其2024年第四季度及全年财报,业绩数据令人瞩目。在第四季度,该公司实现了19.77万亿韩元的营收,与去年同期相比大幅增长74.8%,环比增长12%。更为亮眼的是其营业利润,达到了
对于点击上面↑“电动知家”关注,记得加☆“星标”!电动知家消息,1月23日,一份“关于2025年春节KCN”员工激励奖金发放的通知”在网上流传,通知显示,激励奖金为2.5个月工资,分两次发放,25.0
为使行业能够及时了解国内外汽车标准、法规的最新情况,全国汽车标准化技术委员会秘书处编纂了《汽车标准法规目录(2025)》(以下简称《目录》)。《目录》包括汽车、摩托车行业的国家标准、行业标准及国内相关
现货促销让采购/更简单/更高效为了更好地帮助大家采购芯片,实现供需资源的无缝对接。AMEYA360决定开启【现货促销】专栏,通过AMEYA360微信公众号,每天推送原厂现货促销物料,助力广大用户制定更
前几天给人讲课,讲到了这个数组,然后有了更加深刻的理解。我觉得从物理和数据的组织方式上面入手是好的。先说物理上面是怎么样的。我们先想想,假如让你设计,你咋搞?肯定是先设计一些基本的数据单元,就好像一个
第二子代MRCD和MDB最高支持12800MT/s速率,较第一子代产品提升45%   澜起科技今日宣布,其最新研发的第二子代多路复用寄存时钟驱动器(MRCD)和第二子代
点击上面↑“电动知家”关注,记得加☆“星标”!电动知家消息,2025年世界经济论坛年会将于1月20—24日在瑞士举行,年会召集世界各地、各行业的近3000名领袖,探讨“智能时代的合作”这一主题。谈及目
点击上面↑“电动知家”关注,记得加☆“星标”!电动知家消息,1月23日,理想汽车宣布,理想超充站超时占用费正式运营。理想汽车方面表示,理想超充站超时占用费试运营以来,试点场站的占位情况显著改善。即日起