硬件若无软件支持就毫无意义。而软件始终是Arm计算平台不可或缺的一部分,其技术已经涵盖整个软件栈的各个层面。从底层固件和操作系统的开发,到与游戏引擎、开源社区和独立软件供应商(ISV)的战略合作,确保所有这些在Arm平台上都能“开机即用”。

自转型为计算平台公司以来,Arm已取得了诸多市场进展及创新技术成就,一年一度的 Arm Tech Symposia年度技术大会正是一次集中的展示。2024年伊始,从面向基础设施的新一代Neoverse CSS N3和V3系列、汽车增强(AE)处理器IP和虚拟原型平台,到Arm终端计算子系统(CSS),凭借业界领先的高能效、低功耗技术创新,Arm已然成为最普及的AI计算基石。预计到2025年底,全球将有超过1,000亿台基于Arm架构设备可用于AI。 

“AI极有潜力成为我们这一生中最重要的技术。我们都曾使用AI来解锁手机、观看炫酷的影片特效,或从照片中移除背景中的人物,但对许多人而言,ChatGPT的出现才让 AI真正爆发。”Arm基础设施事业部产品解决方案副总裁Dermot O'Driscoll在2024 年Arm Tech Symposia年度技术大会上发表主题演讲时指出,我们能够与AI展开对话,并真切地感受到计算系统开始具备智能,能够响应我们并带来丰富的互动体验,这对教育、通讯等领域具有重大影响,并将彻底改变我们与科技互动的方式。

Arm基础设施事业部产品解决方案副总裁Dermot O'Driscoll

超越硬件的设计思维

在AI时代,若要满足对AI技术和应用的旺盛需求,则必须在计算领域的方方面面实现无处不在的AI功能。从使用无数处理器训练大语言模型(LLM)的大型数据中心,到全球数字消费者每天接触边缘AI的电子设备,计算领域的方方面面都将有AI的身影。

但Dermot强调指出,AI的需求非常庞大,且往往需要异构计算,系统中需要多种操作要素协作。为了管理不同应用程序中的工作负载,需要一种能够高效率编写软件的方式,让开发人员能够针对该硬件进行开发,而不只是将这些模块简单拼凑在一起,随意编写一些软件,就认为这将成为一个可扩展的全球解决方案。

众所周知,硬件若无软件支持就毫无意义。许多人都见识过一些令人惊艳的硬件,但由于软件表现不佳,甚至根本缺乏软件支持而未能发挥其潜力。软件并非魔法,而是由开发人员编写的,在许多情况下,需要以软件为中心的思维来思考硬件设计。 

“软件是让Arm计算平台独树一帜的原因,目前已有2,000万名开发人员在Arm平台上进行软件开发。“Dermot表示Arm已投入30多年编写和优化软件,软件始终是Arm计算平台不可或缺的一部分,其技术已经涵盖整个软件栈的各个层面。从底层固件和操作系统的开发,到与游戏引擎、开源社区和独立软件供应商(ISV)的战略合作,确保所有这些在Arm平台上都能“开机即用”。

所以,无论是可使Arm CPU能够在各类软件平台上充分发挥AI功能和出色性能的 Kleidi软件, 还是云原生软件,开发者越来越多地在Arm Neoverse驱动的基础设施上构建云的未来;无论是采用最新的Armv9技术来扩展AI赋能的软件定义汽车部署,并通过虚拟平台以提高软件解决方案可访问性的SOAFEE,还是多年来Arm在支持开源项目方面所做的努力,无不体现出Arm通过全面的软件生态系统支持开发者和企业的创新实践,并在面向AI的软硬件协同中所扮演的关键角色。

在谈及为何会有如此众多的开发者选择Arm时,Dermot认为这是因为Arm拥有全球最大的计算平台,而这形成了良性循环:更多的硬件吸引更多开发人员开发软件,进而推动对高效能硬件的需求,彼此互为循环。而且这一过程贯穿整个堆栈,从底层的操作系统到顶层的应用程序,再到用户与科技的互动方式。一致的计算平台为开发人员提供了信心,使他们能够编写出可在当前数十亿台的Arm硬件上良好运行的软件,实现软件“一次开发、广泛部署”的目标。

“我们希望软件开发人员思考的不是如何让技术运行,而是他们想要开发什么。为此,Arm正在抽象化许多硬件相关的技术细节,真正实现对开发人员友善的设计,让他们能专注于构建优秀的软件与简单的整合。”Dermot分享道。

软硬件协同创新释放AI价值

从Arm的角度来说,提供AI从云到端、现代敏捷开发和部署流程中所需的特性和功能,实现基于量产验证的一致架构,并采用统一工具链的AI转型,是Arm计算平台长期以来肩负的使命。所以,未来Arm只要做好三件事:专注打造最优秀的产品;让产品更加易用;持续打造强大的生态系统,整个行业就能够以互相合作的方式来共同前进。在这种力量的带动下,Arm也会取得更大的成功。

以计算基础设施为例,随着AI大模型时代的到来,该领域面临新的需求和挑战。凭借Neoverse平台在高能效推理上的创新能力,Arm在支持大语言模型(LLM)及其他新兴AI应用方面展示了独特优势,使客户能够在满足AI计算需求的同时,实现能效优化和成本控制。特别是超大型云计算提供商如亚马逊云科技、微软,正采用基于Neoverse架构的定制芯片战略来进行数据中心转型,以迎接AI时代的市场需求,进一步巩固了Neoverse在基础设施领域作为计算架构事实标准的地位。

在AI时代,软件的重要性日益显著,Dermot指出,”现在我们拜访AI新创企业,他们的软硬件人员分配,已经从过往的“50%硬件+50%软件”,转变为当前的“10%硬件+90%软件”。为了帮助开发人员简化开发流程,加速产品上市时间,进一步优化产品性能,并节约成本,Arm今后将通过以下三种方式实现这一目标:

  • 持续投资打造一致的计算平台,让开发人员不再担心硬件差异,将精力更多投入到应用程序开发上。 
  • 在硬件平台中提供更强大的加速功能,使软件开发人员能够充分利用异构计算能力。
  • 支持开源工具链,加大对开源社区的支持,让软件开发更加便捷易用。

其实,除了数据中心和云服务,许多AI工作负载还需要在设备上进行处理,无论是智能手机、智能家居还是智能汽车,这一趋势将继续增长。因为直接在采集数据的设备上处理AI计算,可以带来更快、更安全的用户体验并减少延迟,这对于工业和汽车应用等对安全性要求很高的用例来说至关重要。

以汽车领域为例,随着软件定义汽车(SDV)逐渐成为行业的趋势和共识,越来越多的车厂对参与到软件运行平台的构建展现出了浓厚的兴趣。为此,Arm不但在2021年发起名为“SOAFEE”(面向嵌入式边缘的可扩展开放架构)的项目,让生态系统中的合作伙伴实现共同协作,解决汽车行业面临的软件层面的挑战,还在2024年首次将服务器级性能的Neoverse 技术和Armv9架构引入汽车应用中,并宣布计划于2025年交付其首款汽车应用CSS。

“这一点对中国汽车OEM来说尤其重要。”Arm汽车事业部市场总监Robert Day表示,中国走在了全球智能驾驶和新能源汽车的前列,创新意愿和力度十分强烈,但汽车系统正变得日益复杂,车厂需要更多的计算能力、更多的计算子系统、更多的软件,Arm希望通过SOAFEE、虚拟原型平台、以及即将推出的汽车CSS,真正赋能生态系统伙伴和汽车行业发展。

Arm汽车事业部市场总监Robert Day

类似的案例还有很多,表明CSS和Arm全面设计(Arm Total Design)的组合正在帮助打造可持续AI应用的硬件基础。通过提供优先获取最新CSS的广泛途径,Arm降低了行业准入门槛,打造了从云端到边缘的多样化芯粒解决方案,并加速了开发速度。

锻造开发者生态系统的力量

在当今快速发展的技术环境中,开发者是推动创新和变革的核心力量。无论是云计算、边缘计算还是物联网,开发者都是将新技术转化为实际应用的关键。AI技术的爆发更是凸显了开发者的重要性,他们不仅需要高效的开发工具和平台,还需要强大的生态系统支持,以实现从概念到产品的快速迭代和部署。 

Arm中国区业务全球副总裁邹挺表示,Arm 拥有全球最广大的软件开发者社区,超过 2,000 万名开发者在 Arm 平台上构建和测试基于 Arm 架构的应用。在持续快速发展的人工智能 (AI) 时代,Arm 致力于确保开发者能够获得所需的性能、工具和软件库,无缝获取底层硬件性能,使其更顺畅、简易地进行创新开发。而支持全球开源社区则是确保软件在基于 Arm 技术硬件上“开机即用”的重要一环,为此,Arm 投入了大量的工程资源与时间用以支持开源项目,并通过持续扩大开源合作伙伴关系,为全球软件开发者提供更多访问资源,以助力其实现更高性能。

Arm中国区业务全球副总裁邹挺

这也因此解释了Arm推出“Arm全面设计”生态项目这类赋能合作伙伴的平台的初衷——生态系统合作伙伴专注于各自擅长领域,进而更快、更具成本效益地开发出更好、更强大的产品。目前,Arm全面设计生态项目的合作伙伴数量已达到30家,他们可以优先取用 Arm Neoverse CSS、预集成的IP和电子设计自动化(EDA)工具、设计服务、代工厂支持以及商用软件和固件支持,将定制芯片解决方案快速推向市场。

  • 深耕工具和软件库

Arm深知开发者的重要性,因此将构建强大的开发者生态视为其核心战略之一。尤其是在AI时代,强大的开发者生态不仅仅是硬件平台的延伸,更是软硬件协同创新的基石。因此,Arm不仅仅提供强大的硬件架构支持,更致力于打造一个全方位、多层次、易于接入的开发环境,让每一位开发者都能在这个平台上释放潜能,创造价值。

例如,为了使AI能更高效、简单地运行于Arm计算平台之上,并管理好将AI推理从云端扩展到边缘侧时所带来的复杂性,使得开发者能更顺畅地进行AI创新,Arm推出了KleidiAI软件,有助于确保开发者能够获得AI开发所需的性能、工具和软件库,从而打造新一波非凡的AI体验。AI 应用需要考虑成本、隐私、延迟和连接性等问题,利用 KleidiAI将工作负载扩展至边缘侧,能够确保合作伙伴以较低的成本为开发者提供出色的用户体验。

百度智能云已将Arm虚拟硬件应用于百度基于云原生的持续集成/持续部署 (CI/CD) 内部通路。Arm虚拟硬件集成到百度云原生的CI/CD工作流中后,开发者可以在日常中使用其服务和工具进行软件的开发、验证、测试,而无需受限于实体硬件就绪情况,由此提高了CI/CD效率,加速了基于Arm边缘AI的开发和部署。作为Arm多年来重要的合作伙伴,Arm也携手腾讯,将KleidiAI集成到了腾讯混元大模型中,加速端侧AI推理。

不久前,Arm还通过推出GitHub平台AI工具,将Arm计算平台与全球最大的开发者社区GitHub及其GitHub Copilot的强大优势进行了结合,开发者可以在降低成本,并提高生产效率的同时,简化跨应用程序的开发任务。

  • 支持全球开源社区

Arm持续的软件投入还正在建立起全球最大的AI开发者社区。如今,超过一亿用户可以使用Arm NN软件开发工具包,在Arm CPU和GPU上优化ML工作负载。此外,Arm还通过开源框架和库,为基于Arm架构的硬件提供强大的ML功能,为开发者提供全方位支持,包括TensorFlow、PyTorch、Caffe 2、OpenVINO和TVM,从而为开源社区打造AI创新基础。 

与之对应的是,相当多的AI研究开发社区不仅持续受益于Arm生态系统与合作伙伴提供的丰富信息与知识,也围绕Arm计算平台构建日益增长的软件和工具生态系统,以及开源软件库和AI框架。比如PyTorch基金会投资边缘AI,发布针对移动和边缘设备推理工具包ExecuTorch,提供了轻量级运行时(Runtime)和算子注册表,覆盖了PyTorch生态系统中的各类模型。

加入 OpenCloudOS 社区,则是Arm助力本土开发者获得开放环境的底层硬件知识,进而加速实现创新解决方案的代表性案例之一。作为国产开源操作系统社区,OpenCloudOS沉淀了腾讯及多家厂商在软件和开源生态上的优势,在云原生、稳定性、性能和硬件支持等方面均能提供坚实支撑。通过技术协作,双方将携手提升、优化开源操作系统的性能、功耗等,进一步推动该生态系统的繁荣发展。

为加速龙蜥平台上的Arm软件部署进度,2021年,Arm加入龙蜥开源社区,携手龙蜥社区共同推动基于Arm架构的软硬一体的协同演进、相关的功能实现和性能优化,为广大的软件开发者带来基于Arm架构的顺畅开发环境与流畅的用户体验。

  • 开发者持续交流

Arm注重与开发者交流,尤其是软件和开发者生态构建。过去一年,举办和参与了众多开发者活动,如WoA Arm人工智能创新应用大赛、虚幻引擎技术开放日、AICAS竞赛,以及参与合作伙伴的倚天技术技术沙龙等,这些项目帮助Arm触达到了几十万、上百万的中国开发者。

为了培养和激发本土开发者的创新能力,今年Arm Tech Symposia年度技术大会还特别设置了面向开发者的专场活动。比如,Arm举办AI创新与应用大赛,鼓励开发者在基于Arm的Windows 操作系统上构建原生Arm应用或迁移现有应用,使其能够体验Arm的高性能、卓越的能效、强大的软硬件工具、丰富的生态系统资源以及WoA软件开发社区的支持,激发AI PC开发者在Arm架构上探索AI应用开发的新可能性。

这些仅仅只是一个开端,Arm未来还计划推出更多软件库、计算内核和引擎集成,持续在Arm平台上构建AI的未来。Dermot也同时鼓励各界多多运用Arm CSS和Arm全面设计,为客户打造更多更具影响力的解决方案。 

“促进AI的繁荣需要整个生态齐心协力。”邹挺指出,目前,Armv9架构正处于全球部署的高峰,在中国多个基于Armv9的产品,包括阿里巴巴的倚天710 服务器 CPU、中兴微的珠峰 1.0 服务器 CPU,此芯科技面向AI PC的P1持续推向市场。持续对ArmV9架构迭代更新,包括带来更多支撑AI计算的新技术,这个趋势将不断攀升。 

另一方面,无论是芯片初创公司还是头部OEM企业自研芯片,他们需要更多来自底层技术的支持,而Arm计算子系统,这套以解决方案切入市场需求的产品价值已经获得客户的认可,包括加速产品推向市场,以及有效减少开发的风险跟成本,将是非常好的选择。

结语

过去的三十多年里,Arm不仅提供了全球最大、应用最广泛的计算平台,而且通过IP与开源软件和工具乃至广泛的行业领先生态系统相结合,并以无与伦比的能源效率著称。同时,持续的软件投入也正建立起全球最大的AI开发者社区,以期实现“所有软件都能无缝地运行在基于Arm架构的系统之上”的愿景。

在这一过程中,数千万开发者的共同努力促进了标准和规范的建立、生态系统扩展;提升了用户体验;推动了技术创新和应用落地;增强了市场竞争力,是创新的源泉和商业成功的关键。

正如Arm曾经协助智能型手机的崛起一样,Arm也期望携手开发者将Arm计算平台作为AI创新的基础,持续推动新一代生态系统合作伙伴关系,共同成为AI计算平台的驱动者,更紧密的硬件、软件与生态系统的赋能者。

责编:Lefeng.shao
本文为EET电子工程专辑原创文章,禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
您可能感兴趣
该芯片集成 5900 个晶体管,突破二维半导体电子学工程化瓶颈,不但实现国际上二维逻辑芯片最大规模验证纪录,还具备单级高增益和关态超低漏电等优异性能,达到国际同期最优水平。
经过了2023、2024两年的半导体下行周期后,MCU已经几乎“触底”了,2025年我们理应期待一下反弹。
通过收购锐成芯微,概伦电子可快速切入高毛利的IP授权市场,优化收入结构。
RISC-V今年生态发展水平如何?来看一组数据和一个具体的CPU IP...
Chiplet技术作为后摩尔时代突破性能瓶颈的关键路径,正加速从概念走向规模化应用。在这个过程中,各类设计验证工具也针对AI芯片特性迎来的全面升级,但要实现动Chiplet向“即插即用”生态演进,还有一系列难题需要解决……
2025中国IC领袖峰会以“观沧海风云,磨芯剑锋芒”为主题,围绕AI、EDA工具、RISC-V等芯片设计热点话题,邀请了全球芯片设计产业链代表性企业探讨和分享了产业前沿的最新技术和行业最新的发展趋势。
随着摩尔定律的效应逐渐趋缓,半导体产业正转向结构、材料与系统级创新,以“P-P-A-C”四大指标取代尺寸缩小为核心。泛铨科技以EELS技术深入分辨3D NAND结构,展现在化学键与元素价态分析中的独特优势……
Wolfspeed 作为碳化硅材料与器件领域的领先制造商,正式发布了第 4 代碳化硅 MOSFET 技术平台。该平台通过优化开关特性,针对性解决了高功率设计中普遍存在的效率瓶颈与热管理难题。
现代汽车将能够提供类似智能家居的体验,以Apple CarPlay和Android Auto作为中央枢纽。然而,随着连接设备数量的增加,如何确保稳定的性能表现成为了一个复杂的挑战。
2025年4月15日至17日,欢迎莅临上海慕尼黑上海电子展Pickering Electronics展位N3-329
点击上面↑“电动知家”关注,记得加☆“星标”!电动知家消息,2025年3月,零跑汽车在中国新势力品牌销量榜中首次夺冠。当月零跑汽车交付量达到37,095台,同比增长超过154%,环比增长47%,超越了
点击上方“C语言与CPP编程”,选择“关注/置顶/星标公众号”干货福利,第一时间送达!最近有小伙伴说没有收到当天的文章推送,这是因为微信更改了推送机制,导致没有星标公众号的小伙伴刷不到当天推送的文章,
日前,DAC2025发布论文录用榜单,共录用420篇论文,录用率约22.5%。中国内地共录用220篇,再创历史新高,占比超过50%;DAC2024共录用337篇,中国内地共录用149篇,占比44%。中
点击左上角“锂电联盟会长”,即可关注!在全球能源结构转型与碳中和目标推动下,动力电池作为新能源汽车的核心部件,其技术发展路径备受关注。本文系统分析了当前动力电池技术面临的续航焦虑、安全挑战、成本压力及
大侠好,欢迎来到FPGA技术江湖,江湖偌大,相见即是缘分。大侠可以关注FPGA技术江湖,在“闯荡江湖”、"行侠仗义"栏里获取其他感兴趣的资源,或者一起煮酒言欢。本系列将带来FPGA的系统性学习,从最基
近期,静安区消费者权益保护委员会(简称“消保委”)成功举办了“3·15”国际消费者权益日暨“共筑满意消费”年主题活动。此次活动旨在通过多元化的形式,增强消费者权益保护意识,营造健康和谐的消费环境。上海
点击左上角“锂电联盟会长”,即可关注!国家标准计划《电动汽车用动力蓄电池安全要求》由(工业和信息化部)组织起草,委托TC114SC27(全国汽车标准化技术委员会电动车辆分会)执行 。 拟实施日期:20
点击左上角“锂电联盟会长”,即可关注!【前言部分】在全球能源结构向低碳化转型的浪潮下,开发高能量密度、长循环寿命且成本可控的储能技术已成为新能源产业的核心目标。镍基层状氧化物(NLO)正极材料凭借其独
编者语:后台回复“入群”,加入「智驾最前沿」微信交流群背景卷积神经网络(Convolutional Neural Networks, CNN)的核心技术主要包括以下几个方面:局部连接、权值共享、多卷积