自转型为计算平台公司以来,Arm已取得了诸多市场进展及创新技术成就,一年一度的 Arm Tech Symposia年度技术大会正是一次集中的展示。2024年伊始,从面向基础设施的新一代Neoverse CSS N3和V3系列、汽车增强(AE)处理器IP和虚拟原型平台,到Arm终端计算子系统(CSS),凭借业界领先的高能效、低功耗技术创新,Arm已然成为最普及的AI计算基石。预计到2025年底,全球将有超过1,000亿台基于Arm架构设备可用于AI。
“AI极有潜力成为我们这一生中最重要的技术。我们都曾使用AI来解锁手机、观看炫酷的影片特效,或从照片中移除背景中的人物,但对许多人而言,ChatGPT的出现才让 AI真正爆发。”Arm基础设施事业部产品解决方案副总裁Dermot O'Driscoll在2024 年Arm Tech Symposia年度技术大会上发表主题演讲时指出,我们能够与AI展开对话,并真切地感受到计算系统开始具备智能,能够响应我们并带来丰富的互动体验,这对教育、通讯等领域具有重大影响,并将彻底改变我们与科技互动的方式。
Arm基础设施事业部产品解决方案副总裁Dermot O'Driscoll
超越硬件的设计思维
在AI时代,若要满足对AI技术和应用的旺盛需求,则必须在计算领域的方方面面实现无处不在的AI功能。从使用无数处理器训练大语言模型(LLM)的大型数据中心,到全球数字消费者每天接触边缘AI的电子设备,计算领域的方方面面都将有AI的身影。
但Dermot强调指出,AI的需求非常庞大,且往往需要异构计算,系统中需要多种操作要素协作。为了管理不同应用程序中的工作负载,需要一种能够高效率编写软件的方式,让开发人员能够针对该硬件进行开发,而不只是将这些模块简单拼凑在一起,随意编写一些软件,就认为这将成为一个可扩展的全球解决方案。
众所周知,硬件若无软件支持就毫无意义。许多人都见识过一些令人惊艳的硬件,但由于软件表现不佳,甚至根本缺乏软件支持而未能发挥其潜力。软件并非魔法,而是由开发人员编写的,在许多情况下,需要以软件为中心的思维来思考硬件设计。
“软件是让Arm计算平台独树一帜的原因,目前已有2,000万名开发人员在Arm平台上进行软件开发。“Dermot表示Arm已投入30多年编写和优化软件,软件始终是Arm计算平台不可或缺的一部分,其技术已经涵盖整个软件栈的各个层面。从底层固件和操作系统的开发,到与游戏引擎、开源社区和独立软件供应商(ISV)的战略合作,确保所有这些在Arm平台上都能“开机即用”。
所以,无论是可使Arm CPU能够在各类软件平台上充分发挥AI功能和出色性能的 Kleidi软件, 还是云原生软件,开发者越来越多地在Arm Neoverse驱动的基础设施上构建云的未来;无论是采用最新的Armv9技术来扩展AI赋能的软件定义汽车部署,并通过虚拟平台以提高软件解决方案可访问性的SOAFEE,还是多年来Arm在支持开源项目方面所做的努力,无不体现出Arm通过全面的软件生态系统支持开发者和企业的创新实践,并在面向AI的软硬件协同中所扮演的关键角色。
在谈及为何会有如此众多的开发者选择Arm时,Dermot认为这是因为Arm拥有全球最大的计算平台,而这形成了良性循环:更多的硬件吸引更多开发人员开发软件,进而推动对高效能硬件的需求,彼此互为循环。而且这一过程贯穿整个堆栈,从底层的操作系统到顶层的应用程序,再到用户与科技的互动方式。一致的计算平台为开发人员提供了信心,使他们能够编写出可在当前数十亿台的Arm硬件上良好运行的软件,实现软件“一次开发、广泛部署”的目标。
“我们希望软件开发人员思考的不是如何让技术运行,而是他们想要开发什么。为此,Arm正在抽象化许多硬件相关的技术细节,真正实现对开发人员友善的设计,让他们能专注于构建优秀的软件与简单的整合。”Dermot分享道。
软硬件协同创新释放AI价值
从Arm的角度来说,提供AI从云到端、现代敏捷开发和部署流程中所需的特性和功能,实现基于量产验证的一致架构,并采用统一工具链的AI转型,是Arm计算平台长期以来肩负的使命。所以,未来Arm只要做好三件事:专注打造最优秀的产品;让产品更加易用;持续打造强大的生态系统,整个行业就能够以互相合作的方式来共同前进。在这种力量的带动下,Arm也会取得更大的成功。
以计算基础设施为例,随着AI大模型时代的到来,该领域面临新的需求和挑战。凭借Neoverse平台在高能效推理上的创新能力,Arm在支持大语言模型(LLM)及其他新兴AI应用方面展示了独特优势,使客户能够在满足AI计算需求的同时,实现能效优化和成本控制。特别是超大型云计算提供商如亚马逊云科技、微软,正采用基于Neoverse架构的定制芯片战略来进行数据中心转型,以迎接AI时代的市场需求,进一步巩固了Neoverse在基础设施领域作为计算架构事实标准的地位。
在AI时代,软件的重要性日益显著,Dermot指出,”现在我们拜访AI新创企业,他们的软硬件人员分配,已经从过往的“50%硬件+50%软件”,转变为当前的“10%硬件+90%软件”。为了帮助开发人员简化开发流程,加速产品上市时间,进一步优化产品性能,并节约成本,Arm今后将通过以下三种方式实现这一目标:
- 持续投资打造一致的计算平台,让开发人员不再担心硬件差异,将精力更多投入到应用程序开发上。
- 在硬件平台中提供更强大的加速功能,使软件开发人员能够充分利用异构计算能力。
- 支持开源工具链,加大对开源社区的支持,让软件开发更加便捷易用。
其实,除了数据中心和云服务,许多AI工作负载还需要在设备上进行处理,无论是智能手机、智能家居还是智能汽车,这一趋势将继续增长。因为直接在采集数据的设备上处理AI计算,可以带来更快、更安全的用户体验并减少延迟,这对于工业和汽车应用等对安全性要求很高的用例来说至关重要。
以汽车领域为例,随着软件定义汽车(SDV)逐渐成为行业的趋势和共识,越来越多的车厂对参与到软件运行平台的构建展现出了浓厚的兴趣。为此,Arm不但在2021年发起名为“SOAFEE”(面向嵌入式边缘的可扩展开放架构)的项目,让生态系统中的合作伙伴实现共同协作,解决汽车行业面临的软件层面的挑战,还在2024年首次将服务器级性能的Neoverse 技术和Armv9架构引入汽车应用中,并宣布计划于2025年交付其首款汽车应用CSS。
“这一点对中国汽车OEM来说尤其重要。”Arm汽车事业部市场总监Robert Day表示,中国走在了全球智能驾驶和新能源汽车的前列,创新意愿和力度十分强烈,但汽车系统正变得日益复杂,车厂需要更多的计算能力、更多的计算子系统、更多的软件,Arm希望通过SOAFEE、虚拟原型平台、以及即将推出的汽车CSS,真正赋能生态系统伙伴和汽车行业发展。
Arm汽车事业部市场总监Robert Day
类似的案例还有很多,表明CSS和Arm全面设计(Arm Total Design)的组合正在帮助打造可持续AI应用的硬件基础。通过提供优先获取最新CSS的广泛途径,Arm降低了行业准入门槛,打造了从云端到边缘的多样化芯粒解决方案,并加速了开发速度。
锻造开发者生态系统的力量
在当今快速发展的技术环境中,开发者是推动创新和变革的核心力量。无论是云计算、边缘计算还是物联网,开发者都是将新技术转化为实际应用的关键。AI技术的爆发更是凸显了开发者的重要性,他们不仅需要高效的开发工具和平台,还需要强大的生态系统支持,以实现从概念到产品的快速迭代和部署。
Arm中国区业务全球副总裁邹挺表示,Arm 拥有全球最广大的软件开发者社区,超过 2,000 万名开发者在 Arm 平台上构建和测试基于 Arm 架构的应用。在持续快速发展的人工智能 (AI) 时代,Arm 致力于确保开发者能够获得所需的性能、工具和软件库,无缝获取底层硬件性能,使其更顺畅、简易地进行创新开发。而支持全球开源社区则是确保软件在基于 Arm 技术硬件上“开机即用”的重要一环,为此,Arm 投入了大量的工程资源与时间用以支持开源项目,并通过持续扩大开源合作伙伴关系,为全球软件开发者提供更多访问资源,以助力其实现更高性能。
Arm中国区业务全球副总裁邹挺
这也因此解释了Arm推出“Arm全面设计”生态项目这类赋能合作伙伴的平台的初衷——生态系统合作伙伴专注于各自擅长领域,进而更快、更具成本效益地开发出更好、更强大的产品。目前,Arm全面设计生态项目的合作伙伴数量已达到30家,他们可以优先取用 Arm Neoverse CSS、预集成的IP和电子设计自动化(EDA)工具、设计服务、代工厂支持以及商用软件和固件支持,将定制芯片解决方案快速推向市场。
- 深耕工具和软件库
Arm深知开发者的重要性,因此将构建强大的开发者生态视为其核心战略之一。尤其是在AI时代,强大的开发者生态不仅仅是硬件平台的延伸,更是软硬件协同创新的基石。因此,Arm不仅仅提供强大的硬件架构支持,更致力于打造一个全方位、多层次、易于接入的开发环境,让每一位开发者都能在这个平台上释放潜能,创造价值。
例如,为了使AI能更高效、简单地运行于Arm计算平台之上,并管理好将AI推理从云端扩展到边缘侧时所带来的复杂性,使得开发者能更顺畅地进行AI创新,Arm推出了KleidiAI软件,有助于确保开发者能够获得AI开发所需的性能、工具和软件库,从而打造新一波非凡的AI体验。AI 应用需要考虑成本、隐私、延迟和连接性等问题,利用 KleidiAI将工作负载扩展至边缘侧,能够确保合作伙伴以较低的成本为开发者提供出色的用户体验。
百度智能云已将Arm虚拟硬件应用于百度基于云原生的持续集成/持续部署 (CI/CD) 内部通路。Arm虚拟硬件集成到百度云原生的CI/CD工作流中后,开发者可以在日常中使用其服务和工具进行软件的开发、验证、测试,而无需受限于实体硬件就绪情况,由此提高了CI/CD效率,加速了基于Arm边缘AI的开发和部署。作为Arm多年来重要的合作伙伴,Arm也携手腾讯,将KleidiAI集成到了腾讯混元大模型中,加速端侧AI推理。
不久前,Arm还通过推出GitHub平台AI工具,将Arm计算平台与全球最大的开发者社区GitHub及其GitHub Copilot的强大优势进行了结合,开发者可以在降低成本,并提高生产效率的同时,简化跨应用程序的开发任务。
- 支持全球开源社区
Arm持续的软件投入还正在建立起全球最大的AI开发者社区。如今,超过一亿用户可以使用Arm NN软件开发工具包,在Arm CPU和GPU上优化ML工作负载。此外,Arm还通过开源框架和库,为基于Arm架构的硬件提供强大的ML功能,为开发者提供全方位支持,包括TensorFlow、PyTorch、Caffe 2、OpenVINO和TVM,从而为开源社区打造AI创新基础。
与之对应的是,相当多的AI研究开发社区不仅持续受益于Arm生态系统与合作伙伴提供的丰富信息与知识,也围绕Arm计算平台构建日益增长的软件和工具生态系统,以及开源软件库和AI框架。比如PyTorch基金会投资边缘AI,发布针对移动和边缘设备推理工具包ExecuTorch,提供了轻量级运行时(Runtime)和算子注册表,覆盖了PyTorch生态系统中的各类模型。
加入 OpenCloudOS 社区,则是Arm助力本土开发者获得开放环境的底层硬件知识,进而加速实现创新解决方案的代表性案例之一。作为国产开源操作系统社区,OpenCloudOS沉淀了腾讯及多家厂商在软件和开源生态上的优势,在云原生、稳定性、性能和硬件支持等方面均能提供坚实支撑。通过技术协作,双方将携手提升、优化开源操作系统的性能、功耗等,进一步推动该生态系统的繁荣发展。
为加速龙蜥平台上的Arm软件部署进度,2021年,Arm加入龙蜥开源社区,携手龙蜥社区共同推动基于Arm架构的软硬一体的协同演进、相关的功能实现和性能优化,为广大的软件开发者带来基于Arm架构的顺畅开发环境与流畅的用户体验。
- 与开发者持续交流
Arm注重与开发者交流,尤其是软件和开发者生态构建。过去一年,举办和参与了众多开发者活动,如WoA Arm人工智能创新应用大赛、虚幻引擎技术开放日、AICAS竞赛,以及参与合作伙伴的倚天技术技术沙龙等,这些项目帮助Arm触达到了几十万、上百万的中国开发者。
为了培养和激发本土开发者的创新能力,今年Arm Tech Symposia年度技术大会还特别设置了面向开发者的专场活动。比如,Arm举办AI创新与应用大赛,鼓励开发者在基于Arm的Windows 操作系统上构建原生Arm应用或迁移现有应用,使其能够体验Arm的高性能、卓越的能效、强大的软硬件工具、丰富的生态系统资源以及WoA软件开发社区的支持,激发AI PC开发者在Arm架构上探索AI应用开发的新可能性。
这些仅仅只是一个开端,Arm未来还计划推出更多软件库、计算内核和引擎集成,持续在Arm平台上构建AI的未来。Dermot也同时鼓励各界多多运用Arm CSS和Arm全面设计,为客户打造更多更具影响力的解决方案。
“促进AI的繁荣需要整个生态齐心协力。”邹挺指出,目前,Armv9架构正处于全球部署的高峰,在中国多个基于Armv9的产品,包括阿里巴巴的倚天710 服务器 CPU、中兴微的珠峰 1.0 服务器 CPU,此芯科技面向AI PC的P1持续推向市场。持续对ArmV9架构迭代更新,包括带来更多支撑AI计算的新技术,这个趋势将不断攀升。
另一方面,无论是芯片初创公司还是头部OEM企业自研芯片,他们需要更多来自底层技术的支持,而Arm计算子系统,这套以解决方案切入市场需求的产品价值已经获得客户的认可,包括加速产品推向市场,以及有效减少开发的风险跟成本,将是非常好的选择。
结语
过去的三十多年里,Arm不仅提供了全球最大、应用最广泛的计算平台,而且通过IP与开源软件和工具乃至广泛的行业领先生态系统相结合,并以无与伦比的能源效率著称。同时,持续的软件投入也正建立起全球最大的AI开发者社区,以期实现“所有软件都能无缝地运行在基于Arm架构的系统之上”的愿景。
在这一过程中,数千万开发者的共同努力促进了标准和规范的建立、生态系统扩展;提升了用户体验;推动了技术创新和应用落地;增强了市场竞争力,是创新的源泉和商业成功的关键。
正如Arm曾经协助智能型手机的崛起一样,Arm也期望携手开发者将Arm计算平台作为AI创新的基础,持续推动新一代生态系统合作伙伴关系,共同成为AI计算平台的驱动者,更紧密的硬件、软件与生态系统的赋能者。