在近日举行的Arm Tech Symposia年度技术大会北京场,Arm高级副总裁兼基础设施事业部总经理Mohamed Awad表示,Arm 已从IP 提供商转型为计算平台公司,在致力于 IP 授权业务的同时,也专注于通过完整且全面的解决方案,为合作伙伴带来选择的灵活性,帮助他们更快地将产品推向市场。其所构建的Arm全面计算解决方案(Arm® Total Compute Solutions)、Arm Neoverse™平台、Arm Corstone™、SOAFEE等解决方案,为合作伙伴加快产品上市进程,并实现差异化提供了坚实的基础。
Arm高级副总裁兼基础设施事业部总经理Mohamed Awad
计算、性能和软件驱动Arm计算平台
“目前中国合作伙伴基于Arm架构芯片的总出货量已累计超过300亿颗,即平均为地球上的每个人出货近4颗芯片。同时,Arm在中国有近400家技术授权客户,开发者超过400万名。“Mohamed Awad说作为全球的基石技术,Arm计算平台由计算、性能和软件这三大支柱所驱动,目前有70%的机器学习应用已经运行在Arm平台之上。随着更多具备AI功能的设备面向市场,这一比例还将持续攀升。
Arm为移动、基础设施、物联网,以及汽车领域推出对应的计算平台,可以加速合作伙伴产品上市进程
物联网
如今,物联网不再只是一种只能负责开关的设备,还能听取和筛选数据,并利用AI快速解决各种复杂问题。这与Arm的构想完全一致——位于边缘的数十亿台微型设备协同工作,利用AI改善人类生活的方方面面。
Cortex-M52是Arm在物联网领域的最新尝试,这款处理器采用了Arm Helium技术,为Armv8.1-M Cortex-M系列(包括Cortex-M55、Cortex-M85)增加了150条新的标量和矢量指令,是专为人工智能加速应用设计的体积最小、成本效益最高的处理器。与上一代Cortex-M相比,Helium指令可将机器学习算法的性能提高5.6倍,将数字信号处理(DSP)工作负载的性能提高2.7倍。
当然,Arm在物联网领域的投资远不止于IP,还围绕平台展开。例如Arm Corstone可将关键IP进行集成配置,满足一系列性能点的需求,从而实现快速开发。在软件和虚拟硬件的支持下,Corstone能够在性能和外设灵活性之间达到平衡的同时降低风险,使系统的核心计算组件能够更快地推向市场。
终端
智能手机等领域也正在经历快速变革。如今,个人设备的性能已经非常接近高端笔记本电脑和 PC 的性能。据 GSMA 统计,2022年76%的亚洲人通过智能手机上网,而这一数字到2030年将增长至94%,要想抓住这一机遇,一个能够根据各类消费者需求进行扩展的平台是必不可少的。
对此,Arm推出了全面计算解决方案(Arm Total Compute Solutions),旨在解决单个IP与碎片化解决方案优化问题时面临的重大挑战。这意味着,在解决系统创新设计的挑战时,Arm已经将关注焦点从单一的产品演进,转化为以应用场景与体验为导向的系统解决方案,要对硬件IP、物理IP、软件、工具、以及彼此间的协作进行全面优化。
今年5月,Arm为智能手机推出了性能最优异的移动计算平台——Arm 2023全面计算解决方案(TCS23),包括Arm Mali-G720、Mali-G620、采用全新第五代GPU架构的Immortalis-G720;全新的Armv9 Cortex CPU计算集群;以及可为上千万Arm开发者提供更易访问软件的全新增强技术—Arm NN和Arm Compute Library。TCS23 得到了来自华硕、MediaTek、OPPO、三星、台积公司、vivo等合作伙伴的大力支持。而明年基于Armv9架构的2024 Arm全面计算解决方案(TCS24)将会着重解决生成式AI新需求。
此外,在开发者生态系统打造方面,Arm为所有主流操作系统和开源软件提供广泛的优化工具集,例如以适用于多个平台和应用场景的基础编译器、软件库和框架,旨在让开发者尽可能轻松地从基于Arm平台运行的软件中获得出色性能。
汽车
向软件定义方向发展,已经成为当今汽车产业无可辩驳的发展趋势。一辆高端汽车可能包含多达五亿行代码,而这一数字在未来将达到十亿。为了助力上述转变实现顺利过渡,Arm与生态伙伴共同发起了面向嵌入式边缘的可扩展开放架构SOAFEE(Scalable Open Architecture For the Embedded Edge)与AE(Automotive Enhanced,汽车增强)IP,旨在通过全行业的携手合作,共同解决三大挑战——加速软件开发、软件可移植性和软件可升级性,并强化汽车安全。
据透露,成立两年多来,支持SOAFEE架构的车厂、芯片供应商、一级供应商和软件等合作伙伴已超过100家。今年,Arm的工作重点聚焦SOAFEE蓝图的实施,助力用户能够安全、快速地启动应用,顺利开发出互联汽车、自动驾驶汽车或车载信息娱乐 (IVI)系统。
基础设施
随着大型语言模型(LLM)的加速发展,生成式AI正迅速成为人们日常生活中的一部分。但当今的LLM模型在单位推理价格方面存在严重的效率低下问题,主要原因在于数据中心内系统架构的内存占用。
“在传统架构中,与加速器紧密耦合的HBM内存无法满足整个模型的容量需求,在AI 时代,需要换个角度来思考问题。“Mohamed Awad指出,现代化的系统架构中需要定制CPU的存在,它既利用了强大的软件生态系统,又可直接连接到每个加速器,在加速器和CPU之间建立高性能连接,并在整个系统层面实现内存一致性。
NVIDIA GH200 Grace Hopper所使用的正是这样的架构。在这样的架构当中,72颗 Arm Neoverse核心与NVIDIA GPU的组合,使其AI性能较基于x86架构的系统提升了10倍;在近期的AWS re:Invent大会上,AWS发布了第四代基于Arm Neoverse 平台的处理器Graviton4。与Graviton3相比,Graviton4的处理速度提高了30%,核心数量增加了50%,内存带宽增加了75%;微软近期发布的首款专为计算中心打造的定制芯片Microsoft Azure Cobalt 100 CPU则基于Arm Neoverse计算子系统(CSS)打造,该芯片具有128颗 Neoverse内核。
NVIDIA GH200 Grace Hopper超级芯片采用Arm Neoverse搭配NVIDIA GPU,满足AI性能的需求
在中国,类似的合作也不胜枚举。例如阿里巴巴凭借倚天710为阿里云构建了性能出众的解决方案,与传统方案相比,这款搭载128核心的芯片能够显著提升性能效率;鸿钧微电子、遇贤微电子与云豹智能通过与Arm的合作,在新一代服务器CPU以及云计算与数据中心DPU设计方面获得竞争优势。除此之外,Arm还携手联想等合作伙伴,通过在国内设立 Arm 5G解决方案实验室加快基于Arm架构解决方案的部署。
同时,考虑到在不断增长的数据量和越来越具有挑战性的功耗限制等双重因素影响之下,全球的数据中心与网络基础设施正面临着巨大压力。Arm推出了Arm Neoverse计算子系统(CSS)和Arm全面设计(Arm Total Design)生态项目,核心目的是希望能够帮助合作伙伴快速交付基于Neoverse CSS的定制SoC,帮助降低合作伙伴的创新成本,并将其想要构建的定制数据中心计算系统更快推向市场。
Arm Neoverse计算子系统(CSS)
Arm全面设计(Arm Total Design)生态项目助力合作伙伴加速基于Neoverse CSS的芯片开发
全球知名IP数据分析机构IPnest数据显示,2022年,Arm的增长为24.5%,市场占比达到41.1%,领先于Synopsys、Imagination和Alphawave等公司。如果按许可收入对IP供应商进行排名,2022年,Arm以25.2%位居第二;版税收入方面,得益于客户安装基础和在智能手机行业的强大地位,Arm以60.8%的市场份额占据第一。
当被问及与RISC-V、高通等企业竞争话题时,Mohamed认为竞争是一件好的事情,它能够推动整个行业包括Arm在内不断创新,带来更好的产品。“我们推出的Arm全面计算解决方案就是要帮助合作伙伴打造出最为优秀的移动终端产品。未来,我们除了持续专注于赋能生态系统打造更强大的产品外,还会通过与安谋科技的合作进一步助力本土合作伙伴。”
他强调称,Arm始终致力于支持中国客户和在中国的生态系统。作为一家全球化公司,Arm必须遵守全球的法律法规。到目前为止,Arm和所有合作伙伴的合作均遵循全球各地的法律法规,并将持续以合规的方式,保持与合作伙伴之间的合作,尽所能地支持中国的生态系统。
“我相信在中国,很重要的一点就是通过不断努力来加速创新,而正是这样的持续创新的精神,牵引着Arm和我们的生态伙伴一起取得了显著成就,并向市场推出更多新的产品。“Mohamed Awad表示。