继2021年首推Armv9 CPU之后,近日,Arm正式对外发布2022全面计算解决方案(TCS22),包括第二代基于Armv9架构的CPU IP—Arm Cortex-X3、Arm Cortex-A715、Mali-G615,并增强了Arm Cortex-A510和改善了DSU-110,此外,Arm还同时推出了全新旗舰级GPU产品Arm Immortalis™,这是首款可在移动端支持基于硬件的光线追踪的GPU,可提供更为真实的沉浸式游戏体验。

Arm高级副总裁兼终端事业部总经理Paul Williamson说,今年Arm通过新的扩展CPU集群,来应对市场对性能和效率的新需求。新的CPU设计旨在提升峰值性能,并提供出色的持续性能和效率。据称,TCS22 的 Arm IP 组合可在一系列工作负载中实现28%的性能提升,以及16%的能耗降低。

Armv9 CPU家族再度上新

新的Arm Cortex-X3可面向广泛的基准和应用市场,与最新款的安卓旗舰智能手机和最新的主流笔记本电脑相比,其性能分别提升了25%和34%。

Arm Cortex-A715专注于高效性能,与Cortex-A710相比,其能效提升了20%,且性能提升了5%,达到了可媲美Cortex-X1性能的重要里程碑。考虑到高效性能的重要性,Cortex-A715的CPU集群采用了基于大小核(big.LITTLE)的配置,这也是目前全球消费级设备最常用的异构处理架构。

基于Armv9架构的Arm Cortex-A510在2021年推出,这是Arm四年来推出的首款高效小核。今年的更新版本在保持性能不变的同时,将功耗降低了5%。同时,与去年的上一代产品相比,更新版的DSU-110所支持的CPU集群内核数增加了50%,实现了不同等级消费级设备的可扩展性。

Arm史上性能最强GPU问世

移动设备的创新推动了移动游戏的迅猛发展,视觉效果出色的AAA游戏的兴起也要求相互匹配的性能表现,从而又推动了相关硬件平台的升级。

全新旗舰级GPU产品Immortalis在Mali技术积淀的基础上进行了配置和增强,具备基于硬件的光线追踪功能,旨在为安卓游戏生态系统提供更好的移动3D体验。特别值得关注的是,Arm的光线追踪单元专为效率而打造,只占用了约4%的着色器核心面积,且仅耗费非常小幅的功耗,却能在相关领域带来300%的显著性能提升。

另外两款高端GPU产品,Arm Mali-G715 GPU提供所有新款GPU都具备的可变速率着色(Variable Rate Shading)图形功能,能够显著降低能耗,并进一步提升游戏性能;Mali-G615则将为更广大的开发者和消费者更快地带来高端的移动应用场景、功能和特性。 

与前一代产品相比,最新的Arm GPU在性能和能效方面均提升了15%,可提供更长的游戏时间。同时,它们还将提供2倍的机器学习能力,以实现更多的智能应用和更出色的用户体验,是迄今为止Arm性能最强的 GPU。

“Mali-G715和Mali-G615将提供比去年旗舰级GPU更高的性能,天玑9000已在游戏中展现出了领先性能,正在用更丰富、更深入的视觉效果来推动性能的极限。” Paul Williamson说。

迄今为止,Arm Mali GPU出货量已超过80亿颗,Arm架构正成为移动游戏的基石。Paul Williamson指出,性能效率是将视觉体验应用到各处的关键,而今天,实时3D 游戏是主要的驱动力。如果要将游戏应用从智能手机转移到AR/VR等其他领域,则需要游戏世界的开发者和创作者将他们的经验应用其中。因此,Arm一直与Unity等伙伴合作,致力于通过最新的IP,为开发者带来基于Arm架构的终极视觉体验。

以游戏为例,这是一项系统级别的工作负载,重要的是衡量系统相关的指标,而非个别IP。在一个游戏示例中,通过基于8核CPU集群进行测量,在DSU上共享 8MB L3 缓存,并运行于安卓S的软件栈。在2022全面计算解决方案中,可以看到高达23%的DRAM带宽减少,显著改善了缓存大小与游戏工作负载,同时改善了效率并最终延长游戏性能续航。

与2021全面计算解决方案相比,系统能耗减少了16%。这一重大提升,将为百万级移动游戏开发者带来进一步的持续游戏性能表现。并且,最终在不同工作负载中的测试,性能可显著提高28%,这些都是来自于系统层级优化的结果。

总体而言,Arm全面计算是面向系统范围的方法,其中包括所有囊括在内的Arm产品,从而进行全面优化设计。针对具体用例,Arm会对其工作负载以及它本身的局限性进行深入了解。也就是说,对方案中涉及的Arm产品(包括编译器、IP、开发人员的工具等)进行优化时,就能确保所建模的工作负载能够在实际性能中实现。这一方法在于理解每个应用都有其独特的需求。只有对系统上的各项组件进行优化,才能实现最佳性能。

移动计算生态全面进入64位时代

Paul Williamson认为,不仅是游戏,所有应用都应该尽快过渡到64位。中国市场在这方面已经取得了良好进展——主要的应用商店已表明,到今年8月,所有新上架的应用都是64位的。他补充说,事实上,64位应用能够为用户带来更好的体验,比如在应用启动时间方面能够加快20%,任何没有过渡到64位的应用都会因为性能上的欠佳,让用户感到失望。

为此,Arm 2022全面计算解决方案提出了三项原则:

首先是性能方面,如果用户对性能有高要求,Arm倡导需要迅速过渡到64位。如果说过去开发者对64位生态系统的就绪程度还有一些犹豫不决,那么随着近期OPPO、vivo 和小米等公司参与的中国金标联盟的宣布,中国的计算生态系统和应用生态系统已全面就绪64位。这意味着,未来几年的旗舰级智能手机都需保证为全64位设计,以确保获得更好的效率和更强的性能。

其次是开发者的可及性方面,最新的IP在机器学习性能方面进行了更新或提升,为了确保开发者能够获得这些性能,Arm将持续致力于Arm计算库和Arm NN框架,以确保开发者能访问这些性能。无论是在GPU中的矩阵乘法的改善,还是系统级优化和设计中其他地方的缓存微调中,Arm NN和Arm计算库让开发者能获取这些性能。

最后是安全性。Arm一直在加强处理内的安全性,已经推出了非对称内存标签扩展,这被认为是去年推出的同步MTE和异步MTE的结合。Arm还将这些保护措施扩展到设计中较小的可信执行环境中,这也是系统执行软件栈中可能最具安全意识的组件,例如人脸解锁和面部识别功能,需要确保免受额外的恶意攻击。在新一代产品,Arm将这些安全增强引入设备的可信执行环境中,安全功能将在这个环境中运行。

Paul Williamson还在最后透露了Arm未来的产品路线图。如上图所示,在大核CPU产品线中出现了新的项目:Hunter和 Chaberton;GPU产品线中则出现了Titan和Krake两个项目。同时,Arm也正投资于系统IP和安全性的增强,前者将确保低延迟的内存路径和系统级缓存性能,从而推动现实世界的持续性能以及综合基准的提升;后者,例如增加对隔离和虚拟化的支持,这将与安卓系统的的pKVM倡议保持一致。

责编:Lefeng.shao
本文为EET电子工程专辑原创文章,禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
阅读全文,请先
您可能感兴趣
面对AI时代带来的差异化趋势、软件应用及开发时间长、软硬件协同难、高复杂度高成本等挑战,国产EDA仍需不断探索和创新。
通过机器学习技术,EDA工具可以获取更精确的模型来预测设计中存在的问题,如布线拥塞、信号干扰、热效应等,从而为用户提供更准确快速的指导,避免后期返工。
该小组汇集了国内外领先的芯片及IP、嵌入式开发工具、操作系统等厂商,形成强有力的组织,使命是通过一站式功能安全认证服务,帮助企业提升认证价值,满足IEC 61508、ISO 26262等国际功能安全认证标准,从而更高效地达成功能安全要求。
在ICCAD 2024主峰会上,中国半导体行业协会集成电路设计分会理事长魏少军教授带来“中国芯片设计业要自强不息”主题报告演讲,深入解读了过去一年中国IC设计业的发展机遇与挑战,权威分析中国IC设计业各环节的主要数据及其背后的意义。
近日,华为终端BG CEO何刚在和紫牛基金创始合伙人张泉灵的对话中表示,华为Mate 70系列每一颗芯片都有国产的能力。此外,日前在深圳宝安中学的一场讲座中,华为终端BG 董事长余承东也自豪地宣布Mate70实现了芯片的100%国产化。
常情况下,英特尔的CEO在65岁时退休,而现年63岁的基辛格突然被退休,让市场感到意外。为了确保平稳过渡,英特尔董事会立即着手寻找新的CEO人选……
目前,智能终端NFC功能的使用频率越来越高,面对新场景新需求,ITMA多家成员单位一起联合推动iTAP(智能无感接近式协议)标准化项目,预计25年上半年发布1.0标准,通过功能测试、兼容性测试,确保新技术产业应用。
中科院微电子所集成电路制造技术重点实验室刘明院士团队提出了一种基于记忆交叉阵列的符号知识表示解决方案,首次实验演示并验证了忆阻神经-模糊硬件系统在无监督、有监督和迁移学习任务中的应用……
C&K Switches EITS系列直角照明轻触开关提供表面贴装 PIP 端子和标准通孔配置,为电信、数据中心和专业音频/视频设备等广泛应用提供创新的多功能解决方案。
投身国产浪潮向上而行,英韧科技再获“中国芯”认可
近期,多个储能电站项目上新。■ 乐山电力:募资2亿建200MWh储能电站12月17日晚,乐山电力(600644.SH)公告,以简易程序向特定对象发行A股股票申请已获上交所受理,募集资金总额为2亿元。发
来源:观察者网12月18日消息,自12月2日美国发布新一轮对华芯片出口禁令以来,不断有知情人士向外媒透露拜登政府在卸任前将采取的下一步动作。美国《纽约时报》12月16日报道称,根据知情人士以及该报查阅
投资界传奇人物沃伦·巴菲特,一位94岁的亿万富翁,最近公开了他的遗嘱。其中透露了一个惊人的决定:他计划将自己99.5%的巨额财富捐赠给慈善机构,而只将0.5%留给自己的子女。这引起了大众对于巴菲特家庭
有博主基于曝光的信息绘制了iPhone 17系列渲染图,对比iPhone 16系列,17系列最大变化是采用横置相机模组,背部DECO为条形跑道设计,神似谷歌Pixel 9系列,这是iPhone六年来的
来源:IT之家12 月 18 日消息,LG Display 韩国当地时间今日宣布,已将自行开发的“AI 生产系统”投入到 OLED 生产线的日常运行之中,该系统可提升 LG Display 的 OLE
12月18 日,据报道,JNTC与印度Welspun BAPL就车载盖板玻璃的开发及量产签订了投资引进业务合作备忘录(MOU)。资料显示,JNTC是韩国的一家盖板玻璃厂商。Welspun的总部位于印度
扫描关注一起学嵌入式,一起学习,一起成长在嵌入式开发软件中查找和消除潜在的错误是一项艰巨的任务。通常需要英勇的努力和昂贵的工具才能从观察到的崩溃,死机或其他计划外的运行时行为追溯到根本原因。在最坏的情
近期,高科视像、新视通、江苏善行智能科技等企业持续扩充COB产能。插播:加入LED显示行业群,请加VX:hangjia188■ 高科视像:MLED新型显示面板生产项目(二期)招标12月18日,山西高科
在上海嘉定叶城路1688号的极越办公楼里,最显眼的位置上,写着一句话:“中国智能汽车史上,必将拥有每个极越人的名字。”本以为这句话是公司的企业愿景,未曾想这原来是命运的嘲弄。毕竟,极越用一种极其荒唐的
LG Display  12月18日表示,为加强OLED制造竞争力,自主开发并引进了“AI(人工智能)生产体系”。“AI生产体系”是AI实时收集并分析OLED工艺制造数据的系统。LG Display表