据外媒the verge报道,Arm日前正式公布了其最新产品Cortex-A78和Cortex-X1 CPU,Mali-G78 GPU以及Ethos-N78 NPU。
Arm表示,如果一切顺利的话,使用这些新设计的芯片将用于2021年及以后的下一代旗舰智能手机和移动设备上。在高通、联发科等厂商的下一代芯片上应该不难看到这些 Arm“公版”架构设计的身影。
Cortex-A78
作为Cortex-A77的后继方案,在保持相同功耗的前提下,3GHz Cortex-A78 配合 5nm 工艺能实现的性能,要比 2.6GHz A77 配合 7nm 工艺的方案高出 20%。若是在同样性能的条件下做对比,A78的功耗则要比A77低出 50% 之多,同频率下 A78 的性能升幅为 7%。
若是将采用 DynamiQ 的 A78 产品(四颗 A78 加四颗 A55)和基于 A77 的 DynamiQ 方案(四颗 A77 加四颗 A55)相对比,前者能在减少 15% 占板面积的同时提升 20% 的性能。
A78的性能能够满足目前5G严苛的电池消耗,同时适用于多个和更大屏幕的可折叠设备。另外在如今非常重要的机器学习性能上,A78 的综合能效也比 A77 高了 10%。
Mali-G78
Mali-G78 GPU专为手机、平板、VR 等移动设备设计,其支持的最高核心数量从 16 个提升到 24 个。Arm表示,对比上代的 G77 ,G78的图形性能有25%的提升,能效及机器学习性能分别提升 10% 和 15%,实际运行游戏则有 6% 到 17% 的性能提升。此外G78还引入了异步时钟域的设计,彻底重写了FMA(融合乘加)引擎,核心可以工作在不同频率,可节省30%的功耗。
Mali-G78 还有一个名为 Mali-G68 的小改款,定位中端,其核心设计与 G78 完全相同,区别在于最高仅支持 6 个 GPU 核心,用限制核心数量来区隔产品之间的性能上限。
Cortex-X1
此外,Arm还宣布了全新的Cortex-X1高性能CPU,它是 Arm Cortex-X Custom 项目(CXC)的首款产品,仍属于Arm v8家族。
性能方面,根据官方给出的参考设计,采用一颗 X1 核心、三颗 A78 核心加四颗 A55 核心(共享 8MB L3 缓存)的设计相较前面提到的 A77 DynamiQ 方案(共享 4MB L3 缓存),能在占板面积仅增加 15% 的前提下,达成 30% 的峰值性能提升。
由于单Cortex-X1核心面积比A77和A78要大得多,所以不太可能采用原先的“4大 + 4小”设计,而是会按照Arm给出的“1超大 + 3大 + 4小”参考设计。Cortex-X1的L2缓存的最大容量为1MB,带宽是原来的两倍,可以最大限度地提高性能,而共享的L3缓存可以达到8MB,是前几代缓存的两倍。
与此同时,X1 的机器学习性能相较 A77 翻了一番,整数运算性能相比同代产品 A78 也有 22% 的提升。
WikiChip认为,Cortex-X1在结构设计上与Cortex-A78如出一辙,但几乎在每个地方都进行了扩展。前端解码部分从4端口增加到了5端口,宏指令缓存直接加倍,达到3000条,甚至超过Intel的Sunny Cove(2250条),但少于Zen 2(4000条)。乱序重排缓冲区(ROB)的大小也是扩充到224条,与Zen 2和Skylake持平。
图自WikiChip
执行部分中变化最大的是FP单元,也就是Arm特有的NEON浮点引擎,Cortex-X1上面直接将FP单元的数量倍增,达到4x128B的规模,宽度上基本等同于目前的桌面x86处理器,不过Arm目前的指令集并不允许单个长度大于128B的向量,在吞吐上肯定是不如桌面端处理器的。
初看之下,相对更追求极致性能的 X1 可能更像是一套为平板或是笔记本电脑准备的方案,而不像Cortex-A78一样完全用于智能手机。但是考虑到如今手游对高性能处理器的需求,感觉也是有厂商会把它用在手机上的,就像游戏型笔记本经常采用台式机CPU一个道理。
Ethos-N78
最后,Arm还推出了全新的Ethos-N78 NPU,与Ethos-N77相比,峰值运算性能提升超过 2 倍,能效提升 25%,将为移动设备带来更强大的机器学习能力。同时它的面积缩小了最多 30%,而且对 DRAM 的占用最多也能减少 40%。
责编:Luffy Liu
本文综合自Arm官网、WikiChip、超能网、瘾科技、爱搞机、快科技、cnBeta、雷科技报道