如果问Armv9与Armv8究竟有何不同?那么安全性、AI以及改进的矢量和DSP功能,应该会是该架构最重要的“三大支柱”,尤其是安全性。
过去几年中,保护全球数据安全已成为芯片行业的头等大事,为此,Armv9架构中引入了Arm机密计算架构(Confidential Compute Architecture, CCA)。机密计算通过打造基于硬件的安全运行环境来执行计算,保护部分代码和数据,免于被存取或修改,甚至不受特权软件的影响。
Arm CCA将引入动态创建机密领域(Realms)的概念,机密领域面向所有应用,运行在独立于安全或非安全环境之外的环境中,以实现保护数据安全的目的。例如,在商业应用中,机密领域可以保护系统中商用机密数据和代码,无论它们正被使用、闲置或正在传输中。
内存标签扩展(memory tagging extensions, MTE)功能也值得关注,尽管这并不是v9的新功能,而是随着v8.5引入的,但它旨在通过在分配时标记指针并在使用时进行检查,来帮助解决软件世界中两个长期存在的安全问题:缓存溢出(Buffers overflows)和释放后重用(use-after-free)。通过提升软件安全性并消除软件中存在的问题,可以提高软件在用户层面的安全信任度,如此一来,用户将更愿意通过计算机来处理事情,从而将增加对Arm架构的芯片使用。
再来看一下Armv9对AI功能的支持与扩展。
AI工作负载的普遍性和广泛性需要更多样化和专用的解决方案。据估计,到21世纪20年代中期,全球将有超过80亿台搭载AI语音辅助的设备,且90% 或更多设备上的应用程序将包含AI元素以及基于AI的界面,如视觉或语音 。
为了满足这一需求,2016年,Arm与富士通合作开发了可伸缩矢量扩展(Scalable Vector Extension, SVE)技术,并首次在富士通A64FX CPU内核中实现,该芯片驱动了世界上最快的超级计算机“富岳”。在此基础上,Arm为Armv9开发了SVE2,以便在更广泛的应用中实现增强的机器学习和数字信号处理能力。
与SVE相比,SVE2增强了对在CPU上本地运行的5G系统、虚拟和增强现实以及ML工作负载的处理能力,例如Scatter-Gather DMA直接存储器访问,将该功能放到CPU架构中能实现更多的循环,更大的DSP处理能力,从而支持更多的并行化。在未来几年,Arm将进一步扩展其技术的AI能力,除了在其Mali GPU和Ethos NPU中持续进行AI创新外,还将大幅增强CPU内的矩阵乘法指令(Matrix multiplication instructions)。
因为Arm认为在未来几年中,越来越多的ML工作负载,甚至是在专用加速器上运行ML工作负载,将在对性能或电源效率有关键要求的场景中变得司空见惯,而矩阵乘法指令将成为Arm生态系统更大范围采用v9 CPU所迈出的重要一步。
在过去的五年里,Arm每年都以超过业界的速度在提升CPU性能,Armv9也不例外,预计未来两代移动和基础设施CPU的性能提升都将超过30%。Arm高级副总裁、首席架构师兼技术院士Richard Grisenthwaite表示,这个数据是根据业界标准评测工具来衡量的,而且这样的算力提升完全是凭借于架构本身而非制程工艺来实现。另外,随着摩尔定律正在放缓,Arm未来将通过最大化地提升频率、带宽、缓存大小、并减少内存延迟,以最大化CPU 性能。
但其实,随着行业从通用计算向普遍的专用处理发展,每年两位数的CPU性能提升是不够的。除了增强专用处理能力,Arm的全面计算(Total Compute)设计方法将通过集中的系统级硬件和软件优化以及用例性能的提高,加速总体计算性能。
通过将全面计算的设计原则应用在包含汽车、客户端、基础设施和物联网解决方案的整个IP组合中,Armv9系统级技术将遍及整个IP解决方案,并改善个别IP。此外,Arm还在开发多项技术以提高频率、带宽、缓存,并降低内存延迟,从而最大限度地提升基于Armv9的CPU性能。
在Armv9推出之后,率先推出的将是针对安全、DSP、ML这三个重点领域的Armv9-A系列,相关产品最快在2021年年底就会面世。之后,Arm还会逐渐推出Armv9-M与Armv9-R系列。
Richard Grisenthwaite称,事实上,此前Armv8不仅被广泛地应用于智能手机中,在其他领域,比如服务器、PC、网络设备中也都能看到Armv8的身影。同样,Armv9也将会应用于上述所有领域,尤其是在服务器和汽车市场。他坦承,为了解决一些新的问题,Arm确实加入了一些看起来更加复杂的技术,但Arm架构的精简指令(RISC)核心没有改变,依然遵循着注册到注册(registration to registration)的操作原则,所以从硬件角度来看,Arm指令集仍然保持着精益性。同时,考虑到兼容性对于Arm十分重要,所以Arm确保了在32位/64位v8架构中的所有功能均将在v9架构中得到支持。
最后,在被问及Armv9架构今后是否可以供给包括华为在内的中国企业时?Arm市场营销副总裁Ian Smythe承诺说,“Arm既有源于美国的IP,也有非源于美国的IP。经过全面的审查,Arm确定其Armv9架构不受美国出口管理条例(EAR)的约束。Arm已将此通知美国政府相关部门,我们将继续遵守美国商务部针对华为及其附属公司海思的指导方针。”