Gartner预测,到2025 年,云原生平台将成为95%以上新数字应用的基础,而在2021 年这一比例只有不到40%。热潮之下,越来越多的企业和开发者开始推动业务与技术的创新向云原生演进。
“凭借性能和能效双优的表现,目前全球已有40多个服务器平台支持Ampere Altra系列处理器,7家全球最大的超大规模数据中心正在部署Ampere Computing的产品,全球所有用户均可使用基于Ampere Computing云原生处理器的服务。”Ampere Computing董事长兼首席执行官Renee James女士对《电子工程专辑》说,仅在中国,从腾讯云SR1实例,到阿里云c6r/g6r实例和手机云游戏服务,再到京东两款分别用于计算和存储的计算平台,都是基于Ampere Altra处理器而打造的。
本土其他合作案例还包括:摩尔线程基于Altra CPU和摩尔线程全功能GPU,共同打造了Arm CPU+GPU硬件参考平台;国内云时代的系统可观测平台——观测云,也成功地完成了在c6r云实例上的部署,并已开始向SaaS订阅用户提供服务。
Ampere Computing董事长兼首席执行官Renee James
而在海外市场,广受欢迎的虚拟主机平台Plesk通过甲骨文云搭载Ampere Altra,仅第一个月就推出了1000多个实例,实现了有史以来最快的产品推广速度;Microsoft开发的基于Altra的Azure虚拟机(VM),比x86同款解决方案高出66%的性价比;其他终端用户,如红牛车队、GenyMobile、墨尔本大学、布里斯托尔大学和耶拿大学,也都在相关云环境应用中受益于Ampere Computing的处理器。
为“云原生”定制
80核Ampere Altra和128核Ampere Altra Max,是Ampere Computing在2020-2021年间先后设计并推出的两款云原生处理器。Ampere方面强调称,这一次他们所做的不是试图扩展和改造现有的处理器架构,而是希望采用全新的设计方法,从头开始打造一款CPU,以满足横向扩展的云原生工作负载对性能和能效的需求,充分适应云原生多租户的环境。
“传统x86架构处理器最大的一个劣势,是它们并不是专门为数据中心所设计的,也不是专门为云端、云业务所设计的。”Ampere Computing首席产品官Jeff Wittich举例说,在用户抗干扰方面,Ampere客户可以非常放心大胆地进行扩展,而不用担心随着工作负载数量、压力的增加而导致处理器性能下降。
Ampere Computing首席产品官Jeff Wittich
另一方面,云基础设施中,CPU是数据中心的基础。在庞大的市场规模下,如果沿用已经使用了40多年的传统CPU架构,由于能耗高、密度低,预计到2025年将会导致能源需求增长2倍,空间需增长1.6倍。无论对云原生的创新,还是对可持续发展,传统的计算技术架构都已捉襟见肘。
而作为高性能、低功耗的边缘云原生处理器,Ampere Altra可将功率降至超低的40W(32C)或低于70W(64C)。这意味着,Ampere Computing 32核处理器的功耗比同等的x86 CPU低4.6倍。或者说,与x86处理器相比,Ampere Altra系列可凭借其50%的能耗,提供其200%的性能。
与此同时,Ampere Computing为了优化了功耗和面积,还去除了传统架构不受云欢迎的特性,实现单核功耗比比传统CPU低67%以上。
可预测性、可扩展性和高性能是Altra系列最具标志性的三大优势。该系列产品的每个核上仅运行一个单线程,并保持一致的高频率,避免了因服务器上多个用户而导致的性能不佳,为云工作负载提供了最优性能。
在利用率方面,Ampere Computing云原生处理器提供超高可扩展性,最高可达128 核,并为每个核提供大容量低延迟的专用缓存。借助智能高带宽mesh互联结构,所有高性能核都连接在一起,打破了传统的CPU在需求增加时会产生递减回报的使用瓶颈。
Jeff Wittich在演讲中表示,公司十分重视开发者社区的创新力,并承诺将从以下三方面大力支持他们的发展。
1.在云平台方面,Ampere Computing已经为OCI、微软Azure、腾讯云、阿里云和Equinix Metals提供了Ampere Altra系列云原生处理器支持,大量的公有云可供开发者使用。
2.在硬件方面,Ampere Computing的ODM和OEM服务器团队合作伙伴的队伍也在不断壮大,包括富士康、技嘉、浪潮、超微和纬颖等;来自技嘉和凌华科技等合作伙伴的开发套件,用于人工智能和自动驾驶等多个场景。此外,凌华科技和Avantek还提供软件开发平台。
3.为了进一步支持开发者的创新,Ampere Computing设立了Ampere Developer Program开发者计划。Ampere Computing的开发者社区提供130多个强大的应用程序,从数据库到AI推理的各种解决方案,应有尽有,并且每天在网站上进行回归和更新。
除了硬件性能外,另一个特别值得关注的现象,是Ampere Computing在拓展云端应用,尤其是在AI推理的吞吐量和延迟,以及量子计算方面做出的积极探索。
- 2021年8月,Ampere Computing宣布收购AI技术初创公司OnSpecta,相较于常用的基于CPU的机器学习框架,基于OnSpecta深度学习方案(DLS)的AI优化引擎可带来超过四倍的加速。同时,通过创建完整的解决方案堆栈,Ampere Computing为TensorFlow和PyTorch等流行的架构提供了基于Ampere Altra和Ampere Altra Max“开箱即用”的体验;
- 2022年2月,Ampere Computing又宣布与Rigetti Computing公司达成战略合作,双方将把Rigetti量子处理单元(QPU)与Ampere Altra Max云原生处理器整合,合作创造混合量子经典计算机,创造能够满足机器学习应用严苛要求的混合计算环境。
IDC研究显示,到2024年,AI服务器市场市值预计将超260亿美元,年增长率将达13.7%。因此,Jeff Wittich在回答《电子工程专辑》的提问时称,AI推理的发展非常迅速,在云端业务当中也展现出了越来越强的重要性。尤其是它既可以和众多工作负载(Web服务、数据库)搭配使用,也可以在CPU当中单独使用。而通过收购OnSpecta公司,Ampere Computing可在AI推理技术的加持之下,持续具备性能/能效双领先的优势。
自研之路
2021年宣布的自研内核产品也有了最新消息。这款被命名为AmpereOne的处理器采用了Ampere Computing自研内核,基于5nm工艺,支持PCIe 5.0和DDR5,新产品已经开始送样。
作为Arm架构的授权方和重要合作伙伴,Ampere在早期产品中就已经使用了Arm IP,例如80核Altra和128核Altra Max均采用了Arm内核,性能表现非常出色,可预测的高性能、高可扩展性和高能效的特性是其最重要的三点,这也是对云原生非常重要的方面。
而之所以选择自研,Ampere方面给出的解释是因为公司开发的产品是专门针对于云,而不是其他数据中心或者其他客户的应用,因此只能从微架构开始一直向上自己研发产品,才能给客户提供专门的定制化服务,才能满足客户对性能、能效、可扩展性提出的日趋严苛的需求。
“从性能角度考虑,Ampere希望能够进一步地优化微架构,来实现更高层级的性能。” Jeff Wittich说目前可供选择的方法,包括持续增加内核数量;确保内核之间相互隔离,不会相互干扰;提供更低功耗,能够满足客户创新需求的云服务器性能;通过使用自研内核,加快处理速度,提高效率等等。
尽管没有透露更多新一代5nm处理器的细节,也没有与Arm Neoverse内核性能进行公开比较,但已知的消息显示,AmpereOne自研核不是基于Arm Neoverse V1或N2而研发的,不过仍以Arm ISA为基础,并与Altra和Altra Max处理器互相兼容。未来五年内,产品路线图会更富创新性,性能更高、功耗更低,并且为云端赋予更多独特的功能。
至此,Ampere Computing拥有了并行的两大产品家族——Ampere Altra系列和基于自研核的产品。它们分别适用于不同工作负载、细分市场和应用程序,助力Ampere Computing 更好地满足云工作负载多样化的需求,例如为边缘场景设计的32核40W 产品,以及为满足超大规模数据中心严苛工作负载设计的超强性能、功耗仅为125W的 128核产品。