前言:服务器是一种为客户机提供服务的高性能计算机
下载链接:
服务器基础知识全解PPT(终极版)
服务器基础知识全解PDF(终极版)
如雨后春笋般拔起的新生的Arm服务器芯片试图打入服务器领域并与X86架构的霸主竞争。但事情并没有那么简单。
Calxeda于2011年推出,然后由于复杂的原因而闻名,因为它没有64位处理器,并且在软件堆栈就绪之前就无法将硬件堆栈强制进入数据中心。它在还试图为合作伙伴提供技术支持之前就用光了资金。
Nvidia启动了Project Denver Arm服务器计划,然后悄悄将其杀死。
三星从来没有公布过自己的计划,并在承认任何内容之前将其杀死。
AMD参与了K12 Arm服务器项目及其低端的“西雅图” APU。试图在系统中节省面子,但随后又撤回去专注于Epyc X86服务器芯片,这无疑是正确的选择。如果世界在某个将来想要或需要大容量的Arm服务器,那么AMD将能够通过用Arm内核全局替换Epyc内核来相当快地创建一个服务器,这基本上就是K12项目的目标。
高通公司在其Centriq系列产品上的表现然给大家大吃一惊,然后他们在将原型机和量产芯片投入市场后,发现这在财务上并不能获得很好的表现,最后公司将其关闭。
Phytium于三年前推出了其“火星” ARM服务器芯片,但很久没有他们的消息,这可能是因为华为技术公司的HiSilicon Kunpeng 920似乎是中国的选择。
Broadcom组装了非常出色的“ Vulcan” Arm服务器芯片,并制定了在数据中心取代英特尔的计划,但在试图收购高通的过程中,他们放弃了Vulcan的工作。Cavium收购并了Vulcan的产品,并打造了其变体—— ThunderX2芯片。
而在此期间,Marvell收购了Cavium,并接受了高通的服务器芯片设计团队。换而言之,Marvell从其他公司的失败中获益良多,尤其是因为它确实是唯一一家与ARM有密切关系的ARM服务器芯片供应商。
富士通在以HPC为中心的A64FX处理器方面做得很好。针对传统的超级计算以及AI工作负载。
AWS的Graviton系列Arm服务器芯片也表现良好 ,它已经搭建在其EC2计算服务上按小时销售。如果Graviton芯片在AWS云上起飞,它有可能成为比ThunderX系列更高产量的产品。
此外,还有一家很可靠的Arm服务器处理器制造商——Ampere Computing,这家公司是在两年前基于Applied Micro X-Gene Arm服务器芯片业务发展起来的,它的创始人是英特尔前总裁Renee James,公司本身也有很多前英特尔芯片工程师,公司也获得了凯雷投资集团的股权支持。Ampere产品高级副总裁Jeff Wittich与The Next Platform进行了交谈,探讨了该公司下一步的发展方向,该公司正在制定路线图,并试图将Arm服务器成为超大规模和公共云精英中(public cloud elite)的数据中心。
Wittich对这些客户并不陌生,这就是为什么Ampere在六月聘请他担任现有职位的原因。Wittich在巴黎圣母大学获得电气工程学士学位,然后在加利福尼亚大学圣芭芭拉分校获得电气工程硕士学位,在加入英特尔之前,他还在该大学担任了两年的研究生研究员。他曾担任蚀刻设备的工艺工程师一年,然后在晶圆厂担任高级设备工程师,从事45纳米high K金属栅极工艺的研究,该工艺在2000年代后期首次出现在Intel Xeon服务器芯片中。在这个职位工作了五年之后,Wittich担任了英特尔22纳米产品的产品可靠性工程师,并于2014年成为芯片巨头的云业务和平台战略高级总监。
我们想说的是,James和Wittich非常了解这些超大规模客户和云构建者客户。这对英特尔来说可能是比在硅芯片上的指令集和晶体管的巧妙排列更为危险的东西。
这是我们谈话的起点。如果您从IT部门以外的地方看过去八到十年,您对此一定不会了解,您可能会认为有人有意从Denard微缩的终结和摩尔定律在晶体管发展中的放缓中受益。所有的CPU供应商都开始迷茫,且并不能按时完成重要的工作,这与hyperscalers和云构建商的兴起以及英特尔能够通过其数据中心保持50%的毛利率相吻合产品,因为即使在理论上竞争日趋激烈的情况下,那些过时的替代性Arm芯片供应商也无法以可预见的节奏大量交付合适的芯片。
我完全同意,Wittich告诉The Next Platform。“这是我认为非常重要的一件事,事实上我们整个Ampere的执行团队都已经做到了这一点。因此,对我而言,500,000个产品听起来并不多。因为我已经这样做了15年,我们的首席架构师和工程负责人都为十代或更多代的高容量服务器级CPU做到了这一点。我认为我们知道大规模交付大量产品的需求。这就是为什么我认为我们特别适合在这个领域取得成功的原因。
看看Ampere执行团队,您会发现Wittich不是在开玩笑。这些人都是来自英特尔的老手。他们都认为,创建该替代方案的时机已经成熟,而Arm架构是必经之路。
“如果有人能够确定他们具有可靠的产品交付节奏,能够满足批量需求,能够以高效,可靠的方式度过一个良好的周期,为超大规模客户提供期望的客户支持,那么就意味着他们有机会。”Wittich说。“我们不仅仅是在竞争和超越过去十年来广泛的数据中心市场所关注的完全相同的性能指标或TCO指标上。我们专门提供多租户云( multitenant cloud)中所需的性能类型,性能一致性类型和所需的安全性类型。因此,它不仅限于基本性能和基本TCO。这也与 hyperscalers 所需的功率效率类型有关。他们正在寻找的可扩展性类型 而这正是云架构功能的基础,可提供服务质量,可管理性和安全性。现在有机会通过做一些真正不同和真正创新的事情来重塑预期。”
尽管它是一款非常受人尊敬的服务器芯片,但有人可能会说,eMAG 1芯片不是这样产品,因为它是基于Applied Micro创建的“ Skylark” X-Gene 3芯片,并经过Ampere的一些调整打造的。其实32核Skylark芯片于2018年9月开始批量发货,与Intel的16核“ Skylake” Xeon SP处理器相比,前者的堆叠做得相当好,并提供了相同数量的线程(当Intel开启HyperThreading时)。
所有的Ampere芯片都使用没有线程的真实内核来扩展计算,这是一个明智的选择,因为它简化了一些流水线,而且,在同时启用超线程的情况下,某些工作负载的性能变差而不是更好。
最后,添加线程提供了另一种可以降低安全性的方法,因为线程意味着虚拟化和共享诸如寄存器和L1缓存之类的资源,并且公共云上的虚拟CPU(vCPU)通常具有最高级的线程(不是核心),Wittich说,这从本质上讲不太安全。
借助下一代Arm服务器处理器(代号为“ Quicksilver”,不会被称为eMAG 2,官方还没命名),Ampere将不断扩大规模,并增加一堆不同的向量。而且它仍然专注于多租户云和边缘用例,并没有像其他Arm供应商正在尝试的那样真正追求传统企业平台或HPC领域。Ampere将使用由Arm Holdings创建的Neoverse N1平台下的“ Ares”内核设计,Ampere正在进行修改,以优化性能并利用Ampere自己的网状互连来进行片上通信。下一代Ampere芯片将在单片芯片上扩展多达80个内核,
就像eMAG 1一样,Ampere Quicksilver芯片将具有八个存储通道,Wittich说它将拥有与eMAG 1一样多的存储带宽,而且它还将与其他Arm服务器芯片上一样,从第三方获得DRAM存储控制器,商。Quicksilver芯片将支持CCIX接口以链接至GPU之类的加速器,并将支持两路NUMA配置以及单路实现。CCIX将成为这些NUMA链接的传输器。这是有原因的,因为Applied Micro并没有真正的基于硬件的NUMA技术,而是针对X-Gene 2诉诸于PCI-Express上的基于软件的NUMA。(其他Arm芯片制造商正在将CCIX用于NUMA链接。),未来的CPU也将具有PCI-Express 4.0外围控制器,但通道数量尚不清楚。
尚未透露的是该7纳米Quicksilver芯片的时钟速度。Quicksilver芯片的计算和散热区间将比Skylark芯片大得多。Skylark芯片的SKU区间从75瓦到125瓦,但是Quicksilver的区间从45瓦到200瓦或更高。这意味着SKU可能从10个核心一直到80个核心,这取决于Quicksilver芯片的非核心区域消耗了多少空间。
据Wittich说,Quicksilver芯片本周从晶圆厂回来了,样品将在今年年底之前发货给主要合作伙伴。该计划是在2020年中期之前增加交易量。
正如您所看到的,Ampere在路线图上还公开展示了另外两个芯片,目前正在开发中的有7纳米的后续产品,而在定义阶段则有5纳米的附加功能。这或多或少地符合Arm Holding Neoverse路线图,我们希望Ampere或多或少与之保持同步,选择和选择Arm认为合适的技术,以及与Quicksilver所做的一样。这意味着芯片部署每年或多或少的节奏。
来源:the nextplatform
作者:Timothy Prickett Morgan
下载链接:
服务器基础知识全解PPT(终极版)
服务器基础知识全解PDF(终极版)
免责申明:本号聚焦相关技术分享,内容观点不代表本号立场,可追溯内容均注明来源,发布文章若存在版权等问题,请留言联系删除,谢谢。
温馨提示:
请搜索“AI_Architect”或“扫码”关注公众号实时掌握深度技术分享,点击“阅读原文”获取更多原创技术干货。