在近日于美国硅谷举行的开放计算计划(Open Compute Project,OCP)年会上,聚集了数据中心领域的重量级大咖;其中微软(Microsoft)透露正在测试来自凯为(Cavium)、高通(Qualcomm)以及至少另一家芯片供应商的ARM服务器处理器,为ARM阵营挑战主流英特尔(Intel) x86架构再添希望;Facebook则发布了一系列全新服务器。
全新架构服务器芯片得宠,还不赶快来ARM Design Start自己设计一颗!
Facebook与微软都宣布了采用NVLink链接8颗Nvidia Pascal芯片的加速器系统;此外IBM展示了第一批采用Power 9处理器的主板,内含赛灵思(Xilinx)的FPGA以及以色列业者Mellanox的以太网络交换器,采用Power 9率先支持的最新PCIe 4链接接口。
整体看来,今年的OCP大会显示目前数据中心硬件领域活力充沛,但呈现多元发展的趋势;该计划目前有195家成员,其在线商店有70款产品,有部份还未将硬件设计档案开放,而即使是大咖成员如Facebook与微软的最新主板,也是采用截然不同的设计。
微软开始评估ARM架构服务器的举措,可说是今年OCP大会上最让众人跌破眼镜的消息;该公司的测试是将来自Azure云端服务的一套生产应用程序,以及.Net应用程序架构、还有某个仅供内部使用的Windows Server操作系统版本移植到ARM服务器。微软还协助高通与Cavium以其Project Olympus标准设计主板。
在位于美国华盛顿州Redmond总部的实验室进行初步评估之后,微软将在位于亚洲的一个据点,以小规模的丛集测试超过200片新主板;不过该公司未透露其早期评估结果,以及测试时间将为期多久。
微软的高层十分热衷于探索在数据中心广泛使用ARM处理器的潜力;在两年前加入微软数据中心部门、曾任职于AMD参与ARM架构处理器开发的Leendert Van Doorn表示:“我们进行了以云端服务与生产系统并行的评估,结果相当令人惊艳。”
*微软与凯为、高通的合作将跨越数个世代的处理器;图为微软的Leendert Van Doorn (右)与Kushagra Vaid在OCP年会上展示高通的ARM服务器主板
(来源:EE Times)*
Van Doorn表示,初步评估将涵盖Bing搜索引擎、微软的Cosmos巨量数据分析、储存以及机器学习:“这些索引是我们数据中心容量的一半,因此相当有潜力,”而在另一方面:“我们并没有看到在我们内部应用程序之外以ARM服务器执行Windows Server的任何机会,”因为一般企业用户会执行很多种的既有x86架构应用程序。
Facebook与惠普(HP)都设计了一些早期的ARM服务器系统,但都非常低调;那些新型处理器支持更多核心以及执行续,能媲美最新一代的英特尔Xeon芯片;Van Doorn指出:“今年我们看到的服务器真的很强,而以我们的工作量来说正需要那种强大性能,太弱的服务器不行──产业界其他厂商也有类似的体验。”
Van Doorn表示,有很多因素减轻了移植软件的繁重工作;微软控制自家的程序代码基底(code base),使用越来越多的无关CPU (CPU-agnostic)固件以及限制数量的周边。
微软与凯为、高通的合作将跨越数个处理器世代,而微软对新一代内存架构以及处理器接口的兴趣也很浓厚,例如预计2019年问世的CCIX与Gen-Z;Van Doorn甚至猜测ARM将会扩展其指令集架构,让使用独立16、32与64位操作系统程序代码空间比英特尔架构更容易,因为后者有更多旧版本程序需要支持。
微软在网络服务器主机版测试凯为处理器
“当我们因为无秩序的执行而耗尽精力,人们就会重新检视能让数据流执行以及各种东西,并催促我们迈向下一个阶段;”Van Doorn表示,相较于类似版本的x86架构:“第四版的ARM ISA相对简单多了。”
其他微软可能合作的处理器供应商,只有收购了Appled Mocro以及其ARM处理器部门X-Gene的Macom代表们有现身;但该部门准备要被出售。没出现的是两家中国厂商,一是华为(Huawei),另一家则是新创公司飞腾(Phytium)。
微软的JBOD主板采用高通的ARM服务器处理器
在处理器议题上面面俱到的微软还展示了采用英特尔下一代Skylake处理器与AMD Zen架构Naples处理器的Project Olympus主板(下图),是在OCP首度亮相。
不过微软把采用英特尔Skylake处理器的主板上之内存卡盖住了(下图),也没有预先公布该芯片的功能;针对业界认为他们会采用英特尔3D Xpoint内存(Optane技术)的预期,该公司的一位发言人婉拒发表任何评论。
而微软以及Facebook不约而同展示了加速器系统…
微软(Microsoft)在OCP年会上展示了HGX-1 GPU加速器(下图),采用了4个96通道的PCI Express (PCIe)交换器,以总数32颗GPU连结最多四个机箱;该公司数据中心硬件事业群总经理Kushagra Vaid表示:“没有其他方案能提供这么高的扩展性。”
Facebook的新一代Big Basin加速器(下图),采用了充分发挥Nvidia NVLink高速互连接口的类似方案,将8颗Pascal 100 GPU放进一个机箱,以4个PCIe交换器连结远程服务器。
在微软朝多处理器架构迈进了一大步的同时,Facebook服务器则是以英特尔架构设计、偏向渐进式的演变;举例来说,采用新一代英特尔处理器的第二版Yosemite服务器(下图),支持一个单插槽CPU卡,能在不必关闭其他三个被封在单一节点(sled)之服务器情况下进行替换。
还有双插槽的Tioga Pass服务器(下图),为先前的Leopard服务器添加更多PCIe链接,并将以太网络链接升级到100 Gbits/s。
在储存服务器方面,Bryce Canyon内含72个硬盘,比先前的Open Vault多了20%,并以英特尔的Broadwell处理器做为控制器;Lightning闪存数组采用新的金属托架,能以更佳散热效果支持更高密度的M.2闪存卡。
Facebook技术策略总监Vijay Rao表示,就像先前协助为新一代的储存等级固态硬盘(SSD)开发软件,现在该公司也正在开发永久读取高速缓存(persistent read cache)的程序代码;不过Facebook并未透露任何关于去年问世之英特尔3D Xpoint内存方面的研发进展。
此外还有少数关于48V服务器的新消息,这是Google在去年推动的规格;有几个话题讨论了相关趋势,并至少有两家板卡制造商展示了支持该规格的x86系统原型,但看来12V系统仍然是今年OCP大会上的主流。
Facebook还采用博通(Broadcom)的100Gbit/s Tomahawk II芯片升级了网络交换器。上图的背板在6U机箱中搭载了12颗Tomahawk II芯片,能做为枝叶(leaf)或是主干(spine)交换器;下图的置顶式交换器Wedge 100S则只用了一颗Tomahawk II做为机顶(top-of-rack)交换器,并以升级的Xeon控制器来因应阻断式服务攻击。Facebook预期上述两款系统将于本季量产。
凯为(Cavium)与新创公司Barefoot也展示了采用自家芯片的Wedge交换器;Facebook鼓励了不少网通领域的新厂商,包括台湾的新创公司擎发通讯(Nephos) ,但是到目前为止Facebook还是只采用博通的芯片。
微软在去年推出了Sonic抽象层软件,旨在削弱底层芯片规格的重要性;微软的Vaid表示:“最后交换器可以更像是服务器,”这将为新的连网应用程序以及白牌交换器供应商带来机会。
IBM在今年OCP大会上展示了配备去年发表之Power 9处理器的第一款双插槽主板样本(下图);该款为云端服务业者Rackspace打造的Barrel Eye 2支持最多4颗Nvidia NVLink GPU,以及OpenCAPI与PCIe 4。赛灵思(Xilinx)与Mallanox则分别发表了也支持PCIe 4的一款Virtex FPGA以及100G以太网络转接器。
Google展示了一款较简单的设计(下图),只采用了一个开机硬盘而非上面Rackspace主板采用的25个NVMe固态硬盘;IBM与Google的设计也是少数在OCP上亮相的48V服务器。
编译:Judith Cheng
本文授权编译自EE Times,版权所有,谢绝转载