超威半导体(Advanced Micro Devices;AMD)在近日举行的‘Next Horizon’大会上推出专为数据中心打造的首款7纳米CPU和GPU。相形之下,英特尔(Intel)目前最新一代Xeon处理器仍采用14纳米,辉达(Nvidia)目前的Volta GPU则采用12纳米FFN技术工艺。
AMD并未透露太多该新芯片及其性能的相关细节。然而,业界分析师普遍看好该公司可望延续自2016年底推出首款14纳米Zen芯片以来的成长动能。
AMD总裁暨首席执行官苏姿丰(Lisa Su)在媒体和分析师活动上表示,AMD持续专注于高性能,并正全力投入数据中心的发展,着眼于未来主导这一领域。
她展示以一颗7纳米EPYC x86处理器进行渲染任务的性能,要比起采用双插槽的英特尔Skylake Xeon系统性能更强。此外,在一项推论任务展示中,AMD的7纳米Vega GPU基准检验比分也与Nvidia V100旗鼓相当。
新创公司Highwai展示采用AMD 7纳米Vega执行于其人工智能(AI)仿真软件,以实现自动驾驶出租车导航功能。该公司首席技术专家兼共同创办人Raul Diaz也表示,AMD的芯片大致上相当于Volta GPU。
但他说:“我们还没有时间进行任何系统级的比较。”他指出,AI训练才是最需要更高性能的应用。
EPYC (左)和Vega都采用多芯片封装技术(来源:AMD)
AMD于去年5月推出的现有14纳米EPYC,将该公司在x86服务器市场原本仅占0.5%的占有率提高到1.5%。市调机构国际数据公司(IDC)半导体研究副总裁Mario Morales表示,随着AMD的客户关系重新步入轨道,7纳米版本可望有助于AMD在2019年中期推动其x86服务器市占率更上层楼。
IDC运算半导体研究副总裁Shane Rao表示,今年第二季,基于Zen的x86芯片已经将AMD的整体微处理器单元(MPU)市占率提高到9.23%了,高于2016年第二季的7.43%。从营收来看,IDC估计AMD的处理器占有率在同期间也从2.64%成长到5.3%。不过,英特尔的x86业务仍持续主导这两类市场的所有架构,其市占率超过90%。
AMD持续积极利用创新封装技术,以提供更低成本的EPYC。单个模块包括多达8个7纳米处理器芯片,并以AMD的Infinity Fabric连接至带有内存控制器的单个14纳米I/O芯片。这一途径扩展了14纳米EPYC在单一封装上堆栈四颗芯片的封装方式。
AMD首席技术专家Mark Papermaster说:“对于14纳米EPYC而言,一颗较大芯片的成本将会增加1.7倍......模拟I/O的扩展性又不如数字逻辑,因此这部份持续沿用14纳米技术即可......其他的也将采取类似的方法。”
包括Moor Insights & Strategy的Patrick Moorhead等分析师均表示认同。
Moorhead说:“我认为这是整个芯片产业的未来,特别是当制造大型单芯片变得越来越困难,也越来越昂贵了。产业的下一步将是采用2.5D和3D封装,让这些芯片彼此堆栈在一起。”
7纳米EPYC代号为Rome,是第一款使用PCIe Gen 4的x86服务器处理器。相较于英特尔目前的高阶服务器芯片采用96信道,它可以支持多达128个互连通道。
Rome包含多达64个双线程Zen 2核心,数量是使用第一代Zen核心的14纳米Naples芯片的两倍。这些芯片和下一代Milan都将适用于相同插槽,因此厂商无需再设计新的主板。
AMD表示,Rome的传输速率是Naples的2倍,浮点性能更高4倍。然而,AMD并未提供目标数据速率、具体基准比分或有关该芯片的其他详细信息。不过,该芯片预计将在2019年正式推出。
AI运算:Vega vs Volta
AMD一方面以7纳米EPYC架构展示与英特尔Xeon服务器芯片的比较,同时也针对机器学习和商用绘图处理器提供直接竞争Nvidia Volta的替代方案。AMD Radeon绘图技术事业群工程部资深副总裁王启尚(David Wang)说:“产业需要竞争。”
7纳米Vega GPU包含132亿颗晶体管。与新款EPYC一样,AMD表示7纳米Vega的性能较上一代14纳米芯片提高了25%。这款高阶的MI60版本用于GPU运算,可支持64个运算单元、4,096个串流处理器,以及高达32GB的HBM2内存并支持PCIe Gen 4。
相较于其竞争对手Nvidia在其GPU上附加多重累积单元,AMD对于AI采取了不同的途径,主要是在其所有的运算单元中,支持从4位和8位整数器增加到16位、32位和64位浮点数学的格式,并使用混合精度的32位累加器。
AMD资深产品经理Evan Groenke说:“我们想要的是一款高度灵活的加速器,而不是专用于FP16。”
其结果是使得这款芯片大约较Volta在优化之前的性能领先约7%,而面积还不到Volta的一半——Vega芯片尺寸331mm2 vs Volta芯片尺寸800+ mm2。Groenke强调,提高机器学习的性能并不需要使用大型专用芯片。
平均而言,7纳米Vega在AI任务中的性能领先Nvidia Volta约7%
AMD表示,Vega能够为AI训练提供29.5Tera FP16的每秒作业性能。针对推论作业,它可为8位整数提供59TOPS性能,针对4位整数任务则可达到118 TOPS。
此外,AMD还在芯片上增加了硬件虚拟化功能。因此,一个7纳米Vega能支持多达16个虚拟机,或者一个虚拟机可以将其工作分成八个以上的GPU。
王启尚说:“这就是我们差异化的一部份,而且是免费的。它搭配GPU一起推出,因而无需授权。”
云端巨擘预计可在今年年底之前取得MI60加速卡的早期版本。MI50版本的性能大约较MI60低10%,支持高达16GB的HBM2,将在明年4月之前推出。
Vega架构GPU加速卡的销售将取决于AMD为GPU运算发布的开放来源ROCm软件应用。该公司已经发布该程序代码的更新版本,现在可以支持更多的机器学习架构、数学库、Docker和Kubernetes。
拉拢AWS服务互别苗头?
在主题演讲中,Papermaster介绍了7纳米Zen x86核心的改进。他并表示,采用台积电(TSMC) 7nm+工艺的新芯片版本可望在2020年正式推出,它可能类似于AMD为其原始Zen组件提供的12纳米升级版。
Zen 2核心支持更新的分支预测器、更好的指令预取、更大的微指令(micro-op)快取和重新优化的指令快取。浮点缓存器和加载/储存单元还倍增到256位。
因此,AMD声称其7纳米x86芯片将在性能和上市时间方面领先英特尔的10纳米版本(英特尔预计要到明年底才能上市)。此外,该公司还增强其Infinity Fabric互连技术,但并未透露更多细节。
此外,由于AMD已经针对Spectre安全漏洞提供增补软件,Zen 2处理器核心将在硬件层面完全防堵Spectre侧信道攻击。Papermaster说,该芯片也不至于遭受Meltdown或Foreshadow的攻击。
AMD看好整体高达290亿美元的数据中心市场,并持续取得更多市场动能,除了EPYC如今已广泛用于百度(Baidu)、Dropbox、Microsoft Azure、Oracle和腾讯(Tencent),阿里巴巴(Alibaba)、百度和微软也使用了AMD的GPU。
Lisa Su展示将在明年正式上市的7纳米EPYC
亚马逊(Amazon)也成为AMD最新且最引人注目的客户,AWS并宣布采用EPYC的M5a、R5a和T5a计划。AWS运算服务副总裁Matt Garman说:“我们希望支持每一项工作负载,而AMD是客户感兴趣的目标之一。”
英特尔也很快地响应表示其Xeon芯片已用于大部份的AWS案例,其中包括54项基于其最新Skylake芯片的服务。
分析师Moorhead表示,全球最大的云端服务供应商提供EPYC,可说是当天活动的最大亮点,同时也证明了EPYC的实力。此外,他并补充说,从英特尔的快速反应也显示一场x86领域的竞赛将再次拉开。
编译:Susan Hong, EET Taiwan
关注最前沿的电子设计资讯,请关注“电子工程专辑微信公众号”
- amd yes
- AMD YES!