拳打英特尔脚踢英伟达，AMD抢先发布7纳米CPU/GPU-电子工程专辑



 0

 收藏

 分享

扫码分享到微信好友

 海报

 扫一扫

扫码查看更多文章

AMD正式推出专为数据中心打造的首款7纳米CPU和GPU，据称在性能和上市时间方面都比英特尔最新一代14纳米Xeon、Nvidia 12纳米Volta GPU领先...

超威半导体(Advanced Micro Devices；AMD)在近日举行的‘Next Horizon’大会上推出专为数据中心打造的首款7纳米CPU和GPU。相形之下，英特尔(Intel)目前最新一代Xeon处理器仍采用14纳米，辉达(Nvidia)目前的Volta GPU则采用12纳米FFN技术工艺。

AMD并未透露太多该新芯片及其性能的相关细节。然而，业界分析师普遍看好该公司可望延续自2016年底推出首款14纳米Zen芯片以来的成长动能。

AMD总裁暨首席执行官苏姿丰(Lisa Su)在媒体和分析师活动上表示，AMD持续专注于高性能，并正全力投入数据中心的发展，着眼于未来主导这一领域。

她展示以一颗7纳米EPYC x86处理器进行渲染任务的性能，要比起采用双插槽的英特尔Skylake Xeon系统性能更强。此外，在一项推论任务展示中，AMD的7纳米Vega GPU基准检验比分也与Nvidia V100旗鼓相当。

新创公司Highwai展示采用AMD 7纳米Vega执行于其人工智能(AI)仿真软件，以实现自动驾驶出租车导航功能。该公司首席技术专家兼共同创办人Raul Diaz也表示，AMD的芯片大致上相当于Volta GPU。

但他说：“我们还没有时间进行任何系统级的比较。”他指出，AI训练才是最需要更高性能的应用。

EPYC (左)和Vega都采用多芯片封装技术（来源：AMD）

AMD于去年5月推出的现有14纳米EPYC，将该公司在x86服务器市场原本仅占0.5%的占有率提高到1.5%。市调机构国际数据公司(IDC)半导体研究副总裁Mario Morales表示，随着AMD的客户关系重新步入轨道，7纳米版本可望有助于AMD在2019年中期推动其x86服务器市占率更上层楼。

IDC运算半导体研究副总裁Shane Rao表示，今年第二季，基于Zen的x86芯片已经将AMD的整体微处理器单元(MPU)市占率提高到9.23%了，高于2016年第二季的7.43%。从营收来看，IDC估计AMD的处理器占有率在同期间也从2.64%成长到5.3%。不过，英特尔的x86业务仍持续主导这两类市场的所有架构，其市占率超过90%。

AMD持续积极利用创新封装技术，以提供更低成本的EPYC。单个模块包括多达8个7纳米处理器芯片，并以AMD的Infinity Fabric连接至带有内存控制器的单个14纳米I/O芯片。这一途径扩展了14纳米EPYC在单一封装上堆栈四颗芯片的封装方式。

AMD首席技术专家Mark Papermaster说：“对于14纳米EPYC而言，一颗较大芯片的成本将会增加1.7倍......模拟I/O的扩展性又不如数字逻辑，因此这部份持续沿用14纳米技术即可......其他的也将采取类似的方法。”

包括Moor Insights & Strategy的Patrick Moorhead等分析师均表示认同。

Moorhead说：“我认为这是整个芯片产业的未来，特别是当制造大型单芯片变得越来越困难，也越来越昂贵了。产业的下一步将是采用2.5D和3D封装，让这些芯片彼此堆栈在一起。”

7纳米EPYC代号为Rome，是第一款使用PCIe Gen 4的x86服务器处理器。相较于英特尔目前的高阶服务器芯片采用96信道，它可以支持多达128个互连通道。

Rome包含多达64个双线程Zen 2核心，数量是使用第一代Zen核心的14纳米Naples芯片的两倍。这些芯片和下一代Milan都将适用于相同插槽，因此厂商无需再设计新的主板。

AMD表示，Rome的传输速率是Naples的2倍，浮点性能更高4倍。然而，AMD并未提供目标数据速率、具体基准比分或有关该芯片的其他详细信息。不过，该芯片预计将在2019年正式推出。

AI运算：Vega vs Volta

AMD一方面以7纳米EPYC架构展示与英特尔Xeon服务器芯片的比较，同时也针对机器学习和商用绘图处理器提供直接竞争Nvidia Volta的替代方案。AMD Radeon绘图技术事业群工程部资深副总裁王启尚(David Wang)说：“产业需要竞争。”

7纳米Vega GPU包含132亿颗晶体管。与新款EPYC一样，AMD表示7纳米Vega的性能较上一代14纳米芯片提高了25%。这款高阶的MI60版本用于GPU运算，可支持64个运算单元、4,096个串流处理器，以及高达32GB的HBM2内存并支持PCIe Gen 4。

相较于其竞争对手Nvidia在其GPU上附加多重累积单元，AMD对于AI采取了不同的途径，主要是在其所有的运算单元中，支持从4位和8位整数器增加到16位、32位和64位浮点数学的格式，并使用混合精度的32位累加器。

AMD资深产品经理Evan Groenke说：“我们想要的是一款高度灵活的加速器，而不是专用于FP16。”
其结果是使得这款芯片大约较Volta在优化之前的性能领先约7%，而面积还不到Volta的一半——Vega芯片尺寸331mm2 vs Volta芯片尺寸800+ mm2。Groenke强调，提高机器学习的性能并不需要使用大型专用芯片。

平均而言，7纳米Vega在AI任务中的性能领先Nvidia Volta约7%

AMD表示，Vega能够为AI训练提供29.5Tera FP16的每秒作业性能。针对推论作业，它可为8位整数提供59TOPS性能，针对4位整数任务则可达到118 TOPS。

此外，AMD还在芯片上增加了硬件虚拟化功能。因此，一个7纳米Vega能支持多达16个虚拟机，或者一个虚拟机可以将其工作分成八个以上的GPU。

王启尚说：“这就是我们差异化的一部份，而且是免费的。它搭配GPU一起推出，因而无需授权。”

云端巨擘预计可在今年年底之前取得MI60加速卡的早期版本。MI50版本的性能大约较MI60低10%，支持高达16GB的HBM2，将在明年4月之前推出。

Vega架构GPU加速卡的销售将取决于AMD为GPU运算发布的开放来源ROCm软件应用。该公司已经发布该程序代码的更新版本，现在可以支持更多的机器学习架构、数学库、Docker和Kubernetes。

拉拢AWS服务互别苗头？

在主题演讲中，Papermaster介绍了7纳米Zen x86核心的改进。他并表示，采用台积电(TSMC) 7nm+工艺的新芯片版本可望在2020年正式推出，它可能类似于AMD为其原始Zen组件提供的12纳米升级版。

Zen 2核心支持更新的分支预测器、更好的指令预取、更大的微指令(micro-op)快取和重新优化的指令快取。浮点缓存器和加载/储存单元还倍增到256位。

因此，AMD声称其7纳米x86芯片将在性能和上市时间方面领先英特尔的10纳米版本(英特尔预计要到明年底才能上市)。此外，该公司还增强其Infinity Fabric互连技术，但并未透露更多细节。

此外，由于AMD已经针对Spectre安全漏洞提供增补软件，Zen 2处理器核心将在硬件层面完全防堵Spectre侧信道攻击。Papermaster说，该芯片也不至于遭受Meltdown或Foreshadow的攻击。

AMD看好整体高达290亿美元的数据中心市场，并持续取得更多市场动能，除了EPYC如今已广泛用于百度(Baidu)、Dropbox、Microsoft Azure、Oracle和腾讯(Tencent)，阿里巴巴(Alibaba)、百度和微软也使用了AMD的GPU。

Lisa Su展示将在明年正式上市的7纳米EPYC

亚马逊(Amazon)也成为AMD最新且最引人注目的客户，AWS并宣布采用EPYC的M5a、R5a和T5a计划。AWS运算服务副总裁Matt Garman说：“我们希望支持每一项工作负载，而AMD是客户感兴趣的目标之一。”

英特尔也很快地响应表示其Xeon芯片已用于大部份的AWS案例，其中包括54项基于其最新Skylake芯片的服务。

分析师Moorhead表示，全球最大的云端服务供应商提供EPYC，可说是当天活动的最大亮点，同时也证明了EPYC的实力。此外，他并补充说，从英特尔的快速反应也显示一场x86领域的竞赛将再次拉开。

编译：Susan Hong, EET Taiwan

关注最前沿的电子设计资讯，请关注“电子工程专辑微信公众号”

amd yes
AMD YES！

数据中心/服务器 EDA/IP/IC设计制造/封装人工智能处理器/DSP 业界新闻

拳打英特尔脚踢英伟达，AMD抢先发布7纳米CPU/GPU

AI运算：Vega vs Volta

拉拢AWS服务互别苗头？

杂志声明