AMD正式推出专为数据中心打造的首款7纳米CPU和GPU,据称在性能和上市时间方面都比英特尔最新一代14纳米Xeon、Nvidia 12纳米Volta GPU领先...

超威半导体(Advanced Micro Devices;AMD)在近日举行的‘Next Horizon’大会上推出专为数据中心打造的首款7纳米CPU和GPU。相形之下,英特尔(Intel)目前最新一代Xeon处理器仍采用14纳米,辉达(Nvidia)目前的Volta GPU则采用12纳米FFN技术工艺。

AMD并未透露太多该新芯片及其性能的相关细节。然而,业界分析师普遍看好该公司可望延续自2016年底推出首款14纳米Zen芯片以来的成长动能。

AMD总裁暨首席执行官苏姿丰(Lisa Su)在媒体和分析师活动上表示,AMD持续专注于高性能,并正全力投入数据中心的发展,着眼于未来主导这一领域。

她展示以一颗7纳米EPYC x86处理器进行渲染任务的性能,要比起采用双插槽的英特尔Skylake Xeon系统性能更强。此外,在一项推论任务展示中,AMD的7纳米Vega GPU基准检验比分也与Nvidia V100旗鼓相当。

新创公司Highwai展示采用AMD 7纳米Vega执行于其人工智能(AI)仿真软件,以实现自动驾驶出租车导航功能。该公司首席技术专家兼共同创办人Raul Diaz也表示,AMD的芯片大致上相当于Volta GPU。

但他说:“我们还没有时间进行任何系统级的比较。”他指出,AI训练才是最需要更高性能的应用。

AMD-EPYC-and-VEGA.jpg

EPYC (左)和Vega都采用多芯片封装技术(来源:AMD)

AMD于去年5月推出的现有14纳米EPYC,将该公司在x86服务器市场原本仅占0.5%的占有率提高到1.5%。市调机构国际数据公司(IDC)半导体研究副总裁Mario Morales表示,随着AMD的客户关系重新步入轨道,7纳米版本可望有助于AMD在2019年中期推动其x86服务器市占率更上层楼。

IDC运算半导体研究副总裁Shane Rao表示,今年第二季,基于Zen的x86芯片已经将AMD的整体微处理器单元(MPU)市占率提高到9.23%了,高于2016年第二季的7.43%。从营收来看,IDC估计AMD的处理器占有率在同期间也从2.64%成长到5.3%。不过,英特尔的x86业务仍持续主导这两类市场的所有架构,其市占率超过90%。

AMD持续积极利用创新封装技术,以提供更低成本的EPYC。单个模块包括多达8个7纳米处理器芯片,并以AMD的Infinity Fabric连接至带有内存控制器的单个14纳米I/O芯片。这一途径扩展了14纳米EPYC在单一封装上堆栈四颗芯片的封装方式。

AMD首席技术专家Mark Papermaster说:“对于14纳米EPYC而言,一颗较大芯片的成本将会增加1.7倍......模拟I/O的扩展性又不如数字逻辑,因此这部份持续沿用14纳米技术即可......其他的也将采取类似的方法。”

包括Moor Insights & Strategy的Patrick Moorhead等分析师均表示认同。

Moorhead说:“我认为这是整个芯片产业的未来,特别是当制造大型单芯片变得越来越困难,也越来越昂贵了。产业的下一步将是采用2.5D和3D封装,让这些芯片彼此堆栈在一起。”

7纳米EPYC代号为Rome,是第一款使用PCIe Gen 4的x86服务器处理器。相较于英特尔目前的高阶服务器芯片采用96信道,它可以支持多达128个互连通道。

Rome包含多达64个双线程Zen 2核心,数量是使用第一代Zen核心的14纳米Naples芯片的两倍。这些芯片和下一代Milan都将适用于相同插槽,因此厂商无需再设计新的主板。

AMD表示,Rome的传输速率是Naples的2倍,浮点性能更高4倍。然而,AMD并未提供目标数据速率、具体基准比分或有关该芯片的其他详细信息。不过,该芯片预计将在2019年正式推出。

AI运算:Vega vs Volta

AMD一方面以7纳米EPYC架构展示与英特尔Xeon服务器芯片的比较,同时也针对机器学习和商用绘图处理器提供直接竞争Nvidia Volta的替代方案。AMD Radeon绘图技术事业群工程部资深副总裁王启尚(David Wang)说:“产业需要竞争。”

7纳米Vega GPU包含132亿颗晶体管。与新款EPYC一样,AMD表示7纳米Vega的性能较上一代14纳米芯片提高了25%。这款高阶的MI60版本用于GPU运算,可支持64个运算单元、4,096个串流处理器,以及高达32GB的HBM2内存并支持PCIe Gen 4。

相较于其竞争对手Nvidia在其GPU上附加多重累积单元,AMD对于AI采取了不同的途径,主要是在其所有的运算单元中,支持从4位和8位整数器增加到16位、32位和64位浮点数学的格式,并使用混合精度的32位累加器。

AMD资深产品经理Evan Groenke说:“我们想要的是一款高度灵活的加速器,而不是专用于FP16。”
其结果是使得这款芯片大约较Volta在优化之前的性能领先约7%,而面积还不到Volta的一半——Vega芯片尺寸331mm2 vs Volta芯片尺寸800+ mm2。Groenke强调,提高机器学习的性能并不需要使用大型专用芯片。

Vega-Volta-perf.jpg

平均而言,7纳米Vega在AI任务中的性能领先Nvidia Volta约7%

AMD表示,Vega能够为AI训练提供29.5Tera FP16的每秒作业性能。针对推论作业,它可为8位整数提供59TOPS性能,针对4位整数任务则可达到118 TOPS。

此外,AMD还在芯片上增加了硬件虚拟化功能。因此,一个7纳米Vega能支持多达16个虚拟机,或者一个虚拟机可以将其工作分成八个以上的GPU。

王启尚说:“这就是我们差异化的一部份,而且是免费的。它搭配GPU一起推出,因而无需授权。”

云端巨擘预计可在今年年底之前取得MI60加速卡的早期版本。MI50版本的性能大约较MI60低10%,支持高达16GB的HBM2,将在明年4月之前推出。

Vega架构GPU加速卡的销售将取决于AMD为GPU运算发布的开放来源ROCm软件应用。该公司已经发布该程序代码的更新版本,现在可以支持更多的机器学习架构、数学库、Docker和Kubernetes。

拉拢AWS服务互别苗头?

在主题演讲中,Papermaster介绍了7纳米Zen x86核心的改进。他并表示,采用台积电(TSMC) 7nm+工艺的新芯片版本可望在2020年正式推出,它可能类似于AMD为其原始Zen组件提供的12纳米升级版。

Zen 2核心支持更新的分支预测器、更好的指令预取、更大的微指令(micro-op)快取和重新优化的指令快取。浮点缓存器和加载/储存单元还倍增到256位。

因此,AMD声称其7纳米x86芯片将在性能和上市时间方面领先英特尔的10纳米版本(英特尔预计要到明年底才能上市)。此外,该公司还增强其Infinity Fabric互连技术,但并未透露更多细节。

此外,由于AMD已经针对Spectre安全漏洞提供增补软件,Zen 2处理器核心将在硬件层面完全防堵Spectre侧信道攻击。Papermaster说,该芯片也不至于遭受Meltdown或Foreshadow的攻击。

AMD看好整体高达290亿美元的数据中心市场,并持续取得更多市场动能,除了EPYC如今已广泛用于百度(Baidu)、Dropbox、Microsoft Azure、Oracle和腾讯(Tencent),阿里巴巴(Alibaba)、百度和微软也使用了AMD的GPU。

Lisa-Su-with-AMD-EPYC-Rome.jpg

Lisa Su展示将在明年正式上市的7纳米EPYC

亚马逊(Amazon)也成为AMD最新且最引人注目的客户,AWS并宣布采用EPYC的M5a、R5a和T5a计划。AWS运算服务副总裁Matt Garman说:“我们希望支持每一项工作负载,而AMD是客户感兴趣的目标之一。”

英特尔也很快地响应表示其Xeon芯片已用于大部份的AWS案例,其中包括54项基于其最新Skylake芯片的服务。

分析师Moorhead表示,全球最大的云端服务供应商提供EPYC,可说是当天活动的最大亮点,同时也证明了EPYC的实力。此外,他并补充说,从英特尔的快速反应也显示一场x86领域的竞赛将再次拉开。

编译:Susan Hong, EET Taiwan 

qrcode_EETCwechat_120.jpg

关注最前沿的电子设计资讯,请关注“电子工程专辑微信公众号”

  • amd yes
  • AMD YES!
您可能感兴趣
AMD股价暴跌成为市场关注的焦点,在2月5日盘后交易中一度暴跌超过10%,市值蒸发约200亿美元,创下自2023年以来的最大单日跌幅。在同一时间段内,AMD的主要竞争对手英伟达的股价大幅上涨,涨幅高达160%......
台积电对中国大陆的集成电路实施一系列严格的供应限制,特别是针对16/14nm工艺及以下的产品,不在BIS白名单中的“approved OSAT”进行封装,并且台积电没有收到该封装厂的认证签署副本,这些产品将被暂停发货。这一发货限制,将使得16/14nm及以下工艺的相关产品在出口到中国大陆时,生产和封装环节变得更加透明......
许多人认为这可能是 AI 模型训练领域的一次重大突破,预示着未来 AI 模型的训练和应用将更加平民化。然而,随着更多细节浮出水面,事实似乎并不像最初报道的那样简单。
软银集团近期传出有意收购芯片设计公司Ampere 的消息,这一交易若成功完成,Ampere的收购将加速Arm在数据中心市场的渗透,双方谈判已进入“深入阶段”,交易可能在未来几周内宣布......
如果DeepSeek成功改用国产GPU,英伟达在人工智能领域的垄断地位将被打破……
美国政府近年来不断出台限制措施,阻止英伟达等企业将GPU产品出售给中国客户,国内互联网及AI大模型企业不得不寻求其他替代品。这对于国产GPU来说即是压力也是动力……
全球人形机器人领域上市公司的百强名单将人形机器人产业链区分为大脑、身体以及集成三大核心环节,覆盖全球共计100家上市公司。中国共37家企业上榜(中国大陆32家,台湾5家),其中深圳7家,占中国大陆上榜企业近四分之一,包括比亚迪、腾讯、优必选、速腾聚创、雷赛智能、兆威机电、汇川技术等......
DeepSeek模型虽降低AI训练成本,但AI模型的低成本化可望扩大应用场景,进而增加全球数据中心建置量。光收发模块作为数据中心互连的关键组件,将受惠于高速数据传输的需求。未来AI服务器之间的数据传输,都需要大量的高速光收发模块......
凭借新一代3nm制程工艺与全新架构,骁龙® 8至尊版的单核和GPU 性能提升均超过 40%,使得Find N5在性能上实现质的飞跃……
简化物联网连接:应用就绪型软件构建模块
2月10日,市场调查机构 IDC 发文称,2024 年全年中国平板电脑市场出货量为 2985 万台,同比增长 4.3%,市场迎来回暖。报道称, 2024 年第 4 季度市场出货量为 786 万台,受库
当地时间2025年2月10日,恩智浦半导体公司 (NXP) 宣布,已与高性能、节能和可编程离散神经处理单元 (NPU) 领域的行业领导者 Kinara 达成最终收购协议。此次收购将以全现金方式进行,
会议时间:2025年3月13日 13:15--16:35会议地点:无锡富力喜来登酒店 • 三楼齐厅会议地址:无锡市滨湖区梁溪路49号会议介绍物联网作为新一代信息技术高度集成和综合运用的载体,在日常生产
RS90LV049是一款双通道LVDS差分信号发送、接收一体的芯片,可以支持400Mbps的LVDS信号。主要参数特性如下:Ø 符合TIA/EIA-644-A标准;Ø >400Mbps(200MHz)
近日,中国证监会官网显示,格兰菲智能科技股份有限公司(简称“格兰菲”)已在上海证监局办理辅导备案登记,正式启动A股上市进程,辅导机构为海通证券。据披露,格兰菲成立于2020年12月,注册资本为1.28
2月11日,特斯拉上海储能超级工厂投产仪式今日在上海临港举行,这一重要项目的投产标志着特斯拉在华业务的进一步拓展。特斯拉上海储能超级工厂于 2024 年 5 月正式在上海临港新片区开工建设。从开工到产
恩智浦 NXP 荷兰当地时间昨日宣布已同边缘 NPU 企业 Kinara 达成最终协议,计划以 3.07 亿美元现金收购后者。这笔交易预计将于 2025 上半年完成,但须满足包括监管部门批准在内的惯例
一年一度的新能源汽车“掀桌子”活动又开始了,前两年新能源汽车“价格战”的阴影还没有消散,今年关于智能驾驶只怕又要卷生卷死了。搅动风云的,依旧是那个男人,依旧是那个品牌——比亚迪,又来掀桌子了。昨晚,比
  电子无尘车间在设计时需要重视多个问题,以确保生产环境的洁净度、生产效率和安全性。以下是需要重视的设计问题,具体随合洁科技电子洁净工程公司一起来了解下吧! &emsp
新春伊始,苏州工业园区企业以新促兴,开启新一年奋进之旅。2月10日上午,哈曼汽车电子系统(苏州)有限公司车载显示智能制造工厂开业。哈曼集团在该事业领域全球布局的第一条生产线将在这里投入使用,未来满产后