AMD正式推出专为数据中心打造的首款7纳米CPU和GPU,据称在性能和上市时间方面都比英特尔最新一代14纳米Xeon、Nvidia 12纳米Volta GPU领先...

超威半导体(Advanced Micro Devices;AMD)在近日举行的‘Next Horizon’大会上推出专为数据中心打造的首款7纳米CPU和GPU。相形之下,英特尔(Intel)目前最新一代Xeon处理器仍采用14纳米,辉达(Nvidia)目前的Volta GPU则采用12纳米FFN技术工艺。

AMD并未透露太多该新芯片及其性能的相关细节。然而,业界分析师普遍看好该公司可望延续自2016年底推出首款14纳米Zen芯片以来的成长动能。

AMD总裁暨首席执行官苏姿丰(Lisa Su)在媒体和分析师活动上表示,AMD持续专注于高性能,并正全力投入数据中心的发展,着眼于未来主导这一领域。

她展示以一颗7纳米EPYC x86处理器进行渲染任务的性能,要比起采用双插槽的英特尔Skylake Xeon系统性能更强。此外,在一项推论任务展示中,AMD的7纳米Vega GPU基准检验比分也与Nvidia V100旗鼓相当。

新创公司Highwai展示采用AMD 7纳米Vega执行于其人工智能(AI)仿真软件,以实现自动驾驶出租车导航功能。该公司首席技术专家兼共同创办人Raul Diaz也表示,AMD的芯片大致上相当于Volta GPU。

但他说:“我们还没有时间进行任何系统级的比较。”他指出,AI训练才是最需要更高性能的应用。

AMD-EPYC-and-VEGA.jpg

EPYC (左)和Vega都采用多芯片封装技术(来源:AMD)

AMD于去年5月推出的现有14纳米EPYC,将该公司在x86服务器市场原本仅占0.5%的占有率提高到1.5%。市调机构国际数据公司(IDC)半导体研究副总裁Mario Morales表示,随着AMD的客户关系重新步入轨道,7纳米版本可望有助于AMD在2019年中期推动其x86服务器市占率更上层楼。

IDC运算半导体研究副总裁Shane Rao表示,今年第二季,基于Zen的x86芯片已经将AMD的整体微处理器单元(MPU)市占率提高到9.23%了,高于2016年第二季的7.43%。从营收来看,IDC估计AMD的处理器占有率在同期间也从2.64%成长到5.3%。不过,英特尔的x86业务仍持续主导这两类市场的所有架构,其市占率超过90%。

AMD持续积极利用创新封装技术,以提供更低成本的EPYC。单个模块包括多达8个7纳米处理器芯片,并以AMD的Infinity Fabric连接至带有内存控制器的单个14纳米I/O芯片。这一途径扩展了14纳米EPYC在单一封装上堆栈四颗芯片的封装方式。

AMD首席技术专家Mark Papermaster说:“对于14纳米EPYC而言,一颗较大芯片的成本将会增加1.7倍......模拟I/O的扩展性又不如数字逻辑,因此这部份持续沿用14纳米技术即可......其他的也将采取类似的方法。”

包括Moor Insights & Strategy的Patrick Moorhead等分析师均表示认同。

Moorhead说:“我认为这是整个芯片产业的未来,特别是当制造大型单芯片变得越来越困难,也越来越昂贵了。产业的下一步将是采用2.5D和3D封装,让这些芯片彼此堆栈在一起。”

7纳米EPYC代号为Rome,是第一款使用PCIe Gen 4的x86服务器处理器。相较于英特尔目前的高阶服务器芯片采用96信道,它可以支持多达128个互连通道。

Rome包含多达64个双线程Zen 2核心,数量是使用第一代Zen核心的14纳米Naples芯片的两倍。这些芯片和下一代Milan都将适用于相同插槽,因此厂商无需再设计新的主板。

AMD表示,Rome的传输速率是Naples的2倍,浮点性能更高4倍。然而,AMD并未提供目标数据速率、具体基准比分或有关该芯片的其他详细信息。不过,该芯片预计将在2019年正式推出。

AI运算:Vega vs Volta

AMD一方面以7纳米EPYC架构展示与英特尔Xeon服务器芯片的比较,同时也针对机器学习和商用绘图处理器提供直接竞争Nvidia Volta的替代方案。AMD Radeon绘图技术事业群工程部资深副总裁王启尚(David Wang)说:“产业需要竞争。”

7纳米Vega GPU包含132亿颗晶体管。与新款EPYC一样,AMD表示7纳米Vega的性能较上一代14纳米芯片提高了25%。这款高阶的MI60版本用于GPU运算,可支持64个运算单元、4,096个串流处理器,以及高达32GB的HBM2内存并支持PCIe Gen 4。

相较于其竞争对手Nvidia在其GPU上附加多重累积单元,AMD对于AI采取了不同的途径,主要是在其所有的运算单元中,支持从4位和8位整数器增加到16位、32位和64位浮点数学的格式,并使用混合精度的32位累加器。

AMD资深产品经理Evan Groenke说:“我们想要的是一款高度灵活的加速器,而不是专用于FP16。”
其结果是使得这款芯片大约较Volta在优化之前的性能领先约7%,而面积还不到Volta的一半——Vega芯片尺寸331mm2 vs Volta芯片尺寸800+ mm2。Groenke强调,提高机器学习的性能并不需要使用大型专用芯片。

Vega-Volta-perf.jpg

平均而言,7纳米Vega在AI任务中的性能领先Nvidia Volta约7%

AMD表示,Vega能够为AI训练提供29.5Tera FP16的每秒作业性能。针对推论作业,它可为8位整数提供59TOPS性能,针对4位整数任务则可达到118 TOPS。

此外,AMD还在芯片上增加了硬件虚拟化功能。因此,一个7纳米Vega能支持多达16个虚拟机,或者一个虚拟机可以将其工作分成八个以上的GPU。

王启尚说:“这就是我们差异化的一部份,而且是免费的。它搭配GPU一起推出,因而无需授权。”

云端巨擘预计可在今年年底之前取得MI60加速卡的早期版本。MI50版本的性能大约较MI60低10%,支持高达16GB的HBM2,将在明年4月之前推出。

Vega架构GPU加速卡的销售将取决于AMD为GPU运算发布的开放来源ROCm软件应用。该公司已经发布该程序代码的更新版本,现在可以支持更多的机器学习架构、数学库、Docker和Kubernetes。

拉拢AWS服务互别苗头?

在主题演讲中,Papermaster介绍了7纳米Zen x86核心的改进。他并表示,采用台积电(TSMC) 7nm+工艺的新芯片版本可望在2020年正式推出,它可能类似于AMD为其原始Zen组件提供的12纳米升级版。

Zen 2核心支持更新的分支预测器、更好的指令预取、更大的微指令(micro-op)快取和重新优化的指令快取。浮点缓存器和加载/储存单元还倍增到256位。

因此,AMD声称其7纳米x86芯片将在性能和上市时间方面领先英特尔的10纳米版本(英特尔预计要到明年底才能上市)。此外,该公司还增强其Infinity Fabric互连技术,但并未透露更多细节。

此外,由于AMD已经针对Spectre安全漏洞提供增补软件,Zen 2处理器核心将在硬件层面完全防堵Spectre侧信道攻击。Papermaster说,该芯片也不至于遭受Meltdown或Foreshadow的攻击。

AMD看好整体高达290亿美元的数据中心市场,并持续取得更多市场动能,除了EPYC如今已广泛用于百度(Baidu)、Dropbox、Microsoft Azure、Oracle和腾讯(Tencent),阿里巴巴(Alibaba)、百度和微软也使用了AMD的GPU。

Lisa-Su-with-AMD-EPYC-Rome.jpg

Lisa Su展示将在明年正式上市的7纳米EPYC

亚马逊(Amazon)也成为AMD最新且最引人注目的客户,AWS并宣布采用EPYC的M5a、R5a和T5a计划。AWS运算服务副总裁Matt Garman说:“我们希望支持每一项工作负载,而AMD是客户感兴趣的目标之一。”

英特尔也很快地响应表示其Xeon芯片已用于大部份的AWS案例,其中包括54项基于其最新Skylake芯片的服务。

分析师Moorhead表示,全球最大的云端服务供应商提供EPYC,可说是当天活动的最大亮点,同时也证明了EPYC的实力。此外,他并补充说,从英特尔的快速反应也显示一场x86领域的竞赛将再次拉开。

编译:Susan Hong, EET Taiwan 

qrcode_EETCwechat_120.jpg

关注最前沿的电子设计资讯,请关注“电子工程专辑微信公众号”

  • amd yes
  • AMD YES!
阅读全文,请先
您可能感兴趣
近年来,AWS还积极投资于人工智能(AI)、机器学习(ML)、大数据分析和边缘计算等前沿技术,以保持其在这些领域的竞争优势。
谷歌认为,这种独家协议可能会限制市场竞争,导致其他公司无法自由地使用OpenAI的技术,从而增加了用户面临额外成本的风险,比如数据迁移和员工培训等。
据悉,此次交易是通过马斯克亲自与英伟达CEO黄仁勋进行沟通促成的。这批GB200 AI芯片将被用于强化其旗舰级超级计算集群——Colossus(巨人)。Colossus作为xAI的技术基石,将借此机会实现计算能力的飞跃。
短期全球芯片市场数据的上调反映了 2024 年第 2 季度和第 3 季度业绩的改善,尤其是在计算领域,受AI 芯片支持的需求推动。
常情况下,英特尔的CEO在65岁时退休,而现年63岁的基辛格突然被退休,让市场感到意外。为了确保平稳过渡,英特尔董事会立即着手寻找新的CEO人选……
自1984年,意法半导体首次进入中国,成为首批在中国开展业务的半导体公司。意法半导体CEO Jean-Marc Chery日前表示,中国市场是不可或缺的,是电动汽车规模最大、最具创新性的市场,与中国本地的制造工厂达成合作,具有至关重要的作用。他还表示,意法半导体正在采用在中国市场学到的最佳实践和技术,并将其应用于西方市场,“传教士的故事结束了”。
目前,智能终端NFC功能的使用频率越来越高,面对新场景新需求,ITMA多家成员单位一起联合推动iTAP(智能无感接近式协议)标准化项目,预计25年上半年发布1.0标准,通过功能测试、兼容性测试,确保新技术产业应用。
中科院微电子所集成电路制造技术重点实验室刘明院士团队提出了一种基于记忆交叉阵列的符号知识表示解决方案,首次实验演示并验证了忆阻神经-模糊硬件系统在无监督、有监督和迁移学习任务中的应用……
C&K Switches EITS系列直角照明轻触开关提供表面贴装 PIP 端子和标准通孔配置,为电信、数据中心和专业音频/视频设备等广泛应用提供创新的多功能解决方案。
投身国产浪潮向上而行,英韧科技再获“中国芯”认可
‍‍12月18日,深圳雷曼光电科技股份有限公司(下称“雷曼光电”)与成都辰显光电有限公司(下称“辰显光电”)在成都正式签署战略合作协议。双方将充分发挥各自在技术创新、产品研发等方面的优势,共同推进Mi
来源:IT之家12 月 18 日消息,LG Display 韩国当地时间今日宣布,已将自行开发的“AI 生产系统”投入到 OLED 生产线的日常运行之中,该系统可提升 LG Display 的 OLE
有博主基于曝光的信息绘制了iPhone 17系列渲染图,对比iPhone 16系列,17系列最大变化是采用横置相机模组,背部DECO为条形跑道设计,神似谷歌Pixel 9系列,这是iPhone六年来的
12月18 日,据报道,JNTC与印度Welspun BAPL就车载盖板玻璃的开发及量产签订了投资引进业务合作备忘录(MOU)。资料显示,JNTC是韩国的一家盖板玻璃厂商。Welspun的总部位于印度
2024年度PlayStation游戏奖今日公布,《宇宙机器人》获得年度最佳PS5游戏,《使命召唤:黑色行动6》获得年度最佳PS4游戏。在这次评选中,《宇宙机器人》获得多个奖项,包括最佳艺术指导奖、最
阿里资产显示,随着深圳柔宇显示技术有限公司(下称:“柔宇显示”)旗下资产一拍以流拍告终,二拍将于12月24日开拍,起拍价为9.8亿元。拍卖标的包括位于深圳市龙岗区的12套不动产和一批设备类资产,其中不
又一地,新型储能机会来了?■ 印度:2032储能增长12倍,超60GW据印度国家银行SBI报告,印度准备大幅提升能源存储容量,预计到2032财年将增长12 倍,超60GW左右。这也将超过可再生能源本身
 “ 担忧似乎为时过早。 ”作者 | RichardSaintvilus编译 | 华尔街大事件由于担心自动驾驶汽车可能取消中介服务,Uber ( NYSE: UBER ) 的股价在短短几周内从 202
在上海嘉定叶城路1688号的极越办公楼里,最显眼的位置上,写着一句话:“中国智能汽车史上,必将拥有每个极越人的名字。”本以为这句话是公司的企业愿景,未曾想这原来是命运的嘲弄。毕竟,极越用一种极其荒唐的
亲爱的企业用户和开发者朋友们距离2024 RT-Thread开发者大会正式开幕仅剩最后3天!还没报名的小伙伴,抓紧报名噢,12月21日不见不散!大会时间与地点时间:2024年12月21日 9:30-1