AMD正式发布Zen5/5c架构五代EPYC9005:384线程5GHz无敌!4倍性能碾压对手

原创 硬件世界 2024-10-11 02:37

硬件世界10月11日美国旧金山现场报道:

Advancing AI 2024大会上,AMD正式发布了第五代EPYC的第一波产品,EPYC 9005系列,代号Turin。

它基于全新的Zen 5、Zen 5c架构,规格、性能再次双双实现飞跃,即便是Intel正在陆续发布的至强6系列也黯然失色。

一如消费级的锐龙,AMD EPYC这些年处理器在服务器与数据中心也是大杀四方,一代一代稳步向前,性能持续飙升,份额持续攀升,让Intel的至强一直抬不起头来。

实在难以现象,AMD只用了7年的时间,就取得了如此傲人的战绩,在一向最为稳定的服务器和数据中心市场上硬生生撕开了一道口子。

按照第三方市调机构的统计,第一代Naples EPYC 7001系列诞生之时,也就是2017年的时候,AMD在服务器市场上的份额几乎为零。

加上第二代Rome EPYC 7002系列的连续积累,2020年时AMD已经收获了8%的市场,初步站稳了脚跟。

之后,随着第三代Milan EPYC 7003系列的到来,AMD迎来爆发阶段,市场份额在2022年达到了惊人的27%。

第四代EPYC更是达到了空前的高度,市场份额也稳步增加,截止到2024年上半年已经占到34%,也就拿下了三分之一的天下。

部署采纳AMD EPYC的企业也越来越多,遍布各个行业,这里只是列举了其中的一部分,看看你都认识谁?

大家都知道,第四代EPYC扩展出了前所未有的多条产品线,9004/8004/4004三大系列和各种分支(Genoa/Bergamo/Siena),全面覆盖各个市场领域和应用场景。

第五代也必然延续这一趋势,今天的EPYC 9005这是第一波,比如说新一代3D堆叠缓存就在后边等着呢……

好了,接下来,我们就看看最新的EPYC 9005到底有多么强大!

这一次,Zen 5、Zen 5c同时出击,都划分在了EPYC 9005系列之内,在核心数、内存与PCIe连接上有所不同。

首先,制造工艺从5/6nm升级到了最新的3/4nm,晶体管多达1500亿个,因此可以做到更高的集成度,以及更高的频率。

Zen 5部分,CCD从12个增至16个(继续搭配一个IOD),每个CCD内还是8核心,因此总数从96核心192线程增至128核心256线程。

Zen 5c部分,CCD从8个增至12个(也搭配一个IOD),而每个CCD内仍然是16核心,总计就是空前的192核心384线程。

Intel能效核版至强6虽然能在未来通过双芯封装做到288核心,但无法支持超线程技术,因此只有288个线程,大大落后于AMD,再考虑到AMD多线程技术的高效率,192核心384线程领先288核心288线程问题不大。

再说一遍,Zen 5c、Zen 5在架构上是完全一致的,IPC性能、ISA指令集毫无二致,比如都支持完整的AVX-512指令,前者只是三级缓存少一些、频率低一些而已,操作系统和应用软件都不需要特殊适配。

这与Intel性能核、能效核的异构架构完全是两条路。

核心数量大增的同时,EPYC 9005系列的最高频率首次做到了5GHz!相比于四代EPYC的最高值增加了足足900MHz,相当的不可思议。

当然,功耗不可避免地增加了,最高可以达到500W

内存方面,最高还是12个通道、单路6TB容量,不过频率从DDR5-4800提高到了DDR5-6400。

这一代新引入了“动态封装后修复”(PPR),适用于x8/x4 ECC RDIMM,具体情况暂未公布,猜测可以及时修复内存物理错误甚至缺陷,大幅提升稳定性。

I/O平台连接方面,PCIe 5.0通道最多还是160条,新增了PCIe链接加密功能,并且从CXL 1.1+升级到CXL 2.0。

安全性方面,新增可信赖I/O(Trusted I/O),以及美国国家标准与技术研究院(NIST)制定的美国联邦密码模块安全标准FIPS 140-3。

哦对了,EPYC 9005系列依然采用SP5封装接口,无缝兼容EPYC 9004系列,Intel至强6则更换了LGA4710、LGA7529两种新接口。

EPYC 9005全系型号、规格、价格一览,一共有多达27款,包括22款Zen 5、5款Zen 5c,编号混在一起,确实不太容易区分。

Zen 5c的覆盖96/128/144/160/192核心,每种一款,其中后三种是Zen 5c独享的。

旗舰型号EPYC 9965,192核心384线程,384MB三级缓存,主频2.25-3.7GHz,热设计功耗500W,价格达14813美元,约合人民币10.48万元。

其他四款不再一一介绍,加速频率都是3.7GHz,三级缓存都是384MB,功耗320-400W。

作为对比,Zen 4c架构的128核心EPYC 97x4系列最高频率才3.1GHz,三级缓存才256MB,当然功耗也低一些340-360W。

Zen 5的覆盖8/16/24/32/36/48/64/72/96/128核心,其中72核心及以下只有Zen 5,96/128核心则是都有。

旗舰型号EPYC 9755,128核心256线程,512MB三级缓存,主频2.7-4.1GHz,热设计功耗500W,价格12984美元,约合人民币9.19万元。

而现有的对应96核心旗舰EPYC 9654最高频率才3.7GHz,三级缓存384MB,功耗360W。

顺带一说,同样128核心的至强6980P价格高达17800美元,约合人民币12.60万元。

可以跑到5GHz加速频率的有两款:

一是64核心的EPYC 9575F,基准频率3.3GHz,三级缓存256MB,功耗400W;

二是16核心的EPYC 9175F,基准频率4.2GHz,三级缓存则是旗舰之外唯二的512MB,功耗320W。

其他所有型号的加速频率,也都在4GHz之上,确切地说都不低于4.1GHz。

性能方面,AMD宣称EPYC 9005系列在企业、云应用中的IPC提升最高为17%,而在HPC、AI应用中的IPC提升最高更是达到惊人的37%!

当然,具体情况在AI应用中取决于特定场景的优化加速,很容易获得更大幅度的提升。

接下来是官方性能对比,我们快速过一下。

192核心EPYC 9965对比128核心EPYC 9754在行业标准的SPEC CPU 2017整数性能对比中提升约60%,更是Intel 64核心五代至强8592+的足足2.7倍。

是的,没有对比最新的至强6,因为后者刚刚发布,还没有实际部署,也缺乏测试数据。

同样的32核心,EPYC 9355对比EPYC 9354提升了将近30%。

当然最高频率也从3.8GHz提高到4.4GHz,这部分理论上可以贡献15%左右的提升幅度,另外至少一半来自架构改进。

对比五代至强6548Y+,则有40%的领先优势。

再换个角度,同样的核心数与成本下,EPYC 9575F代际提升约15%,对比竞品领先60%。

在不同的企业应用、HPC、AI等负载中,包括视频转码、图像渲染、商业程序、数据库、FEA(有限元分析)模拟、CFD(计算流体力学)模拟与建模、开源高性能计算、机器学习、端到端AI、相似性搜索、大语言模型等等,EPYC 9965都能做到遥遥领先。

它不但对比上代有着质的飞跃,对比竞品64核心的至强8592+更是全程碾压,性能优势最高达4倍之多。

对于旧平台更新换代,EPYC 9005系列更是上佳之选,比如从非常流行但老旧的二代至强铂金8280升级到EPYC 9665,只需131台服务器就能达到原来1000台的性能水平,节省87%的占地空间。

同时,功耗可以节省最多68%,三年TCO成本节省最多67%,非常划算。

CPU处理器搭配GPU加速器组成超高性能的AI计算系统,也是当下的潮流。

AMD 推荐使用64核心的EPYC 9575F/9554、96核心的EPYC 9655,搭配自家的MI300X、MI325X(刚发布),都支持单路八卡。

性能上,EPYC 9575F对比至强8592+,训练性能可领先20%,推理性能可领先8%,1000节点集群每秒可以多处理70万个Token。

当然,大量的NVIDIA GPU计算集群都搭配着EPYC处理器,AMD也做了不同规模的最佳皮牌型号的推荐。

还是EPYC 9575F对比至强8592+,训练性能可领先15%,推理性能可领先20%,还可以多处理20%的请求,并节省15%的时间。

这就是新一代EPYC 9005系列,依然是世界上最佳的云服务、企业、HPC、AI处理器,拥有更先进的工艺、更多的核心、更高的频率、更大的三级缓存、更高的性能、更高的性价比、无缝的兼容性。

Intel全新的至强6,此时也只能默默地叹息一声:既生瑜,何生亮。

接下来,我们更加期待第五代EPYC在更多的行业生根发芽、落地开花。


硬件世界 共同研究探讨硬件知识及相关信息
评论
  • You are correct that the length of the via affects its inductance. Not only the length of the via, but also the shape and proximity of the return-current path determines the inductance.   For example, let's work with a four-layer board h
    tao180539_524066311 2024-12-18 15:56 127浏览
  • By Toradex秦海1). 简介为了保证基于 IEEE 802.3 协议设计的以太网设备接口可以互相兼容互联互通,需要进行 Ethernet Compliance 一致性测试,相关的技术原理说明请参考如下文章,本文就不赘述,主要展示基于 NXP i.MX8M Mini ARM 处理器平台进行 1000M/100M/10M 以太网端口进行一致性测试的测试流程。https://www.toradex.com
    hai.qin_651820742 2024-12-19 15:20 127浏览
  • //```c #include "..\..\comm\AI8051U.h"  // 包含头文件,定义了硬件寄存器和常量 #include "stdio.h"              // 标准输入输出库 #include "intrins.h"         &n
    丙丁先生 2024-12-20 10:18 70浏览
  • 沉寂已久的无人出租车赛道,在2024年突然升温了。前脚百度旗下萝卜快跑,宣布无人驾驶单量突破800万单;后脚特斯拉就于北京时间10月11日上午,召开了以“We,Robot”为主题的发布会,公布了无人驾驶车型Cybercab和Robovan,就连低调了好几个月的滴滴也在悄悄扩编,大手笔加码Robotaxi。不止是滴滴、百度、特斯拉,作为Robotaxi的重磅选手,文远知行与小马智行,也分别在10月份先后启动美股IPO,极氪也在近日宣布,其与Waymo合作开发的无人驾驶出行汽车将大规模量产交付,无人
    刘旷 2024-12-19 11:39 135浏览
  • ​本文介绍PC电脑端运行VMware环境下,同时烧录固件检测不到设备的解决方法。触觉智能Purple Pi OH鸿蒙开发板演示,搭载了瑞芯微RK3566芯片,类树莓派设计,Laval官方社区主荐,已适配全新OpenHarmony5.0 Release系统!PC端烧录固件时提示没有发现设备按照各型号烧录手册中进入loader模式的操作方法,让开发板连接到PC端。正常来说开发板烧录时会显示“发现一个LOADER设备”,异常情况下,会提示“没有发现设备”,如下图所示: 解决步骤当在烧录系统固
    Industio_触觉智能 2024-12-18 18:07 79浏览
  •         在上文中,我们介绍了IEEE 802.3cz[1]协议提出背景,旨在定义一套光纤以太网在车载领域的应用标准,并介绍了XMII以及PCS子层的相关机制,在本篇中,将围绕IEEE 802.3cz-MultiGBASE-AU物理层的两个可选功能进行介绍。EEE功能        节能以太网(Energy-Efficient Ethernet)是用于在网络空闲时降低设备功耗的功能,在802.3cz的定义中,链
    经纬恒润 2024-12-19 18:47 73浏览
  • 耳机虽看似一个简单的设备,但不仅只是听音乐功能,它已经成为日常生活和专业领域中不可或缺的一部分。从个人娱乐到专业录音,再到公共和私人通讯,耳机的使用无处不在。使用高质量的耳机不仅可以提供优良的声音体验,还能在长时间使用中保护使用者听力健康。耳机产品的质量,除了验证产品是否符合法规标准,也能透过全面性的测试和认证过程,确保耳机在各方面:从音质到耐用性,再到用户舒适度,都能达到或超越行业标准。这不仅保护了消费者的投资,也提升了该公司在整个行业的产品质量和信誉!客户面临到的各种困难一家耳机制造商想要透
    百佳泰测试实验室 2024-12-20 10:37 122浏览
  • 汽车驾驶员监控系统又称DMS,是一种集中在车辆中的技术,用于实时跟踪和评估驾驶员状态及驾驶行为。随着汽车产业智能化转型,整合AI技术的DMS逐渐成为主流,AI模型通过大量数据进行持续训练,使得驾驶监控更加高效和精准。 驾驶员监测系统主要通过传感器、摄像头收集驾驶员的面部图像,定位头部姿势、人脸特征及行为特征,并通过各种异常驾驶行为检测模型运算来识别驾驶员的当前状态。如果出现任何异常驾驶行为(如疲劳,分心,抽烟,接打电话,无安全带等),将发出声音及视觉警报。此外,驾驶员的行为数据会被记录
    启扬ARM嵌入式 2024-12-20 09:14 69浏览
  •         不卖关子先说感受,真本书真是相见恨晚啊。字面意思,见到太晚了,我刚毕业或者刚做电子行业就应该接触到这本书的。我自己跌跌撞撞那么多年走了多少弯路,掉过多少坑,都是血泪史啊,要是提前能看到这本书很多弯路很多坑都是可以避免的,可惜这本书是今年出的,羡慕现在的年轻人能有这么丰富完善的资料可以学习,想当年我纯靠百度和论坛搜索、求助啊,连个正经师傅都没有,从软件安装到一步一布操作纯靠自己瞎摸索,然后就是搜索各种教程视频,说出来都是泪啊。  &
    DrouSherry 2024-12-19 20:00 75浏览
  • 由于该文反应热烈,受到了众多工程师的关注,衷心感谢广大优秀工程师同仁的建言献策。特针对该技术点更新一版相关内容! 再次感谢大家的宝贵建议!填充铜(Solid Copper)和网格铜(Hatched Copper)是PCB设计中两种不同的铺铜方式,它们在电气性能、热管理、加工工艺和成本方面存在一些区别:1. 电气性能:填充铜:提供连续的导电层,具有极低的电阻和最小的电压降。适合大电流应用,并能提供优秀的电磁屏蔽效果,显著提高电磁兼容性。网格铜:由于铜线之间存在间隔,电阻相对较高,电压降也
    为昕科技 2024-12-18 17:11 127浏览
  • 随着工业自动化和智能化的发展,电机控制系统正向更高精度、更快响应和更高稳定性的方向发展。高速光耦作为一种电气隔离与信号传输的核心器件,在现代电机控制中扮演着至关重要的角色。本文将详细介绍高速光耦在电机控制中的应用优势及其在实际工控系统中的重要性。高速光耦的基本原理及优势高速光耦是一种光电耦合器件,通过光信号传递电信号,实现输入输出端的电气隔离。这种隔离可以有效保护电路免受高压、电流浪涌等干扰。相比传统的光耦,高速光耦具备更快的响应速度,通常可以达到几百纳秒到几微秒级别的传输延迟。电气隔离:高速光
    晶台光耦 2024-12-20 10:18 112浏览
  • 百佳泰特为您整理2024年12月各大Logo的最新规格信息。——————————USB▶ 百佳泰获授权进行 USB Active Cable 认证。▶ 所有符合 USB PD 3.2 标准的产品都有资格获得USB-IF 认证——————————Bluetooth®▶ Remote UPF Testing针对所有低功耗音频(LE Audio)和网格(Mesh)规范的远程互操作性测试已开放,蓝牙会员可使用该测试,这是随时测试产品的又一绝佳途径。——————————PCI Express▶ 2025年
    百佳泰测试实验室 2024-12-20 10:33 81浏览
  • 在强调可移植性(portable)的年代,人称「二合一笔电」的平板笔电便成为许多消费者趋之若鹜的3C产品。说到平板笔电,不论是其双向连接设计,面板与键盘底座可分离的独特功能,再加上兼具笔电模式、平板模式、翻转模式及帐篷模式等多种使用方式,让使用者在不同的使用情境下都能随意调整,轻巧灵活的便利性也为多数消费者提供了绝佳的使用体验。然而也正是这样的独特设计,潜藏着传统笔电供货商在产品设计上容易忽视的潜在风险。平板笔电Surface Pro 7+ 的各种使用模式。图片出处:Microsoft Comm
    百佳泰测试实验室 2024-12-19 17:40 157浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦