3月15日晚间,AMD全新的Zen3架构终于正式进入数据中心、服务器领域,这就是——第三代EPYC(霄龙)7003系列,代号“Milan”(米兰)。
经过第一代AMD EPYC 7001系列(Naples)、第二代 AMD EPYC 7002系列(Rome)两代产品三年多的耕耘,AMD在服务器市场已经取得不小的突破。
权威市调机构Mercury Research数据显示,2020年第四季度,AMD EPYC的市场份额已经达到了7.1%,同比增加2.6个百分点。
第三代EPYC 7003系列采用和锐龙5000系列同款的Zen3架构,IPC(每时钟周期指令数)对比Zen2提升19%,而在特定企业级负载、云端负载、HPC高性能计算负载中,更是都可以带来最多大约2倍的性能提升。
AMD服务器业务部门高级副总裁兼总经理丹·麦克纳马拉(Dan McNamara)表示,如果公司继续将客户反馈整合到新一代芯片中,就能保住领先地位。
Zen3架构的设计细节,这里不再赘述,详情可以参考我们此前的深度解析。
不过针对数据中心市场,Zen3架构还有一些特定的变化,比如说ISA指令集,就新增了多达7条。
加速、加密、解密算法部分扩展了AVX2指令,可以支持到256位。
安全部分是改进最大的,比如SEV(安全加密虚拟化)可以限制中断的注入,防止恶意管理程序注入SEV-ES访客中断/异常类型;
比如SNP(安全嵌套分页),在现有SEV-ES对虚机内存、寄存器加密保护的基础上,增加系统完整性保护,防止恶意管理程序通过重放、损坏、重新映射做攻击;
比如CET Shadow Stack(影子堆栈),可以防止ROP编程攻击。
EPYC 7001系列上市的时候,正好碰上幽灵、熔断安全漏洞爆发,AMD产品虽然受影响较小,但AMD仍然以为当时的解决方案相对比较仓促,不够完美。
在最新的EPYC 7003系列上,AMD已经在架构上最好了强防御,同时对性能的影响也降到了最低。
这是EPYC 7003系列的内核布局图、特性亮点。
EPYC 7003系列除了升级架构,基本延续了上一代的整体设计和布局,还是内部集成最多八个CPU Die、一个IO Die,仍然最多64核心128线程、256MB三级缓存,但是在细节特性上仍有很多变化。
内存方面,还是支持DDR4-3200,单路最大容量4TB,但是在四通道、八通道之外,新增加了六通道模式,稍后细说。
IO方面,每颗处理器还是128条PCIe 4.0通道,但是在双路系统中,对外除了128条通道之外,还增加了162条可选,也就是将双路彼此互连的通道数降为94条,依然不影响性能。
这些对外的PCIe通道可以灵活配置,用于PCIe、SATA、一致性互连等,最多支持32个SATA/NVMe存储设备。
三级缓存的变化是Zen3架构的一大突出亮点。Zen2、Zen3上每一个CPU Die都是32MB三级缓存,但是前者是分离的两部分,各自16MB,都只能由一半4个核心共享。
Zen3上则是32MB一体化,八个核心都可以访问全部容量,等于每个核心可用的三级缓存容量直接翻了一番,有利于加速核心、缓存之间的通信,有效降低内存延迟。
三级缓存容量更大了之后,配置也更加灵活。Zen2架构上,每四个核心共享的16MB三级缓存,可以配置8MB存放所有核心共享的数据,另外8MB存放每个核心自己的数据。
Zen3上所有核心共享数据还是8MB的话,每个核心可以私用的容量最大就是24MB,可以轻松缓存更多数据和指令,进而提高命中率、提高性能。
内存方面,刚才也提到了,这次支持三种通道模式,其中八通道是最完整的,可以对称插入8条或16条内存。
六通道、四通道的话,自然分别是6条、12条或者4条、8条,不过注意对插槽安装顺序有一定要求,而且这时候是处于交叉存取(interleaving)的交织状态,也就是奇数地址、偶数地址分开,不影响连续字节刷新,便于加快内存访问速度。
四通道模式是针对成本优化,适合内存需求不高的客户。六通道则提供了更灵活的选择,兼顾成本、性能,适合四通道不够用、八通道太浪费的场景。
接下来说说具体型号。EPYC 7003系列共有包括19款不同型号,包括15款双路型、4款单路型,按照核心数量划分有八种,包括8/16/24/28/32/48/56/64核心。
旗舰型号是EPYC 7763,64核心128线程,频率2.45-3.50GHz,热设计功耗280W。
另一款64核心是EPYC 7713(EPYC 7713P),频率2.0-3.675GHz,热设计功耗225W。
频率最高的是EPYC 72F3,也是唯一的8核心,基准就有3.7GHz,最高加速可达4.1GHz,热设计功耗180W。
EPYC 7003系列延续了AMD的一贯传统,所有技术特性在所有型号上一视同仁,没有缩水,包括八通道DDR4-3200、最大4TB内存、128条PCIe 4.0、多线程与自动加速、18G Infinity Fabric互连总线、SME安全内存加密、SEV安全虚拟化加密、Fabric总线与内存频率同步等等。
EPYC 7003家族型号可以分为三种类别,客户可根据需求灵活选择。
一是强调核心性能的,频率更高,每核心缓存容量也更大,编号上第三位都是字母“F”,共四款。
二是突出核心数量的,包括48/56/64核心,共五款。
三是注重各方面均衡与优化的,兼顾性能、成本,共十款。
再看性能表现,这次很直观地列出了各款型号的相对性能比例,包括上代型号,还加上了和部分竞品的对比。
HPC高性能计算负载,64核心旗舰EPYC 7763,对比上代64核心EPYC 7H12领先17%,对比竞品28核心的至强金牌6258R则是遥遥领先106%,就是欺负对手核心少。
云计算负载,EPYC 7763对比EPYC 7H12提升了14%,对比至强金牌6258R则是再次领先106%。
企业级负载,EPYC 7763对比EPYC 7H12提升了21%,而对比对手顶级的28核心至强铂金8280,则是轻松取胜117%。
即便是只拿出一半实力的32核心型号EPYC 75F3,AMD依然优势尽显,对比上代32核心EPYC 7532提升了21%,而对比28核心的至强金牌6258R,则是大幅领先70%。
凭借更多核心,EPYC 7003可以大大提高部署密度,在同样的性能下节省成本、空间、能耗。
比如构建25000单元的整数性能,至强金牌6258R的话需要63台服务器、4个机架,EPYC 7763则只需要32台服务器、3个机架,节省49%的服务器数量、25%的机柜空间、35%的功耗、35%的TCO成本(4年周期)。
在数据中心和服务器领域,只有产品是不够的,更需要强大生态的支持。EPYC 经过三年的耕耘,已经赢得了行业的普遍认可,平台厂商、云服务厂商、软硬件方案厂商都十分丰富。
平台方面(主板/服务器等),可以看到源讯(Atos)、华擎、华硕、思科、戴尔、富士康、技嘉、新华三、慧与(HPE)、英业达、联想、神达(Mitac)、微星、云达(QCT)、超威、泰安、纬颖(Wiwynn)、纬创。
云服务方面,可以看到亚马逊AWS、阿里云、微软Azure、Google云、IBM云、甲骨文云、腾讯云。
其中,微软首席技术官Mark Russinovich特别赞扬了与AMD达成的新合作,宣称双方关系的进一步扩展,能够为Azure客户带来切实可用的机密计算选项。
更重要的是,微软也是首家提供基于AMD新一代EPYC 7003系列服务器处理器 + 可信赖计算(Confidential Computing)的大型云服务提供商。
最后是价格,对比上代有不同程度的上涨,但是在数据中心,这个价格依然很良心。
比如,旗舰64核心EPYC 7763 7890美元(千颗批发价下同),比上代EPYC 7742高了13.5%——28核心的至强金牌8280可是要超过1万美元。
官方图:
EPYC 75F3实拍图:
仅仅一天之后,3月16日晚间,AMD Zen3家族又正式迎来了新成员——锐龙PRO 5000U系列,面向商务型轻薄笔记本。
基本上,它可以视为此前发布的锐龙5000 U系列的商务版,增加了更多安全、管理特性,更适合企业办公环境。
企业商务领域是一个非常庞大的市场,尤其是商务笔记本,受疫情远程办公等各种因素刺激,增势喜人,2018年全球规模还只有2100万台,2020年达到了4700万台,份额也从6.3%一路猛增至16.2%,2021年更是预计可达6300万台。
AMD这几年在商务市场上也是默默耕耘布局,收获颇多,形成了完整的产品线,针对笔记本、桌面有锐龙PRO系列,对ChromeBook有锐龙、速龙两大系列,针对工作站则有线程撕裂者PRO系列。
最新的锐龙PRO 5000系列同样基于7nm工艺和全新的Zen3架构,拥有领先的性能、能效、安全性、管理性,号称世界上最好的商用移动处理器。
AMD这次提供了三款型号,分别是锐龙7 PRO 5850U、锐龙5 PRO 5650U、锐龙3 PRO 5450U。
它们在硬件规格上分别复刻了锐龙7 5800U、锐龙5 5600U、锐龙3 5400U,最多8核心16线程,最高频率4.4GHz,最多20MB二级/三级缓存,最高集成8核心的AMD Radeon Graphics,热设计功耗均为15W,可由OEM灵活配置最高25W、最低10W。
至于消费级的锐龙7 5700U、锐龙5 5500U、锐龙3 5300U,它们其实都是Zen2架构,这次没有对应的PRO版本。
性能方面,以旗舰型的锐龙7 PRO 5850U为例,AMD宣称对比Intel Tiger Lake 11代酷睿最高端的i7-1185G7,CineBench R20单线程性能虽然弱了3%,但是凭借多一倍的核心线程数,CineBench R20、PCMark 10、GeekBench v5等多线程测试项目,可以领先少则48%,多则65%,碾压一般的存在。
而且不要忘了,i7-1185G7的热设计功耗可是28W,高了几乎一倍,因此换算下来,即便是在单核能效方面,锐龙也是遥遥领先。
办公性能上,锐龙7 PRO 5850U也可以领先最多23%,最差也能持平。
甚至,AMD即便派出低一档的锐龙5 PRO 5650U来对比i7-1185G7,凭借多一半的核心,多线程性能继续秒杀,办公性能也依然领先。
对于商务办公场景来说,多人会议、多任务是再常见不过的,尤其是疫情期间。AMD也展示了锐龙7 PRO 5850U同时应对49人Zoom视频会议、PCMark 10办公测试,结果依然比i7-1185G7快了最多10%。
续航方面,锐龙PRO 5000系列虽然工艺没变,但是凭借全新的架构,MobileMark测试显示可以做到长达17.5小时的续航,可保证全天办公需求,对比上代增加了2个小时,对比上上代更是翻天覆地的变化。
当然,对于商用产品,性能只是其一,安全性也十分关键。除了前代的各种安全技术完全继承下来,锐龙PRO 5000系列还增加了三项新功能:
一是AMD Shadow Stack(影子堆栈),基于硬件层面的安全防护,可以直接抵御恶意软件攻击。
二是Secured Core PC(安全核心PC),与微软和OEM厂商紧密合作、深度集成,确保Windows PC的安全。
三是FIPS,美国联邦政府认证的安全加密标准,是保护隐私的最佳途径之一。
管理性方面,锐龙PRO 5000为IT经理人、管理员提供了一系列工具和能力,可以在现有基础架构中无缝接入新平台,并支持微软EndPoint Manager,当然也继续提供18个月的镜像软件支持、24个月的企业供货周期及质量保障。
产品方面,4月起陆续上市,首批将会有惠普的EliteBook 845 G8、ProBook Aero 635 G2、ProBook x360 435 G8,联想的ThinkPad T14s、ThinkBook 16P、ThinkBook 14s,等等。
其中,惠普ProBook系列、联想ThinkBook 16P等还是AMD专属平台,只有锐龙才可以享受。
后续,还会有更多厂商、机型加入。
当然,大家可能会问了,在这个如今芯片奇缺的年代,新品这么多,能买到吗?买不到再好有什么用?
由于全球半导体产能紧张,台积电做为第一大晶圆代工厂,现在成为各家争抢的对象,因为后者的产能分配将影响下游客户的营收表现。
据报道,台积电日前完成了Q2季度的产能分配,投片产能有三大优先方向,分别是5G、HPC高性能计算及车用电子芯片。
由于涉及商业秘密,台积电不会公布每家公司具体的订单量,但我们可以从相关线索来分析下。
首先,做为超级VIP客户,苹果的7nm、5nm先进工艺产能绝对是第一个确保的,2020年苹果就贡献了25%的营收,一家独大。
去年华为位列台积电营收第二,但从去年9月份之后就无法代工了,Q2季度的产能分配也不会有华为的份了,所以5G芯片还会照顾其他厂商。
考虑到高通的骁龙888转向三星5nm代工,所以联发科被认为是这次产能分配的最大赢家之一,7nm、6nm及未来的5nm天玑芯片的供应量会继续增加。
在HPC芯片上,NVIDIA也转向了三星代工,台积电应该会优先照顾AMD这样的客户,现在锐龙5000、RX 6000的7nm需求居高不下,此前有消息称AMD今年将取代苹果成为7nm最大客户。
5G、HPC芯片都需要先进工艺,而车用电子芯片则偏向成熟工艺,这些产能主要确保全球汽车厂商的芯片供应,虽然单个芯片的利润不如前面的先进芯片,但是总需求量大,台积电也会优先照顾。