让阿里云AnalyticDB提升30%性能,AMDEPYC9004有什么细节值得关注?

电子工程世界 2024-06-25 07:03

云计算服务正在成为新时代不可或缺的“水电煤”,“上云”无疑成为实施数字化转型升级的必经之路。但随着云技术发展渐深,企业对于快速提升算力和能效的需求也越来越强劲,导致平台面临的能效、成本、灵活性、安全隐私问题愈发突出。

可以说,如果不对现有的数据中心进行转型,可能会付出高昂的代价,导致需要反复改造和投资,并且会因安全问题而威胁供应链的正常运作。

如今,AMD第四代EPYC系列处理器家族已全面发布,其中的EPYC 9004系列处理器(代号Genoa)是通用计算和企业计算的理想之选,已得到业界广泛采用。这其中,就包括阿里云。

综合性能提升30%:进行真正的数据中心转型

阿里云瑶池旗下汇集了云原生关系型数据库PolarDB、云原生数据仓库AnalyticDB、云原生多模数据库Lindorm等多款核心自研产品,其中云原生数仓AnalyticDB for PostgreSQL就被全新的第四代EPYC提升了30%的综合性能,成功实现数据中心转型。

在此过程中,第四代EPYC主要提供了三方面的能力,使得阿里云的全自研计算引擎及行列混合存储实现性能全面升级:

第一,芯片性能大幅提升。EPYC 9004系列是首个使用5nm工艺的企业级CPU产品,支持高达360W的TDP,最多支持96核心,内存通道数提高50%。这一超强核心数量和工艺下,配合全新设计的Zen 4架构,IPC性能相比上代有着14%的提升,在前端、加载/存储、分支预测、执行引擎和缓存方面均有一定加强,整体架构平均延迟有所降低,同时实现了对AVX-512指令集的支持。

第二,计算能效大幅提升。更高的效率意味着更大的灵活性,EPYC 9004系列可以在更少的服务器下来完成同样工作。在相同的核心数下,新一代服务器比搭载双路64核AMD EPYC 9534和双路64核的AMD EPYC 7763的服务器整数性能提升约24%,浮点性提升约52%。据估算,AMD EPYC解决方案使用的服务器数量减少了89%,功率减少了57%,三年内可节省约516,633千瓦时的电力,相当于每年94英亩森林的碳吸收量。

第三,安全性能大幅提升。AMD EPYC处理器内置 AMD Infinity Guard。它是一整套安全功能,可带来芯片级别的安全防护,能够有效应对各种内部和外部安全威胁,确保数据安全无虞,同时对系统性能的影响微乎其微。

经过测试,采用国际标准TPC-H测试集以及在同等运行环境下,AnalyticDB for PostgreSQL采用AMD EPYC服务器较比常规主流服务器平均性能提升32.7%。

可以说,实现这样的成绩,阿里云对数据库内核的优化和强大的处理器加持,二者缺一不可。

EPYC 9004:不只是代号上的变化

对于EPYC Genoa,AMD采用EPYC 9004作为系列的基础代号,或原始命名。这串数字背后代表着什么?

第一位代表产品系列,AMD的前三代产品使用了EPYC 7001、EPYC 7002和EPYC 7003的代号。在第四代EPYC处理器上,AMD改用了EPYC 9004作为产品基础代号,以突出这一代产品的革命性。后面三位则依次代表核心数量、性能、代际。

通过对比,我们可以看到EPYC 9004相比EPYC 7003在核心数、TDP、L3缓存、制造工艺、内存、内存通道数有着全面的提升。

这些提升带动EPYC 9004在性能上全面突破。通过对比搭载96核AMD EPYC 9654 CPU与某客户当前平台的双路服务器,AMD EPYC的计算流体动力学性能提升了2.5倍,浮点吞吐量提升约2.5倍。MULTIJVM性能较前代旗舰提升约90%。此外,96核EPYC 9654处理器的云计算吞吐量是当前客户的双路平台的3倍。

更重要的是,EPYC 9004能够有效帮助客户服务器更新和整合,成为数据中心未来的升级方向。如果当前客户平台的服务器进行比较,在提供500个虚拟机且每个虚拟机分配8GB内存的情况下,预计可以减少81%的服务器数。

这些性能提升的背后,是诸多技术集合所造就的。

从Zen 3到Zen 4:性能翻倍提升

架构,无疑是EPYC 9004最大的变化。而Zen4架构核心升级点主要包括:改进分支预测增大OP指令作缓存、增大指令退役队列、增大整数/浮点寄存器文件、加深核心缓冲吞吐、浮点单元支持AVX-512指令、改进载入/存储单元、增大二级缓存。

分支预测方面,一级缓存BTB(分支目标缓冲)增加到1.5K条目、二级缓存BTB从6.5K增至7K,指令缓存(OpCache)增加至6.75K条目,每时钟周期完成宏指令增加1个。

指令退役队列方面,ROB(重排序缓冲)从256条目增大25%至320条目,整数寄存器从192个增至224个,浮点寄存器从160个增至192个。

载入/存储单元方面,载入队列从72个增大至88个(22%),二级缓存DTLB(数据页表缓冲)从2K条目增加50%至3K条目,同时减少了数据缓存端口的冲突几率。

L2缓存方面,容量翻番来到1MB,同时提升了速度至3k。

AVX-512指令集方面,AMD选择拆分成两个256-bit进行执行,从而节省芯片面积,避免执行AVX512指令时发热过大、频率下降。而在加入AVX-512指令集后,Zen4架构的FP32浮点推理多线程性能提升了1.31倍,VNNIINT8整数推理多线程性能提升了2.47倍。

在种种改进下,Zen4 lPC平均提升了13%,这是在固定4 GHz八核心情况下,通过22个项目对比Zen3得出的几何平均结果。此外,与上一代处理器相比,Zen 4核心的整数性能提高了2.1倍,浮点性能提高了2.2倍。

继续延续Chiplet设计:让EPYC 9004达到96核

AMD在Zen 2架构首次引入了Chiplet(小芯片)设计,并延续至今。AMD EPYC 9004架构,继续采用CCD(Compute)和IOD(IO Die)组合形式进行Chiplet功能拆解,形成完整的SoC。

其中,CCD部分从台积电7nm升级为台积电5nm工艺,IOD部分则从格罗方德12nm升级为台积电6nm。

CCD方面,每个集成8颗Zen 4 CPU核心、32MB L3缓存,也就是说在12 CCD + 1 IOD情况下,合计最多96核心、384MB L3缓存。

IOD方面,则集成了DDR5内存控制器、PCIe 5.0/CXL 1.1+控制器、第三代Infinity Fabric控制器、安全处理器。

内存方面,EPYC 9004系列支持12个DDR5内存通道,单路最大容量6TB(单条512GB)。最高4800MHz频率,峰值理论带宽可达460GB/s。

PCIe方面,EPYC 9004系列可提供128条PCIe 5.0、8条PCIe 3.0通道。

CXL(Compute EXpress Link)方面,协议为CXL.io、CXL.mem,支持内存缓冲,可扩展内存带宽与容量。

安全性:放心地把它放进数据中心

安全性总是数据中心优先考虑的第一要素。相比来说,AMD比竞争对手具有优势的多个核心和SoC级别的安全功能,主要包括两个方面:

第一,AMD Infinity Guard安全功能集。物理和虚拟化威胁会给整个组织带来风险,并进一步蔓延至客户。AMD Infinity安全功能基于Zen 4 CPU 核心的安全加固和专用嵌入式安全处理器之间的协同保护机制,能够帮助维持从开机到运行期间的安全计算环境。

EPYC 9004处理器新增了很多高级功能,如支持256位AES-XTS加密和安全多密钥加密(SMKE),使管理程序能够选择性地加密CXL所连接内存的地址空间范围。这使得现有的软件加密功能可以与CXL连接的内存无缝协同工作。利用不断增长的机密计算生态系统,通过在云计算和虚拟化环境中对正在使用的数据进行加密,重点解决敏感应用程序和数据迁移的特定安全问题。

第二,AMD安全处理器。集成的安全处理器支持机密计算,其功能包括安全信任根、安全内存加密(SME)和安全加密虚拟化(SEV)。它能够仔细检查启动过程,并帮助管理1006个只有安全处理器才知道的唯一加密密钥。将这些技术结合在一起有助于在软件启动、执行和处理关键数据时减少潜在的攻击面。由于AMD EPYC 9004处理器支持更大的物理内存,AMD增加了可加密的页表深度。

总之,EPYC 9004既能让客户满怀信心地进行投资,也能尽快锁定和管理当前一系列新的业务漏洞,保证业务不被安全问题所困扰。

· END ·








电子工程世界 关注EEWORLD电子工程世界,即时参与讨论电子工程世界最火话题,抢先知晓电子工程业界资讯。
评论 (0)
  • 想不到短短几年时间,华为就从“技术封锁”的持久战中突围,成功将“被卡脖子”困境扭转为科技主权的主动争夺战。众所周知,前几年技术霸权国家突然对华为发难,导致芯片供应链被强行掐断,海外市场阵地接连失守,恶意舆论如汹涌潮水,让其瞬间陷入了前所未有的困境。而最近财报显示,华为已经渡过危险期,甚至开始反击。2024年财报数据显示,华为实现全球销售收入8621亿元人民币,净利润626亿元人民币;经营活动现金流为884.17亿元,同比增长26.7%。对比来看,2024年营收同比增长22.42%,2023年为7
    用户1742991715177 2025-05-02 18:40 89浏览
  • 文/郭楚妤编辑/cc孙聪颖‍越来越多的企业开始蚕食动力电池市场,行业“去宁王化”态势逐渐明显。随着这种趋势的加强,打开新的市场对于宁德时代而言至关重要。“我们不希望被定义为电池的制造者,而是希望把自己称作新能源产业的开拓者。”4月21日,在宁德时代举行的“超级科技日”发布会上,宁德时代掌门人曾毓群如是说。随着宁德时代核心新品骁遥双核电池的发布,其搭载的“电电增程”技术也走进业界视野。除此之外,经过近3年试水,宁德时代在换电业务上重资加码。曾毓群认为换电是一个重资产、高投入、长周期的产业,涉及的利
    华尔街科技眼 2025-04-28 21:55 213浏览
  • 在全球制造业加速向数字化、智能化转型的浪潮中,健达智能作为固态照明市场的引领者和智能电子以及声学产品的创新先锋,健达智能敏锐捕捉到行业发展的新机遇与新挑战,传统制造模式已难以满足客户对品质追溯、定制化生产和全球化布局的需求。在此背景下, 健达智能科技股份有限公司(以下简称:健达智能)与盘古信息达成合作,正式启动IMS数字化智能制造工厂项目,标志着健达智能数字化转型升级迈入新阶段。此次项目旨在通过部署盘古信息IMS系统,助力健达实现生产全流程的智能化管控,打造照明行业数字化标杆。行业趋势与企业挑战
    盘古信息IMS 2025-04-30 10:13 53浏览
  • 浪潮之上:智能时代的觉醒    近日参加了一场课题的答辩,这是医疗人工智能揭榜挂帅的国家项目的地区考场,参与者众多,围绕着医疗健康的主题,八仙过海各显神通,百花齐放。   中国大地正在发生着激动人心的场景:深圳前海深港人工智能算力中心高速运转的液冷服务器,武汉马路上自动驾驶出租车穿行的智慧道路,机器人参与北京的马拉松竞赛。从中央到地方,人工智能相关政策和消息如雨后春笋般不断出台,数字中国的建设图景正在智能浪潮中徐徐展开,战略布局如同围棋
    广州铁金刚 2025-04-30 15:24 296浏览
  • 文/Leon编辑/cc孙聪颖‍2023年,厨电行业在相对平稳的市场环境中迎来温和复苏,看似为行业增长积蓄势能。带着对市场向好的预期,2024 年初,老板电器副董事长兼总经理任富佳为企业定下双位数增长目标。然而现实与预期相悖,过去一年,这家老牌厨电企业不仅未能达成业绩目标,曾提出的“三年再造一个老板电器”愿景,也因市场下行压力面临落空风险。作为“企二代”管理者,任富佳在掌舵企业穿越市场周期的过程中,正面临着前所未有的挑战。4月29日,老板电器(002508.SZ)发布了2024年年度报告及2025
    华尔街科技眼 2025-04-30 12:40 312浏览
  • 在智能硬件设备趋向微型化的背景下,语音芯片方案厂商针对小体积设备开发了多款超小型语音芯片方案,其中WTV系列和WT2003H系列凭借其QFN封装设计、高性能与高集成度,成为微型设备语音方案的理想选择。以下从封装特性、功能优势及典型应用场景三个方面进行详细介绍。一、超小体积封装:QFN技术的核心优势WTV系列与WT2003H系列均提供QFN封装(如QFN32,尺寸为4×4mm),这种封装形式具有以下特点:体积紧凑:QFN封装通过减少引脚间距和优化内部结构,显著缩小芯片体积,适用于智能门铃、穿戴设备
    广州唯创电子 2025-04-30 09:02 341浏览
  • 网约车,真的“饱和”了?近日,网约车市场的 “饱和” 话题再度引发热议。多地陆续发布网约车风险预警,提醒从业者谨慎入局,这背后究竟隐藏着怎样的市场现状呢?从数据来看,网约车市场的“过剩”现象已愈发明显。以东莞为例,截至2024年12月底,全市网约车数量超过5.77万辆,考取网约车驾驶员证的人数更是超过13.48万人。随着司机数量的不断攀升,订单量却未能同步增长,导致单车日均接单量和营收双双下降。2024年下半年,东莞网约出租车单车日均订单量约10.5单,而单车日均营收也不容乐
    用户1742991715177 2025-04-29 18:28 303浏览
  • ‌一、高斯计的正确选择‌1、‌明确测量需求‌‌磁场类型‌:区分直流或交流磁场,选择对应仪器(如交流高斯计需支持交变磁场测量)。‌量程范围‌:根据被测磁场强度选择覆盖范围,例如地球磁场(0.3–0.5 G)或工业磁体(数百至数千高斯)。‌精度与分辨率‌:高精度场景(如科研)需选择误差低于1%的仪器,分辨率需匹配微小磁场变化检测需求。2、‌仪器类型选择‌‌手持式‌:便携性强,适合现场快速检测;‌台式‌:精度更高,适用于实验室或工业环境。‌探头类型‌:‌横向/轴向探头‌:根据磁场方向选择,轴向探头适合
    锦正茂科技 2025-05-06 11:36 99浏览
  •  一、‌核心降温原理‌1、‌液氮媒介作用‌液氮恒温器以液氮(沸点约77K/-196℃)为降温媒介,通过液氮蒸发吸收热量的特性实现快速降温。液氮在内部腔体蒸发时形成气-液界面,利用毛细管路将冷媒导入蒸发器,强化热交换效率。2、‌稳态气泡控温‌采用‌稳态气泡原理‌:调节锥形气塞与冷指间隙,控制气-液界面成核沸腾条件,使漏热稳定在设定值。通过控温仪调整加热功率,补偿漏热并维持温度平衡,实现80K-600K范围的快速变温。二、‌温度控制机制‌1、‌动态平衡调节‌控温仪内置模糊控制系统,通过温度
    锦正茂科技 2025-04-30 11:31 45浏览
  • 你是不是也有在公共场合被偷看手机或笔电的经验呢?科技时代下,不少现代人的各式机密数据都在手机、平板或是笔电等可携式的3C产品上处理,若是经常性地需要在公共场合使用,不管是工作上的机密文件,或是重要的个人信息等,民众都有防窃防盗意识,为了避免他人窥探内容,都会选择使用「防窥保护贴片」,以防止数据外泄。现今市面上「防窥保护贴」、「防窥片」、「屏幕防窥膜」等产品就是这种目的下产物 (以下简称防窥片)!防窥片功能与常见问题解析首先,防窥片最主要的功能就是用来防止他人窥视屏幕上的隐私信息,它是利用百叶窗的
    百佳泰测试实验室 2025-04-30 13:28 550浏览
  • 一、gao效冷却与控温机制‌1、‌冷媒流动设计‌采用低压液氮(或液氦)通过毛细管路导入蒸发器,蒸汽喷射至样品腔实现快速冷却,冷却效率高(室温至80K约20分钟,至4.2K约30分钟)。通过控温仪动态调节蒸发器加热功率,结合温度传感器(如PT100铂电阻或Cernox磁场不敏感传感器),实现±0.01K的高精度温度稳定性。2、‌宽温区覆盖与扩展性‌标准温区为80K-325K,通过降压选件可将下限延伸至65K(液氮模式)或4K(液氦模式)。可选配475K高温模块,满足材料在ji端温度下的性能测试需求
    锦正茂科技 2025-04-30 13:08 451浏览
  • 贞光科技代理品牌紫光国芯的车规级LPDDR4内存正成为智能驾驶舱的核心选择。在汽车电子国产化浪潮中,其产品以宽温域稳定工作能力、优异电磁兼容性和超长使用寿命赢得市场认可。紫光国芯不仅确保供应链安全可控,还提供专业本地技术支持。面向未来,紫光国芯正研发LPDDR5车规级产品,将以更高带宽、更低功耗支持汽车智能化发展。随着智能网联汽车的迅猛发展,智能驾驶舱作为人机交互的核心载体,对处理器和存储器的性能与可靠性提出了更高要求。在汽车电子国产化浪潮中,贞光科技代理品牌紫光国芯的车规级LPDDR4内存凭借
    贞光科技 2025-04-28 16:52 341浏览
  • 随着电子元器件的快速发展,导致各种常见的贴片电阻元器件也越来越小,给我们分辨也就变得越来越难,下面就由smt贴片加工厂_安徽英特丽就来告诉大家如何分辨的SMT贴片元器件。先来看看贴片电感和贴片电容的区分:(1)看颜色(黑色)——一般黑色都是贴片电感。贴片电容只有勇于精密设备中的贴片钽电容才是黑色的,其他普通贴片电容基本都不是黑色的。(2)看型号标码——贴片电感以L开头,贴片电容以C开头。从外形是圆形初步判断应为电感,测量两端电阻为零点几欧,则为电感。(3)检测——贴片电感一般阻值小,更没有“充放
    贴片加工小安 2025-04-29 14:59 345浏览
  • 多功能电锅长什么样子,主视图如下图所示。侧视图如下图所示。型号JZ-18A,额定功率600W,额定电压220V,产自潮州市潮安区彩塘镇精致电子配件厂,铭牌如下图所示。有两颗螺丝固定底盖,找到合适的工具,拆开底盖如下图所示。可见和大部分市场的加热锅一样的工作原理,手绘原理图,根据原理图进一步理解和分析。F1为保险,250V/10A,185℃,CPGXLD 250V10A TF185℃ RY 是一款温度保险丝,额定电压是250V,额定电流是10A,动作温度是185℃。CPGXLD是温度保险丝电器元件
    liweicheng 2025-05-05 18:36 100浏览
我要评论
0
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦