128核心504MB缓存!7年了Intel终于第一次追上AMD

原创 硬件世界 2024-09-25 22:40

今年6月初,Intel正式发布了新一代至强6家族的第一批成员,首次采用E能效核架构的至强6700E系列(Sierra Forest),针对高密度计算场景而优化性能,最多144核心144线程。

现在,Intel带来了新一波的至强6,P性能核设计的至强6900P系列(Granite Ridge),面向高性能计算、高强度AI负载场景。

根据路线图,明年第一季度我们还将看到至强6900E(288核心288线程)、6500P、6300P以及至强6 SoC等更多产品。

至强6性能核也采用了分离式模块化设计,包括Intel 3工艺的计算模块、Intel 7工艺的输入输出模块,通过EMIB封装技术整合在一起。

计算模块又分为三种不同版本:顶级的XCC是两个计算模块,最多86核心;中间的HCC是一个计算模块,最多48核心;然后LCC是一个较小的计算模块,最多16核心。

至强6性能核,也就是至强6900P系列,拥有最多128核心256线程,终于追上了AMD EPYC的水平,后者采用Zen4c架构的Bergamo EPYC 97x4系列也是最多128核心256线程。

事实上,按照XCC、HCC的规模合计,它其实最多做到了132个物理核心,但应该是出于良品率考虑,没有全部开启。

当然,Zen4c也算是一种能效核,但是AMD下个月就会发布Zen5架构的第五代EPYC,留给Intel的时间只有这么几天……

三级缓存骤然增大到了最多504MB,平均每核心接近4MB,对比五代至强最多320MB增加了接近60%,同时也超过了AMD四代EPYC标准版的384MB,但是相比AMD 3D缓存版的768MB乃至是1152MB,还有很大差距。

内存统一支持12个通道也追平了AMD,而且频率更高达到DDR5 6400MHz,对比五代至强增加了4个通道,频率也提升了800MHz,但是单路内存总容量从4TB将至3TB。

它还首次支持新的MRDIMM(多重存取双列直插式内存模组),最高频率达8800MHz。

这种内存将两个DDR5 DIMM内存条合而为一,从而提供双倍的数据传输率(8800MHz其实就是两个4400MHz组合而来的),而且可以同时访问两个Rank。

还支持96条PCIe 5.0/CXL 2.0通道、6条QPI 2.0总线(24GT/s),继续内置AMX、DSA、IAA、QAT、DLB等加速器。

封装接口是新的LGA7529,比五代至强的LGA4677增加了足足60%的针脚。

功耗不可避免地有所增加,热设计功耗最高达500W,而上代最高只有380W,AMD EPYC目前最高也不过400W。

具体型号共有五款,分别如下:

至强6980P:128核心256线程,三级缓存504MB,基准频率2.0GHz,全核频率3.2GHz,加速频率3.9GHz,热设计功耗500W

至强6979P:120核心240线程,三级缓存504MB,基准频率2.1GHz,全核频率3.2GHz,加速频率3.9GHz,热设计功耗500W

至强6972P:96核心192线程,三级缓存480MB,基准频率2.4GHz,全核频率3.5GHz,加速频率3.9GHz,热设计功耗500W

至强6952P:96核心192线程,三级缓存480MB,基准频率2.1GHz,全核频率3.2GHz,加速频率3.9GHz,热设计功耗480W

至强6960P:72核心144线程,三级缓存432MB,基准频率2.7GHz,全核频率3.8GHz,加速频率3.9GHz,热设计功耗500W

性能方面,Intel官方的说法是,至强6900P系列AI推理性能提升最多3倍(对比竞品领先5.5倍),HPC性能提升最多2.5倍,MsQSL数据库性能提升最多2.1倍。

同时,至强6900P系列能效更高,40%典型服务器利用率时,能效比是上代的2倍。

至强6性能核针对AI负载做了全方位的针对性设计,比如最多12个内存通道,对比四代至强带宽提升最高达2.8倍,同时引入了新的MCR DIMM内存形态,带宽再次增加30-40%,从而可以从容运行对内存敏感的超大规模LLM模型。

比如内置AMX、QAT、AVX-512等加速器,配合oneAPI跨平台标准编程模型,AI推理训练负载的性能可提升多达2-3倍。

比如多达128个内核,结合AVX-512技术,可以更好地满足计算密集型AI与科学融合负载的性能,提升幅度最高达2.9倍。

而对于功耗、能效有特别要求的应用场景,至强6能效核则是完美之选,简单地说就是性能更好、功耗更低。

举例来说,144核心的至强6780E对比64核心五代至强铂金8592+,性能提升了多达18%,但是热设计功耗从350W降低到了330W。

同时,至强6能效核的功耗随负载强度呈基本线性增加,尤其是当负载率在40-60%的时候,能够节省多达280W的功耗,综合能效提升了2.4倍。

这意味着什么?

以往需要200个机架才能达成的算力性能,如今只需66个,节省了超过2/3的空间,而且在4年的使用周期内可节省8万兆瓦的能耗,相当于二氧化碳减排3.4万吨。

总之,英特尔通过“两条腿走路”的至强6性能核、能效核产品路线图,再次彰显了它对于AI的坚定承诺和深入布局:

围绕CPU处理器这一通用平台,打造结合开放、统一的软硬件平台,并针对不同应用场景和需求优化设计,满足千行百业的广泛需求。

当然,很多人说起AI,往往会首先想到GPU加速器,诚然其性能强劲,但随之而来的是无法控制的极高功耗、极高价格,一般企业难以承受,而且缺乏足够的通用性与灵活性,而这正是CPU处理器的强项,也正是英特尔坚定推进的。

至强6改变了以往的传统处理器设计理念,在AI的浪潮下快速转身,分为性能核、能效核,各取所长,针对性地满足不同AI应用负载与场景,更加凸显了CPU的灵活性。

与此同时,英特尔也并非只抱着CPU处理器不放,XPU战略的远景就是打造多硬件、一体化、开放灵活的硬件算力平台,再加上丰富、弹性的软件开发平台,以及广泛、深入的行业合作,为各行各业提供强大、丰富的解决方案,让AI真正无处不在。


硬件世界 共同研究探讨硬件知识及相关信息
评论
  • By Toradex秦海1). 简介为了保证基于 IEEE 802.3 协议设计的以太网设备接口可以互相兼容互联互通,需要进行 Ethernet Compliance 一致性测试,相关的技术原理说明请参考如下文章,本文就不赘述,主要展示基于 NXP i.MX8M Mini ARM 处理器平台进行 1000M/100M/10M 以太网端口进行一致性测试的测试流程。https://www.toradex.com
    hai.qin_651820742 2024-12-19 15:20 127浏览
  • ​本文介绍PC电脑端运行VMware环境下,同时烧录固件检测不到设备的解决方法。触觉智能Purple Pi OH鸿蒙开发板演示,搭载了瑞芯微RK3566芯片,类树莓派设计,Laval官方社区主荐,已适配全新OpenHarmony5.0 Release系统!PC端烧录固件时提示没有发现设备按照各型号烧录手册中进入loader模式的操作方法,让开发板连接到PC端。正常来说开发板烧录时会显示“发现一个LOADER设备”,异常情况下,会提示“没有发现设备”,如下图所示: 解决步骤当在烧录系统固
    Industio_触觉智能 2024-12-18 18:07 79浏览
  • 由于该文反应热烈,受到了众多工程师的关注,衷心感谢广大优秀工程师同仁的建言献策。特针对该技术点更新一版相关内容! 再次感谢大家的宝贵建议!填充铜(Solid Copper)和网格铜(Hatched Copper)是PCB设计中两种不同的铺铜方式,它们在电气性能、热管理、加工工艺和成本方面存在一些区别:1. 电气性能:填充铜:提供连续的导电层,具有极低的电阻和最小的电压降。适合大电流应用,并能提供优秀的电磁屏蔽效果,显著提高电磁兼容性。网格铜:由于铜线之间存在间隔,电阻相对较高,电压降也
    为昕科技 2024-12-18 17:11 127浏览
  • 耳机虽看似一个简单的设备,但不仅只是听音乐功能,它已经成为日常生活和专业领域中不可或缺的一部分。从个人娱乐到专业录音,再到公共和私人通讯,耳机的使用无处不在。使用高质量的耳机不仅可以提供优良的声音体验,还能在长时间使用中保护使用者听力健康。耳机产品的质量,除了验证产品是否符合法规标准,也能透过全面性的测试和认证过程,确保耳机在各方面:从音质到耐用性,再到用户舒适度,都能达到或超越行业标准。这不仅保护了消费者的投资,也提升了该公司在整个行业的产品质量和信誉!客户面临到的各种困难一家耳机制造商想要透
    百佳泰测试实验室 2024-12-20 10:37 125浏览
  • You are correct that the length of the via affects its inductance. Not only the length of the via, but also the shape and proximity of the return-current path determines the inductance.   For example, let's work with a four-layer board h
    tao180539_524066311 2024-12-18 15:56 127浏览
  •         在上文中,我们介绍了IEEE 802.3cz[1]协议提出背景,旨在定义一套光纤以太网在车载领域的应用标准,并介绍了XMII以及PCS子层的相关机制,在本篇中,将围绕IEEE 802.3cz-MultiGBASE-AU物理层的两个可选功能进行介绍。EEE功能        节能以太网(Energy-Efficient Ethernet)是用于在网络空闲时降低设备功耗的功能,在802.3cz的定义中,链
    经纬恒润 2024-12-19 18:47 73浏览
  •         不卖关子先说感受,真本书真是相见恨晚啊。字面意思,见到太晚了,我刚毕业或者刚做电子行业就应该接触到这本书的。我自己跌跌撞撞那么多年走了多少弯路,掉过多少坑,都是血泪史啊,要是提前能看到这本书很多弯路很多坑都是可以避免的,可惜这本书是今年出的,羡慕现在的年轻人能有这么丰富完善的资料可以学习,想当年我纯靠百度和论坛搜索、求助啊,连个正经师傅都没有,从软件安装到一步一布操作纯靠自己瞎摸索,然后就是搜索各种教程视频,说出来都是泪啊。  &
    DrouSherry 2024-12-19 20:00 75浏览
  • 随着工业自动化和智能化的发展,电机控制系统正向更高精度、更快响应和更高稳定性的方向发展。高速光耦作为一种电气隔离与信号传输的核心器件,在现代电机控制中扮演着至关重要的角色。本文将详细介绍高速光耦在电机控制中的应用优势及其在实际工控系统中的重要性。高速光耦的基本原理及优势高速光耦是一种光电耦合器件,通过光信号传递电信号,实现输入输出端的电气隔离。这种隔离可以有效保护电路免受高压、电流浪涌等干扰。相比传统的光耦,高速光耦具备更快的响应速度,通常可以达到几百纳秒到几微秒级别的传输延迟。电气隔离:高速光
    晶台光耦 2024-12-20 10:18 114浏览
  • 在强调可移植性(portable)的年代,人称「二合一笔电」的平板笔电便成为许多消费者趋之若鹜的3C产品。说到平板笔电,不论是其双向连接设计,面板与键盘底座可分离的独特功能,再加上兼具笔电模式、平板模式、翻转模式及帐篷模式等多种使用方式,让使用者在不同的使用情境下都能随意调整,轻巧灵活的便利性也为多数消费者提供了绝佳的使用体验。然而也正是这样的独特设计,潜藏着传统笔电供货商在产品设计上容易忽视的潜在风险。平板笔电Surface Pro 7+ 的各种使用模式。图片出处:Microsoft Comm
    百佳泰测试实验室 2024-12-19 17:40 157浏览
  • 户外照明的“璀璨王者”,艾迈斯欧司朗OSCONIQ® C3030降临啦全球领先的光学解决方案供应商艾迈斯欧司朗(瑞士证券交易所股票代码:AMS)近日宣布,推出新一代高性能LED——OSCONIQ® C 3030。这款尖端LED系列专为严苛的户外及体育场照明环境而设计,兼具出色的发光强度与卓越的散热效能。其支持高达3A的驱动电流及最大9W的功率输出,以紧凑扁平封装呈现卓越亮度和可靠性,确保高强度照明持久耐用且性能出众。应用领域01体育场及高杆照明OSCONIQ® C 3030以卓越的光通量密度、出
    艾迈斯欧司朗 2024-12-18 14:25 135浏览
  • 习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习笔记&记录学习习笔记&记学习学习笔记&记录学习学习笔记&记录学习习笔记&记录学习学习笔记&记录学习学习笔记记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记
    youyeye 2024-12-18 14:02 120浏览
  • 百佳泰特为您整理2024年12月各大Logo的最新规格信息。——————————USB▶ 百佳泰获授权进行 USB Active Cable 认证。▶ 所有符合 USB PD 3.2 标准的产品都有资格获得USB-IF 认证——————————Bluetooth®▶ Remote UPF Testing针对所有低功耗音频(LE Audio)和网格(Mesh)规范的远程互操作性测试已开放,蓝牙会员可使用该测试,这是随时测试产品的又一绝佳途径。——————————PCI Express▶ 2025年
    百佳泰测试实验室 2024-12-20 10:33 84浏览
  • //```c #include "..\..\comm\AI8051U.h"  // 包含头文件,定义了硬件寄存器和常量 #include "stdio.h"              // 标准输入输出库 #include "intrins.h"         &n
    丙丁先生 2024-12-20 10:18 70浏览
  • 沉寂已久的无人出租车赛道,在2024年突然升温了。前脚百度旗下萝卜快跑,宣布无人驾驶单量突破800万单;后脚特斯拉就于北京时间10月11日上午,召开了以“We,Robot”为主题的发布会,公布了无人驾驶车型Cybercab和Robovan,就连低调了好几个月的滴滴也在悄悄扩编,大手笔加码Robotaxi。不止是滴滴、百度、特斯拉,作为Robotaxi的重磅选手,文远知行与小马智行,也分别在10月份先后启动美股IPO,极氪也在近日宣布,其与Waymo合作开发的无人驾驶出行汽车将大规模量产交付,无人
    刘旷 2024-12-19 11:39 135浏览
  • 汽车驾驶员监控系统又称DMS,是一种集中在车辆中的技术,用于实时跟踪和评估驾驶员状态及驾驶行为。随着汽车产业智能化转型,整合AI技术的DMS逐渐成为主流,AI模型通过大量数据进行持续训练,使得驾驶监控更加高效和精准。 驾驶员监测系统主要通过传感器、摄像头收集驾驶员的面部图像,定位头部姿势、人脸特征及行为特征,并通过各种异常驾驶行为检测模型运算来识别驾驶员的当前状态。如果出现任何异常驾驶行为(如疲劳,分心,抽烟,接打电话,无安全带等),将发出声音及视觉警报。此外,驾驶员的行为数据会被记录
    启扬ARM嵌入式 2024-12-20 09:14 70浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦