在看本文之前,建议感兴趣的同学先去了解一下12代酷睿P-core与E-core的微架构分析——此前的这篇文章我们也谈到了对这种混合架构做调度的Intel Thread Director技术。本文从更系统的层面来谈谈12代Intel酷睿桌面处理器,以及我们在发布会上听到更多可在此给出的细节信息。

今年12代Intel酷睿桌面处理器(产品代号Alder Lake-S)宣传活动还是相当的盛大,除了10月28日全天的发布会之外,事实上在此之前的2天,面向媒体就已经有会前沟通会,以及演示活动了。

前两个月的Intel Architecture Day上,我们仔细分析了这代酷睿CPU处理器的两种核心架构,分别是代表性能的P-core(代号Golden Cove),以及代表效率的E-core(代号Gracemont)。此前的总结中我们就提到过,无论哪种核心,都称得上架构层面的大跨步。

其中P-core实现了相比上代(11代酷睿Cypress Cove核心)19%的IPC提升,比Skylake->Sunny Cove的提升还要大;而E-core虽然只是“效率核心”,但在单线程性能方面,同功耗下相比Skylake(10代酷睿)也有最多超过40%的性能提升,多线程最多有80%性能提升,功耗至多降低80%。

按照核心层面理论上的性能提升,要摆脱隔壁AMD的纠缠已经是小菜一碟。而且12代酷睿在绝对性能上应该是能够超过最近被吹得神乎其神的M1 Max的,虽然在功耗方面大概仍然会有一定的弱势。而Intel本身也对12代酷睿寄予了厚望,称其“重新定义x86架构的性能”,以及在宣传口号上提“异构强芯,一战封神”,并且把Alder Lake-S称作“世界上最出色的游戏处理器”。

在看本文之前,建议感兴趣的同学先去了解一下12代酷P-core与E-core的微架构分析——此前的这篇文章我们也谈到了对这种混合架构做调度的Intel Thread Director技术。本文从更系统的层面来谈谈12代Intel酷睿桌面处理器,以及我们在发布会上听到更多可在此给出的细节信息。

首发的几款Alder Lake-S新品

先来看看Intel本次首发的几款12代酷睿桌面处理器新品,具体如下图所示。包括了最高端8个P-core与8个E-core的酷睿i9-12900K(24线程);酷睿i7系列普遍是8个P-core加4个E-core(20线程);i5系列则为6个P-core加4个E-core(16线程)。

I/O的主要亮点包括对于DDR5(4800 MT/s)、PCIe Gen 5(16 lanes)的支持。还有相关睿频、缓存cache方面的信息此处也不再一一赘述,看图即可。值得一提的是,表格右边的功耗部分并未像往常一样,以TDP来标注。这将在后文中做解释。

Cache方面可做补充的是:Intel表示在混合架构之下,“对缓存进行了进一步加强。在增加P-core二级缓存与E-core每核二级缓存的情况下,我们同时在共享的L3智能缓存上也进行了增强和容量扩充。” L3 cache最高为30MB。

核显这次编号叫UHD Graphics 770,似乎相比去年的11代酷睿(Graphics 750)是有提升的,具体不知道提升了哪里。不过作为桌面处理器的核显,集成的Xe core核心数量应该会比较有限。

有关Alder Lake-S的其他信息还包括,采用Intel 7制造工艺(原10nm Enhanced SuperFin),LGA1700封装——也就意味着旧主板是不支持Alder Lake-S的。新主板搭配的是Intel 600系列芯片组。从主板厂在京东的销售信息来看,Z690芯片组的主板过几天才会上市。600系列芯片组的相关提升会在后文中详述。

有关E-core扮演角色的简单补充

此前虽然我们已经用了相当大的篇幅去探讨Alder Lake两种核心架构,以及配套混合架构的Intel Thread Director辅助调度技术。不过这次的发布会,Intel还是公布了一些新料。在谈具体的产品之前,与各位做简单分享。

首先是有关E-core在系统中的作用。鉴于隔壁Arm的宣传,我们习惯上把不同核心放在一起的这种架构称作“大小核”设计。所以大部分人对于Intel推混合架构中的E-core,是秉承其作为“小核心”的思路的。

E-core在整个系统中的确有提升效率的价值,比如在笔记本平台能够更大程度地节电。但就像此前架构分析文章中提到的,E-core在核心规模、宽度上远超Arm的小核心(如Cortex-A55),是个标准的乱序核。

而且这一代E-core(Gracemont)的单线程性能(SPECint)相比Skylake在同功耗下至多提升40%,多线程(4C4T)提升至多80%(同性能下,功耗降低80%)。当然这个对比是基于特定频率,而且并未涉及浮点性能。不过这也意味着12代酷睿即便是E-core,也在某种程度上比10代酷睿的“大核”性能更彪悍、更节能。

我们在这次活动上向Intel提了个问题,即P-core是支持超线程的。当某个任务有16个线程需要处理时,12代酷睿处理器会优先于将16个线程塞满8个P-core并启用超线程(8C16T),还是更倾向于8个线程给P-core,另外8个线程给E-core(16C16T)。

Intel院士Guy Therien在回答这个问题的时候特别提到,超线程通常能够带来30%的性能提升,但E-core却可获得80%的额外性能。“所以在填充核心的时候,首先会挑选P-core——因为其性能出色,随后就挑选E-core。在它们都被填满以后,才会考虑P-core的超线程。”

这个回答其实能够较大程度表明,E-core并非“小核”。Intel方面似乎一直在强调E-core对于多线程吞吐提升的价值。此前我们也说E-core以足够小的占die面积,实现了相对高效的多线程性能提升(四个E-core,面积差不多相当于一个P-core),绝对是Cinebench这类基准测试的刷分利器(妈妈再也不用担心隔壁chiplet-based堆核战术了)。

在demo演示中,Intel也分享了几个有趣的场景,包括一边玩游戏,一边在推流平台做游戏直播——则E-core将在其中发挥非常好的作用,游戏帧率相比以往会有个显著提升。演示中Intel用《骑马与砍杀》+在斗鱼平台推流——相比竞品(AMD Ryzen 5950X)的游戏帧率领先幅度可以达到40%左右;而在未开启E-core的情况下,领先幅度则在20%左右。

另外一个演示场景是,同时用Premiere和LightRoom——当后台做Premiere视频输出时,前台执行Lightroom照片转换工作,会有相当大幅度的速度领先。不过感觉大约很少会有人真的这么去用电脑吧。

Intel针对混合架构可实现性能提升的问题,预设了一些前后台或其他多任务工作场景,具体如上图所示。这其实也是桌面平台为何也用E-core的原因,毕竟它的确不是“小核心”。Intel这次在分享活动上说,一定要形容的话这俩应该是“大核”和“大大核”。

其实有关E-core、P-core以及超线程该怎么用的问题是相关于调度机制的。Intel Thread Director是Intel针对混合架构设计的一种线程调度辅助技术。因为不同核心构成同一个处理器,谁跑在P-core上、谁跑在E-core上,以及何时进行线程迁移,都是影响使用体验的关键。而Intel Thread Director在工作时可以给操作系统scheduler提供更细致的“hint”,帮助操作系统进行调度决策。

这也是Intel与微软Windows 11合作开发的技术,此前我们特别撰文谈了这项技术。其基本原理以及调度的一些典型场景,本文就不再细数了。

另一个值得一提的问题是这次的12代酷睿是不支持AVX-512与AMX(Advanced Matrix Extensions,一种AI加速单元)的。但实际上我们知道,应用于数据中心的Sapphire Rapids支持这两大特性。这表明这代P-core(Golden Cove)在设计上是有AVX-512与AMX硬件基础的。

而12代酷睿之所以不支持这两者,最大的原因应该是E-core不包含对AVX-512与AMX的硬件实现。基于一般情况下,同一颗CPU中,不同架构的核心需做到相同的指令支持这一点,12代酷睿处理器芯片也就不再支持AVX-512与AMX了。

所以我们问了Intel,未来是否有计划推出仅包含P-core(而不包含E-core)的PC处理器。Intel对此表示需要等待后续公布的消息。另外关于能否通过关闭E-core来开启P-core中的AVX-512和AMX特性的问题,Intel的回复是“不能”。

有关Alder Lake-S的性能提升

这代P-core(Golden Cove)相比11代酷睿核心(Cypress Cove)在IPC方面有19%的提升,这一点此前分析P-core架构的时候已经谈到过了。隔代19%的IPC提升还是相当耀眼:Golden Cove作为微架构基础,未来应该会在Intel后续的处理器产品中延续比较长的时间。这其实也是12代酷睿有革新意义的原因所在。

这次Intel也给出了更多的数据,上面这张图是以10代酷睿(Comet Lake-S,Skylake核心)为基准,在固定频率下,整数性能(SPECrate2017_int_base)的变化。12代酷睿的P-core(Golden Cove)较之有28%的提升。而尤为值得一提的是,E-core(Gracemont)也有1%的领先——这里还没有呈现功耗方面的优势。

这其实也能看出,近几代Intel产品在核心性能方面的显著变化。

结合两种核心之后,上面这张图对比了酷睿i9-12900K与上一代的i9-11900K。以酷睿i9-11900K在250W峰值功耗下达成的性能为基准,i9-12900K在不同功耗下可实现的多线程性能成绩如上图所示。

这张图有两个亮点,其一是i9-11900K的峰值功耗241W下,相比上代达成50%的多线程性能提升。更重要的是,要达到上一代相同的性能水平,只需要65W的功耗,即上代1/4的功耗。这样一来,12代酷睿理应会有更多的机型设计自由度;而且也让我们更期待移动平台的12代酷睿产品。

尤为值得一提的是,在前文中新品规格表里,首次出现了“processor base power”和“maximum turbo power”这样的功耗词汇。从Intel的解释来看,基础功率(base power)是指PL1状态下的功耗;而最大睿频功率自然就是指PL2状态下的功耗了。

关注PC的同学应该很清楚,PL2是个短时睿频状态:处理器在该状态下,可维持很短的时间达成性能突发量;而PL1是相对稳定的长时睿频。这次最高配的酷睿i9定义最大睿频功耗为241W。

Intel表示,在散热理想的情况下,可设定PL1=PL2=241W。因为这次的芯片可以长期稳定工作在241W功率下。

系统性能上一代和对手的比较

以这种程度的核心性能提升,虽然在制造工艺上仍然会在短时间内落后于竞争对手,但AMD在微架构设计上,恐怕很难在接下来要发布的Zen 4上实现赶超。接下来谈谈系统性能,这应该才是更多人关心的问题。

作为强调“游戏”的处理器,上面这张图是i9-12900K与上代i9-11900K在各类游戏上的性能比较(其他配置包括12代酷睿采用DDR5-4400内存,Geforce RTX 3090显卡)。Intel测的游戏还真是相当多,从《彩虹6号》到《英雄联盟》。

综合性能提升取几何平均值,则12代酷睿的性能提升幅度大约为13%(Intel提供的另一组数据是13-28%,可能测试环境和样本量有差异)。像《英雄联盟》这样的游戏,性能提升幅度大约有40%。

和对家的5950X比比(这次总算是比最顶尖的5950X了)。这张表中包括《古墓丽影》《孤岛危机》《F1赛车》等游戏。酷睿i9-12900K在大部分游戏中都比AMD的线程撕裂者彪悍。不过这一点应该是完全在意料之中的。只是这个对比其实并未发挥AMD使用自家GPU在系统架构层面优势,该对比同样基于英伟达RTX 3090。

另外AMD Ryzen 5000系列不支持DDR5,对此Intel表示12代酷睿也支持DDR4。“同样的,我们将30多款游戏在DDR4上做了详细评估,得到的结论还是相同的。DDR4之上的游戏性能同样高于竞品和11代酷睿产品。”

在昨天的体验活动中,Intel现场展示了自家产品与AMD在游戏过程中的实时帧率、功耗和温度方面的差异。在《超级赛车》这样的游戏里,能表现出相当大的性能差异;而且CPU温度也显著低于AMD的线程撕裂者。这算是真切地在新一代产品中扳回一城,即便Intel 7工艺接下来要迎战的是台积电N5。

有关散热的问题,Intel也在会上提到了一个细节。这代酷睿处理器的封装再度做了优化。此前我们就知道,Intel通过做薄die的部分,而做厚上方的IHS(Integrated Heat Spreader)散热器来提升散热效率。12代酷睿桌面处理器的IHS进一步做厚,将STIM(Solder Thermal Interface Material)钎焊散热材料做薄了,来进一步提升散热效率。

另外需要单独提一提混合架构中,E-core在游戏场景中可发挥的作用。前文已经提到,即一边玩《骑马与砍杀2:霸主》这款游戏,一边跑游戏的流播与录制(OBS)。酷睿i9-12900K的E-core能帮上很大的忙(主要是针对OBS的流播与录制任务),最终可让游戏帧率提升84%。如果没有E-core的话,那么相比前代的提升则在19%左右。

值得一提的是,Intel这次专门与游戏工作室合作的游戏包括《杀手3》《反恐精英:全球攻势》《骑马与砍杀2:霸主》《全面战争传奇:特洛伊》等。《骑马与砍杀》应该是这其中对多线程并行能力利用率比较高的游戏,所以能够表现出更大的性能优势。

说完游戏,自然要说内容创作了。Adobe全家桶,包括Lightroom、Premiere、After Effects,以及其他各种工具,从照片、视频编辑,到2D、3D建模和多帧渲染等工作,12代酷睿相比前代的性能变化如上图。

这里After Effects Plus Benchmark能够充分利用并行计算资源来做视频处理,所以性能提升幅度达到了翻番的程度。E-core在这其中应当也起到了相当大的作用。这些内容创作工具中,Intel同样有生态合作方面的例子。这次Intel特别提到了VEGAS Pro——在程序上较早开始利用VNNI指令集。这种生态合作的工具,事实上总是能达成更高的硬件利用率。

此处Intel为了表现其混合架构优势,列举的一个多任务工作场景是一边用Lightroom导出照片(RAW->JPG),一边用Premiere导出视频。在E-core参与工作的情况下,并行处理这两项工作,能够达成相比上一代47%的速度提升。

这一例中。“照片编辑是短期操作行为,会被拉到P-core去操作;而视频转码用Premiere会被移到后台。”是两种核心配合工作的典型场景。

前文我们已经提到,其实这样的工作场景还是挺少见的。不过或许的确有摄影师存在此种工作需求,一边剪片子、一边给照片调色——摄影师本人仿佛也是多核工作状态…

还有个生产力性能场景,包括一些办公工具的性能变化,i9-12900K相比上代产品的变化如上图所示。不过在多媒体内容创作以及生产力方面,Intel并未给出与AMD的对比数字。

600系列芯片组与超频

最后来说说搭配12代酷睿桌面处理器的Intel 600系列芯片组(PCH),以及处理器及周边的官方超频选择——这也是现在Intel发布会必提及的项目,毕竟很多会选购桌面CPU的同学都是发烧友爱好者。

其实600系列芯片组能提的亮点不多,高端定位的Z690芯片组支持PCIe 4.0,“配合原有的PCIe 3.0,在芯片组上我们一共交付了28条PCIe连接接口,极大丰富了外设连接。”

这里有个亮点在于,芯片组与CPU连接的总线升级至x8 DMI Gen 4.0——虽然不知道具体规格,不过猜想应当与PCIe 4.0类似。外设拓宽,做芯片组与CPU连接带宽提升也是应该的。在这一点上,看未来12代酷睿移动版的配置应该会更有意义。

除此之外就是集成Wi-Fi 6E;以及“通过VMD(Volume Management Device)可以更好实现在PCIe下的设备管理,灵活进行设备组合管理”。

而在官方超频选择方面,对用户而言主要有几个新增的超频功能。其一是,E-core也可以超频,而且在XTU工具中可以针对单独的核心做超频设置。P-core与E-core倍频可分别做调整,Ring/Cache频率、核显频率等都可以做调整。

其二,配套DDR5,Intel推出了XMP 3.0。对于用户而言,XMP 3.0增加到了5个profile可选,有新的电压选项;其中有2个profile可以由用户手动修改一些时序特性——这一点在过去是没有的。PMIC如今是跟着DDR5走的,“DDR5电源管理IC目前有三个电压:VDD、VDDQ和VPP,这三个电压都以JEDEC与英特尔XMP做规范。”…“主板厂不需要去认不同厂商的产品,由Intel来做超频相关的电源IC规范。”

“我们提供这么多的频率、电压、timing…所需的位置会更大。以前是78bytes,现在是384bytes需求。”Intel方面表示,“这些XMP的规格与电源管理IC以及SPD的规格都有关联,互相做参考。这些规格让内存厂商做验证,然后将其验证结果交给Intel。Intel确认之后,将其列为Intel认可的DDR型号。”

XMP 3.0还是相当值得发烧友们去研究和把玩一番的。

在昨天的演示环节,Intel演示了用XTU工具,直接在操作系统中就可以进行内存超频的实时切换,从4800 MT/s超到5200,而不需要切到BIOS下去设置。

其三,内存超频部分这次Intel新推了一个Dynamic Memory Boost动态内存频率调整特性。可以根据当前负载自动进行内存频率的切换,即在可达到XMP设定“超频”频率的基础上,也能在不需要的时候回到默认频率。

最后就是XTU(Extreme Tuning Utility)这个官超工具的一些特性加强。在XTU 7.5版本中,除了前文提到的对不同核心做超频设置,对内存做XMP超频,Intel还特别强调了新增的Intel Speed Optimizer达成核心频率上的“一键超频”。按一个按钮,就能提升至优化过的更高的频率——真正的“官超”。

总结:Intel的关键一役

我们已经拿到了这次Intel新发布的酷睿i9-12900K与i5-12600K,后续将会从某些角度对这两颗芯片的性能和表现做个体验分享。

12代酷睿处理器(Alder Lake)对Intel而言是相当重要的产品。以此前的架构分析和这次官方公布的数据来看,秒杀AMD Zen 3乃至后续的Zen 4应该都不是大问题;而且已泄露的跑分也表明,其CPU部分的绝对性能是优于苹果M1 Max的——虽然因为制造工艺及运营模式的关系,在功耗表现上或许仍然不及。

混合架构,及作为未来酷睿产品架构升级基础的P-core(Golden Cove)都是Intel这两年的集大成之作。基于目前Arm阵营在高性能领域扩展的态势,以及AMD这两年的市场表现,Alder Lake无论对Intel,还是对x86阵营而言,都是异常关键的一役。这也让人更加期待后续要到来的Alder Lake移动版。

价格对应如下:

i9-12900K售价为589美元,国行预售价4999元;

i9-12900KF售价为564美元,国行预售价4699元;

i7-12700K售价为409美元,国行预售价3199元;

i7-12700KF售价为384美元,国行预售价2999元;

i5-12600K售价为289美元,国行预售价2299元;

i5-12600KF售价为264美元,国行预售价2099元。

这些产品目前已经接受预订,预计将在11月4日正式开售,明年年初还会有更多12代酷睿处理器型号问世。

位于华盛顿州的Alder Lake长这样

责编:Luffy Liu

本文为EET电子工程专辑原创文章,禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
  • 不可能intel多核同功耗下能干过amd
阅读全文,请先
您可能感兴趣
今年初的GTC上,黄仁勋就说机器人的“ChatGPT时刻”要来了。也就是说这波AI驱动的机器人热潮要来了...最近的ROSCon China 2024大会似乎也能看到这种迹象...
Arm预计,到2025年将会有1,000亿台基于Arm架构的设备可具备人工智能功能,包括由Cortex-A、Cortex-M驱动的设备。
台积电的1.6纳米芯片“A16”技术具有多项创新点,其中最显著的是其超级电源轨(SPR)背面供电网络。这一技术是台积电首创,专为高性能计算产品设计,旨在提高芯片的性能和降低功耗。
使用旗下CUDA-Q平台,谷歌可以在英伟达Eos超算上动用1024块H100 Tensor核心GPU,以极低的成本执行全球最大、最快的量子设备动力学模拟,可以对容纳40个量子比特的设备进行全面、逼真的模拟。
为了应对这一挑战,英伟达正在与多家云服务提供商合作,共同优化散热方案,并强调工程迭代是正常且预期的一部分,但其交付时间或不得不再次推迟。
最近国产AI芯片市场遭遇一波有关7nm被禁的震荡,现状如何了?
目前,智能终端NFC功能的使用频率越来越高,面对新场景新需求,ITMA多家成员单位一起联合推动iTAP(智能无感接近式协议)标准化项目,预计25年上半年发布1.0标准,通过功能测试、兼容性测试,确保新技术产业应用。
中科院微电子所集成电路制造技术重点实验室刘明院士团队提出了一种基于记忆交叉阵列的符号知识表示解决方案,首次实验演示并验证了忆阻神经-模糊硬件系统在无监督、有监督和迁移学习任务中的应用……
C&K Switches EITS系列直角照明轻触开关提供表面贴装 PIP 端子和标准通孔配置,为电信、数据中心和专业音频/视频设备等广泛应用提供创新的多功能解决方案。
投身国产浪潮向上而行,英韧科技再获“中国芯”认可
近期,多个储能电站项目上新。■ 乐山电力:募资2亿建200MWh储能电站12月17日晚,乐山电力(600644.SH)公告,以简易程序向特定对象发行A股股票申请已获上交所受理,募集资金总额为2亿元。发
‍‍12月18日,深圳雷曼光电科技股份有限公司(下称“雷曼光电”)与成都辰显光电有限公司(下称“辰显光电”)在成都正式签署战略合作协议。双方将充分发挥各自在技术创新、产品研发等方面的优势,共同推进Mi
来源:观察者网12月18日消息,自12月2日美国发布新一轮对华芯片出口禁令以来,不断有知情人士向外媒透露拜登政府在卸任前将采取的下一步动作。美国《纽约时报》12月16日报道称,根据知情人士以及该报查阅
12月18日,珠海京东方晶芯科技举行设备搬入仪式。插播:加入LED显示行业群,请加VX:hangjia188在10月31日,珠海京东方晶芯科技有限公司发布了Mini/Micro LED COB显示产品
万物互联的时代浪潮中,以OLED为代表的新型显示技术,已成为人机交互、智能联结的重要端口。维信诺作为中国OLED赛道的先行者和引领者,凭借自主创新,实现了我国OLED技术的自立自强,成为中国新型显示产
“ 洞悉AI,未来触手可及。”整理 | 美股研究社在这个快速变化的时代,人工智能技术正以前所未有的速度发展,带来了广泛的机会。《AI日报》致力于挖掘和分析最新的AI概念股公司和市场趋势,为您提供深度的
12月18 日,据报道,JNTC与印度Welspun BAPL就车载盖板玻璃的开发及量产签订了投资引进业务合作备忘录(MOU)。资料显示,JNTC是韩国的一家盖板玻璃厂商。Welspun的总部位于印度
 “ 担忧似乎为时过早。 ”作者 | RichardSaintvilus编译 | 华尔街大事件由于担心自动驾驶汽车可能取消中介服务,Uber ( NYSE: UBER ) 的股价在短短几周内从 202
扫描关注一起学嵌入式,一起学习,一起成长在嵌入式开发软件中查找和消除潜在的错误是一项艰巨的任务。通常需要英勇的努力和昂贵的工具才能从观察到的崩溃,死机或其他计划外的运行时行为追溯到根本原因。在最坏的情
近期,高科视像、新视通、江苏善行智能科技等企业持续扩充COB产能。插播:加入LED显示行业群,请加VX:hangjia188■ 高科视像:MLED新型显示面板生产项目(二期)招标12月18日,山西高科