Intel发布12代酷睿桌面CPU：性能解析与前瞻-电子工程专辑



 0

 收藏

 分享

扫码分享到微信好友

 海报

 扫一扫

扫码查看更多文章

在看本文之前，建议感兴趣的同学先去了解一下12代酷睿P-core与E-core的微架构分析——此前的这篇文章我们也谈到了对这种混合架构做调度的Intel Thread Director技术。本文从更系统的层面来谈谈12代Intel酷睿桌面处理器，以及我们在发布会上听到更多可在此给出的细节信息。

今年12代Intel酷睿桌面处理器（产品代号Alder Lake-S）宣传活动还是相当的盛大，除了10月28日全天的发布会之外，事实上在此之前的2天，面向媒体就已经有会前沟通会，以及演示活动了。

前两个月的Intel Architecture Day上，我们仔细分析了这代酷睿CPU处理器的两种核心架构，分别是代表性能的P-core（代号Golden Cove），以及代表效率的E-core（代号Gracemont）。此前的总结中我们就提到过，无论哪种核心，都称得上架构层面的大跨步。

其中P-core实现了相比上代（11代酷睿Cypress Cove核心）19%的IPC提升，比Skylake->Sunny Cove的提升还要大；而E-core虽然只是“效率核心”，但在单线程性能方面，同功耗下相比Skylake（10代酷睿）也有最多超过40%的性能提升，多线程最多有80%性能提升，功耗至多降低80%。

按照核心层面理论上的性能提升，要摆脱隔壁AMD的纠缠已经是小菜一碟。而且12代酷睿在绝对性能上应该是能够超过最近被吹得神乎其神的M1 Max的，虽然在功耗方面大概仍然会有一定的弱势。而Intel本身也对12代酷睿寄予了厚望，称其“重新定义x86架构的性能”，以及在宣传口号上提“异构强芯，一战封神”，并且把Alder Lake-S称作“世界上最出色的游戏处理器”。

在看本文之前，建议感兴趣的同学先去了解一下12代酷睿 P-core与E-core的微架构分析——此前的这篇文章我们也谈到了对这种混合架构做调度的Intel Thread Director技术。本文从更系统的层面来谈谈12代Intel酷睿桌面处理器，以及我们在发布会上听到更多可在此给出的细节信息。

首发的几款Alder Lake-S新品

先来看看Intel本次首发的几款12代酷睿桌面处理器新品，具体如下图所示。包括了最高端8个P-core与8个E-core的酷睿i9-12900K（24线程）；酷睿i7系列普遍是8个P-core加4个E-core（20线程）；i5系列则为6个P-core加4个E-core（16线程）。

I/O的主要亮点包括对于DDR5（4800 MT/s）、PCIe Gen 5（16 lanes）的支持。还有相关睿频、缓存cache方面的信息此处也不再一一赘述，看图即可。值得一提的是，表格右边的功耗部分并未像往常一样，以TDP来标注。这将在后文中做解释。

Cache方面可做补充的是：Intel表示在混合架构之下，“对缓存进行了进一步加强。在增加P-core二级缓存与E-core每核二级缓存的情况下，我们同时在共享的L3智能缓存上也进行了增强和容量扩充。” L3 cache最高为30MB。

核显这次编号叫UHD Graphics 770，似乎相比去年的11代酷睿（Graphics 750）是有提升的，具体不知道提升了哪里。不过作为桌面处理器的核显，集成的Xe core核心数量应该会比较有限。

有关Alder Lake-S的其他信息还包括，采用Intel 7制造工艺（原10nm Enhanced SuperFin），LGA1700封装——也就意味着旧主板是不支持Alder Lake-S的。新主板搭配的是Intel 600系列芯片组。从主板厂在京东的销售信息来看，Z690芯片组的主板过几天才会上市。600系列芯片组的相关提升会在后文中详述。

有关E-core扮演角色的简单补充

此前虽然我们已经用了相当大的篇幅去探讨Alder Lake两种核心架构，以及配套混合架构的Intel Thread Director辅助调度技术。不过这次的发布会，Intel还是公布了一些新料。在谈具体的产品之前，与各位做简单分享。

首先是有关E-core在系统中的作用。鉴于隔壁Arm的宣传，我们习惯上把不同核心放在一起的这种架构称作“大小核”设计。所以大部分人对于Intel推混合架构中的E-core，是秉承其作为“小核心”的思路的。

E-core在整个系统中的确有提升效率的价值，比如在笔记本平台能够更大程度地节电。但就像此前架构分析文章中提到的，E-core在核心规模、宽度上远超Arm的小核心（如Cortex-A55），是个标准的乱序核。

而且这一代E-core（Gracemont）的单线程性能（SPECint）相比Skylake在同功耗下至多提升40%，多线程（4C4T）提升至多80%（同性能下，功耗降低80%）。当然这个对比是基于特定频率，而且并未涉及浮点性能。不过这也意味着12代酷睿即便是E-core，也在某种程度上比10代酷睿的“大核”性能更彪悍、更节能。

我们在这次活动上向Intel提了个问题，即P-core是支持超线程的。当某个任务有16个线程需要处理时，12代酷睿处理器会优先于将16个线程塞满8个P-core并启用超线程（8C16T），还是更倾向于8个线程给P-core，另外8个线程给E-core（16C16T）。

Intel院士Guy Therien在回答这个问题的时候特别提到，超线程通常能够带来30%的性能提升，但E-core却可获得80%的额外性能。“所以在填充核心的时候，首先会挑选P-core——因为其性能出色，随后就挑选E-core。在它们都被填满以后，才会考虑P-core的超线程。”

这个回答其实能够较大程度表明，E-core并非“小核”。Intel方面似乎一直在强调E-core对于多线程吞吐提升的价值。此前我们也说E-core以足够小的占die面积，实现了相对高效的多线程性能提升（四个E-core，面积差不多相当于一个P-core），绝对是Cinebench这类基准测试的刷分利器（妈妈再也不用担心隔壁chiplet-based堆核战术了）。

在demo演示中，Intel也分享了几个有趣的场景，包括一边玩游戏，一边在推流平台做游戏直播——则E-core将在其中发挥非常好的作用，游戏帧率相比以往会有个显著提升。演示中Intel用《骑马与砍杀》+在斗鱼平台推流——相比竞品（AMD Ryzen 5950X）的游戏帧率领先幅度可以达到40%左右；而在未开启E-core的情况下，领先幅度则在20%左右。

另外一个演示场景是，同时用Premiere和LightRoom——当后台做Premiere视频输出时，前台执行Lightroom照片转换工作，会有相当大幅度的速度领先。不过感觉大约很少会有人真的这么去用电脑吧。

Intel针对混合架构可实现性能提升的问题，预设了一些前后台或其他多任务工作场景，具体如上图所示。这其实也是桌面平台为何也用E-core的原因，毕竟它的确不是“小核心”。Intel这次在分享活动上说，一定要形容的话这俩应该是“大核”和“大大核”。

其实有关E-core、P-core以及超线程该怎么用的问题是相关于调度机制的。Intel Thread Director是Intel针对混合架构设计的一种线程调度辅助技术。因为不同核心构成同一个处理器，谁跑在P-core上、谁跑在E-core上，以及何时进行线程迁移，都是影响使用体验的关键。而Intel Thread Director在工作时可以给操作系统scheduler提供更细致的“hint”，帮助操作系统进行调度决策。

这也是Intel与微软Windows 11合作开发的技术，此前我们特别撰文谈了这项技术。其基本原理以及调度的一些典型场景，本文就不再细数了。

另一个值得一提的问题是这次的12代酷睿是不支持AVX-512与AMX（Advanced Matrix Extensions，一种AI加速单元）的。但实际上我们知道，应用于数据中心的Sapphire Rapids支持这两大特性。这表明这代P-core（Golden Cove）在设计上是有AVX-512与AMX硬件基础的。

而12代酷睿之所以不支持这两者，最大的原因应该是E-core不包含对AVX-512与AMX的硬件实现。基于一般情况下，同一颗CPU中，不同架构的核心需做到相同的指令支持这一点，12代酷睿处理器芯片也就不再支持AVX-512与AMX了。

所以我们问了Intel，未来是否有计划推出仅包含P-core（而不包含E-core）的PC处理器。Intel对此表示需要等待后续公布的消息。另外关于能否通过关闭E-core来开启P-core中的AVX-512和AMX特性的问题，Intel的回复是“不能”。

有关Alder Lake-S的性能提升

这代P-core（Golden Cove）相比11代酷睿核心（Cypress Cove）在IPC方面有19%的提升，这一点此前分析P-core架构的时候已经谈到过了。隔代19%的IPC提升还是相当耀眼：Golden Cove作为微架构基础，未来应该会在Intel后续的处理器产品中延续比较长的时间。这其实也是12代酷睿有革新意义的原因所在。

这次Intel也给出了更多的数据，上面这张图是以10代酷睿（Comet Lake-S，Skylake核心）为基准，在固定频率下，整数性能（SPECrate2017_int_base）的变化。12代酷睿的P-core（Golden Cove）较之有28%的提升。而尤为值得一提的是，E-core（Gracemont）也有1%的领先——这里还没有呈现功耗方面的优势。

这其实也能看出，近几代Intel产品在核心性能方面的显著变化。

结合两种核心之后，上面这张图对比了酷睿i9-12900K与上一代的i9-11900K。以酷睿i9-11900K在250W峰值功耗下达成的性能为基准，i9-12900K在不同功耗下可实现的多线程性能成绩如上图所示。

这张图有两个亮点，其一是i9-11900K的峰值功耗241W下，相比上代达成50%的多线程性能提升。更重要的是，要达到上一代相同的性能水平，只需要65W的功耗，即上代1/4的功耗。这样一来，12代酷睿理应会有更多的机型设计自由度；而且也让我们更期待移动平台的12代酷睿产品。

尤为值得一提的是，在前文中新品规格表里，首次出现了“processor base power”和“maximum turbo power”这样的功耗词汇。从Intel的解释来看，基础功率（base power）是指PL1状态下的功耗；而最大睿频功率自然就是指PL2状态下的功耗了。

关注PC的同学应该很清楚，PL2是个短时睿频状态：处理器在该状态下，可维持很短的时间达成性能突发量；而PL1是相对稳定的长时睿频。这次最高配的酷睿i9定义最大睿频功耗为241W。

Intel表示，在散热理想的情况下，可设定PL1=PL2=241W。因为这次的芯片可以长期稳定工作在241W功率下。

系统性能，与上一代和对手的比较

以这种程度的核心性能提升，虽然在制造工艺上仍然会在短时间内落后于竞争对手，但AMD在微架构设计上，恐怕很难在接下来要发布的Zen 4上实现赶超。接下来谈谈系统性能，这应该才是更多人关心的问题。

作为强调“游戏”的处理器，上面这张图是i9-12900K与上代i9-11900K在各类游戏上的性能比较（其他配置包括12代酷睿采用DDR5-4400内存，Geforce RTX 3090显卡）。Intel测的游戏还真是相当多，从《彩虹6号》到《英雄联盟》。

综合性能提升取几何平均值，则12代酷睿的性能提升幅度大约为13%（Intel提供的另一组数据是13-28%，可能测试环境和样本量有差异）。像《英雄联盟》这样的游戏，性能提升幅度大约有40%。

和对家的5950X比比（这次总算是比最顶尖的5950X了）。这张表中包括《古墓丽影》《孤岛危机》《F1赛车》等游戏。酷睿i9-12900K在大部分游戏中都比AMD的线程撕裂者彪悍。不过这一点应该是完全在意料之中的。只是这个对比其实并未发挥AMD使用自家GPU在系统架构层面优势，该对比同样基于英伟达RTX 3090。

另外AMD Ryzen 5000系列不支持DDR5，对此Intel表示12代酷睿也支持DDR4。“同样的，我们将30多款游戏在DDR4上做了详细评估，得到的结论还是相同的。DDR4之上的游戏性能同样高于竞品和11代酷睿产品。”

在昨天的体验活动中，Intel现场展示了自家产品与AMD在游戏过程中的实时帧率、功耗和温度方面的差异。在《超级赛车》这样的游戏里，能表现出相当大的性能差异；而且CPU温度也显著低于AMD的线程撕裂者。这算是真切地在新一代产品中扳回一城，即便Intel 7工艺接下来要迎战的是台积电N5。

有关散热的问题，Intel也在会上提到了一个细节。这代酷睿处理器的封装再度做了优化。此前我们就知道，Intel通过做薄die的部分，而做厚上方的IHS（Integrated Heat Spreader）散热器来提升散热效率。12代酷睿桌面处理器的IHS进一步做厚，将STIM（Solder Thermal Interface Material）钎焊散热材料做薄了，来进一步提升散热效率。

另外需要单独提一提混合架构中，E-core在游戏场景中可发挥的作用。前文已经提到，即一边玩《骑马与砍杀2：霸主》这款游戏，一边跑游戏的流播与录制（OBS）。酷睿i9-12900K的E-core能帮上很大的忙（主要是针对OBS的流播与录制任务），最终可让游戏帧率提升84%。如果没有E-core的话，那么相比前代的提升则在19%左右。

值得一提的是，Intel这次专门与游戏工作室合作的游戏包括《杀手3》《反恐精英：全球攻势》《骑马与砍杀2：霸主》《全面战争传奇：特洛伊》等。《骑马与砍杀》应该是这其中对多线程并行能力利用率比较高的游戏，所以能够表现出更大的性能优势。

说完游戏，自然要说内容创作了。Adobe全家桶，包括Lightroom、Premiere、After Effects，以及其他各种工具，从照片、视频编辑，到2D、3D建模和多帧渲染等工作，12代酷睿相比前代的性能变化如上图。

这里After Effects Plus Benchmark能够充分利用并行计算资源来做视频处理，所以性能提升幅度达到了翻番的程度。E-core在这其中应当也起到了相当大的作用。这些内容创作工具中，Intel同样有生态合作方面的例子。这次Intel特别提到了VEGAS Pro——在程序上较早开始利用VNNI指令集。这种生态合作的工具，事实上总是能达成更高的硬件利用率。

此处Intel为了表现其混合架构优势，列举的一个多任务工作场景是一边用Lightroom导出照片（RAW->JPG），一边用Premiere导出视频。在E-core参与工作的情况下，并行处理这两项工作，能够达成相比上一代47%的速度提升。

这一例中。“照片编辑是短期操作行为，会被拉到P-core去操作；而视频转码用Premiere会被移到后台。”是两种核心配合工作的典型场景。

前文我们已经提到，其实这样的工作场景还是挺少见的。不过或许的确有摄影师存在此种工作需求，一边剪片子、一边给照片调色——摄影师本人仿佛也是多核工作状态…

还有个生产力性能场景，包括一些办公工具的性能变化，i9-12900K相比上代产品的变化如上图所示。不过在多媒体内容创作以及生产力方面，Intel并未给出与AMD的对比数字。

600系列芯片组与超频

最后来说说搭配12代酷睿桌面处理器的Intel 600系列芯片组（PCH），以及处理器及周边的官方超频选择——这也是现在Intel发布会必提及的项目，毕竟很多会选购桌面CPU的同学都是发烧友爱好者。

其实600系列芯片组能提的亮点不多，高端定位的Z690芯片组支持PCIe 4.0，“配合原有的PCIe 3.0，在芯片组上我们一共交付了28条PCIe连接接口，极大丰富了外设连接。”

这里有个亮点在于，芯片组与CPU连接的总线升级至x8 DMI Gen 4.0——虽然不知道具体规格，不过猜想应当与PCIe 4.0类似。外设拓宽，做芯片组与CPU连接带宽提升也是应该的。在这一点上，看未来12代酷睿移动版的配置应该会更有意义。

除此之外就是集成Wi-Fi 6E；以及“通过VMD（Volume Management Device）可以更好实现在PCIe下的设备管理，灵活进行设备组合管理”。

而在官方超频选择方面，对用户而言主要有几个新增的超频功能。其一是，E-core也可以超频，而且在XTU工具中可以针对单独的核心做超频设置。P-core与E-core倍频可分别做调整，Ring/Cache频率、核显频率等都可以做调整。

其二，配套DDR5，Intel推出了XMP 3.0。对于用户而言，XMP 3.0增加到了5个profile可选，有新的电压选项；其中有2个profile可以由用户手动修改一些时序特性——这一点在过去是没有的。PMIC如今是跟着DDR5走的，“DDR5电源管理IC目前有三个电压：VDD、VDDQ和VPP，这三个电压都以JEDEC与英特尔XMP做规范。”…“主板厂不需要去认不同厂商的产品，由Intel来做超频相关的电源IC规范。”

“我们提供这么多的频率、电压、timing…所需的位置会更大。以前是78bytes，现在是384bytes需求。”Intel方面表示，“这些XMP的规格与电源管理IC以及SPD的规格都有关联，互相做参考。这些规格让内存厂商做验证，然后将其验证结果交给Intel。Intel确认之后，将其列为Intel认可的DDR型号。”

XMP 3.0还是相当值得发烧友们去研究和把玩一番的。

在昨天的演示环节，Intel演示了用XTU工具，直接在操作系统中就可以进行内存超频的实时切换，从4800 MT/s超到5200，而不需要切到BIOS下去设置。

其三，内存超频部分这次Intel新推了一个Dynamic Memory Boost动态内存频率调整特性。可以根据当前负载自动进行内存频率的切换，即在可达到XMP设定“超频”频率的基础上，也能在不需要的时候回到默认频率。

最后就是XTU（Extreme Tuning Utility）这个官超工具的一些特性加强。在XTU 7.5版本中，除了前文提到的对不同核心做超频设置，对内存做XMP超频，Intel还特别强调了新增的Intel Speed Optimizer达成核心频率上的“一键超频”。按一个按钮，就能提升至优化过的更高的频率——真正的“官超”。

总结：Intel的关键一役

我们已经拿到了这次Intel新发布的酷睿i9-12900K与i5-12600K，后续将会从某些角度对这两颗芯片的性能和表现做个体验分享。

12代酷睿处理器（Alder Lake）对Intel而言是相当重要的产品。以此前的架构分析和这次官方公布的数据来看，秒杀AMD Zen 3乃至后续的Zen 4应该都不是大问题；而且已泄露的跑分也表明，其CPU部分的绝对性能是优于苹果M1 Max的——虽然因为制造工艺及运营模式的关系，在功耗表现上或许仍然不及。

混合架构，及作为未来酷睿产品架构升级基础的P-core（Golden Cove）都是Intel这两年的集大成之作。基于目前Arm阵营在高性能领域扩展的态势，以及AMD这两年的市场表现，Alder Lake无论对Intel，还是对x86阵营而言，都是异常关键的一役。这也让人更加期待后续要到来的Alder Lake移动版。

价格对应如下：

i9-12900K售价为589美元，国行预售价4999元；

i9-12900KF售价为564美元，国行预售价4699元；

i7-12700K售价为409美元，国行预售价3199元；

i7-12700KF售价为384美元，国行预售价2999元；

i5-12600K售价为289美元，国行预售价2299元；

i5-12600KF售价为264美元，国行预售价2099元。

这些产品目前已经接受预订，预计将在11月4日正式开售，明年年初还会有更多12代酷睿处理器型号问世。