今年9月的Intel Innovation期间,Intel详解了Meteor Lake的部分关键技术——Meteor Lake可以说是近代Intel历史上,及PC处理器历史上最大的一次变革。因为这颗处理器真正将chiplet和先进封装方案用到了PC领域,也用上了Intel最新的Intel 4工艺;另外CPU部分新增低功耗LP E-core,处理器新加AI加速单元、核显性能跃升2倍也都是重要的加分项...
当时Intel预告了Meteor Lake酷睿Ultra处理器将在12月发布——酷睿Ultra品牌名的出现,其实也多少能看出Intel对这代产品的重视。感觉这次Intel发布新款处理器的阵仗挺大,在北京国家体育馆的发布会刻意强调了AI PC。不过这篇文章,我们只谈新发布的酷睿Ultra处理器新品。从现场不少OEM企业展示的新品来看,当前已经有采用酷睿Ultra处理器的笔记本上市了:联想应该就是其中第一批。有关此次发布会强调AI PC的报道部分,点击这里查看。
谈谈酷睿Ultra的产品定位
此前Intel在宣布酷睿Ultra品牌名时就提到了,酷睿Ultra按照惯例划分成了酷睿Ultra 9/7/5几个不同系列,就像以前的酷睿i9/i7/i5那样。但这次Intel只重点发布了酷睿Ultra 7和Ultra 5的几个型号,并且表示明年1月才会发布酷睿Ultra 9。
另外有一个我们并不是很确定的消息。以往PC平台常规的酷睿处理器是切分成面向台式机和笔记本的不同系列的,通常面向台式机的是S系列;而面向笔记本的基于功耗差异还会细分成HX, H, P, U等系列。而Intel在本次发布会上只发布了面向笔记本的H与U系列,具体产品如下。
有可能对于Meteor Lake这代产品而言,其他系列都会缺席。我们知道,以前的H和U系列分别是面向笔记本的标压和低压版本CPU。但从酷睿12代(Alder Lake)开始,Intel引入HX系列以后,尤其酷睿13代(Raptor Lake)强化了HX的市场地位,H系列成为更多轻薄本的选择,部分取代了此前P系列定位。
从产品参数表来看,酷睿Ultra的H系列处理器设定的TDP基础功耗在28W,最大睿频功耗64W。这是个明显更偏功耗敏感的设定(但从Intel的介绍来看,OEM厂商也可以将基础功耗设定在38W/40W,也有对应更高的最大睿频功耗115W)。
在答记者问时,Intel表示:“Meteor Lake这一代酷睿Ultra,更多聚焦在轻薄笔记本平台”,而28W这个功耗点“既能均衡性能,又能均衡功耗和未来笔记本设计”。另外还有一句话,“目前看到的整个型号表是全家族的型号,我们不会在Meteor Lake平台增加其他处理器型号”。
另一个比较重要的信息是,Raptor Lake和Meteor Lake可能会在未来一段时间内共存。即高性能的游戏本、工作站可能仍然会继续用酷睿13代——也就是Raptor Lake处理器。台式机则大概率会延续前不久发布的酷睿14代Raptor Lake Refresh。从这个角度来看,Meteor Lake更像是仅取代了上代处理器的一部分产品。
还有一点值得一提,即新发布顶配的酷睿Ultra 7 165H的P-core最高睿频为5.0GHz,而一季度要问世的酷睿Ultra 9 185H的P-core最高睿频也就是5.1GHz。这在Intel的历史产品上并不算是特别激进的频率。不论这些设定是否与Intel 4工艺特性相关,我们基本还是可以认定,Meteor Lake就是一代更追求高能效的CPU。
具体的处理器规格,文字部分就不再多做赘述了:这次发布了H系列4个型号,和U系列4个型号;明年1季度还会有3个型号问世——明年问世的产品中,出现了TDP 9W,最大睿频功耗30W的型号。
这次发布最高配的酷睿Ultra 7 165H,CPU部分有6个P-core和8个E-core,以及2个LP E-core(SoC Tile、低功耗岛上的2颗低功耗E-core),总共3种,一共16个核心22线程。Intel这次也提到了LP E-core架构与E-core架构是一致的——大概在最高频率上会有差异。P-core睿频5.0GHz,E-core睿频3.8GHz,暂时没有给基频数字,L3 cache最大24MB。
处理器的核显部分,最多8个Xe核心,这次的核显性能应该还是非常给力的,后文也会特别提及。内存支持方面,DDR5-5600最大96GB,和LPDDR5/x-7467最大64GB。另外就是配有专门的AI加速单元NPU,所有型号在NPU的用料上是一致的。
不同处理器型号的配置差异主要体现在P-core数量,L3 cache容量、核心频率、核显的Xe核心数量和频率上。U系列全系都是2 P-core + 8 E-core + 2 LP E-core的方案;值得一提的是U系列Xe核显资源算是给得比较吝啬,仅有H系列的一半——以前的U系列核显是会给到较强的图形配置的。
Intel在媒体会上没有提酷睿Ultra的型号命名规则,不过对Intel产品线熟的读者应该也能猜个大概。
这代CPU能效提升是关键
此前我们在介绍Meteor Lake的相关技术时,大体上都是说制造工艺、先进封装技术,以及系统级构成,始终没有真正触及CPU性能究竟提升多少之类的话题。
这一代酷睿Ultra处理器上CPU部分的P-core代号为Redwood Cove,E-core代号Crestmont。目前我们所知的是Redwood Cove核心同时增加了cache和内存带宽,性能监测单元也做了提升,IPC随之提升;Intel这次大致提到了Redwood Cove提升了分支预测能力,能效改良,以及辅助操作系统做线程调度决策的ITD(Intel Thread Director)机制提升了反馈能力,总体达成每瓦性能提升。具体各项提升多少没说。
而Crestmont,也就是E-core,除了同样因为分支预测改进、ITD加强了响应表现,以及随之而来提升了吞吐,获得IPC提升以外,Intel还提到一个比较大的变化是,VNNI端口数显著增多,获得VNNI指令执行能力的提升。这对CPU上的AI加速是很有价值的。
加上SoC Tile上的2颗LP E-core核心同为Crestmont架构,基于一般CPU异构核心设计需要做到跨核心的ISA兼容性,P-core, E-core和LP E-core一起工作,CPU多核加速的VNNI指令会有更好的性能表现。Intel在媒体会上强调了E-core和P-core“分享同一个指令集”,Symmetric ISA——这应该主要是在表达AI加速在各个核心间,指令集层面的均等。强调这一点,可能和过去Intel的E-core指令支持缺失有关。
有关和自家前代处理器及竞品处理器的对比,先来看Intel给出功耗相关的一些数字。在PC处理器上,先讲功耗和能效,在Intel以前的媒体会上是不多见的。这应该能够说明酷睿Ultra首先强调的就是效率方面的提升,或者说功耗的相对降低。
第一个数字是在Netflix视频播放场景下,酷睿Ultra 7 165H相比于上一代的酷睿i7-1370P,功耗降低了25%。从此前可能动用P-core和E-core总共需要大约1540mW功耗,到现在用SoC Tile上的LP E-core功耗下降至约1150mW。简单来说,也就是酷睿Ultra播视频比以前更省电了。
第二组数据是不同使用场景下,酷睿Ultra 7 165H相比于AMD Ryzen 7 7840U(标称TDP同为28W)的功耗更低,包括网页浏览功耗低7%,4K本地视频播放功耗低44%,以及Windows桌面闲时功耗低了多达79%。
这对轻薄本而言应该说是非常有价值的数据了,这也会让人更期待接下来采用酷睿Ultra的笔记本续航水平是否会有对应的显著提升。
另外从能效的角度来看,Intel也给出了包含苹果M3在内的几款笔记本处理器的能效曲线,横轴代表SoC功耗,纵轴是相对性能,曲线或点越往左上表示能效越好(相同功耗下可获得更高的性能);对比的仍然是SPECint2017。感觉这张图还是画得随意了点,且等后续产品发布时的具体数据吧:
接下来看看更具体的CPU性能变化,Intel特意强调了“Ultrathin System”中的性能领先,算是对Meteor Lake的定位再做了明确。
单线程性能方面,基于SPECint测试,受制于P-core最高频率(5.0GHz)不及上一代的酷睿i7-1370P(5.2GHz),所以酷睿Ultra 7 165H单线程性能要略弱于后者。这其实让人有些担心Redwood Cove的IPC提升究竟有多少。
同级竞争对手方面,Intel选的仍然是Ryzen 7 7840U——这应该也是目前最合理的竞品对比对象;酷睿Ultra 7 165H的单线程性能较之还是强了大约12%的。另一个参赛选手骁龙8cx Gen 3其实不该拿来同场竞技,毕竟其TDP都不在一个量级。
而在多线程性能对比上,同样是SPECint2017,酷睿Ultra 7 165H相比上一代的酷睿i7-1370H的核心数也更多,所以多线程性能表现出了领先——在相似的功耗水平上,前者提升了大约8%左右。相比于竞争对手的Ryzen 7 7840U,领先幅度则有11%;至于骁龙8cx Gen 3,那应该也还暂时没有提的必要——高通这边目前要看的应该是骁龙X Elite,虽然要等到明年年中了。
这个性能数据在我们看来仍然是不够理想的,尤其是苹果、高通强敌环饲的当下。最后再给一组系统性能对比数字,也就是更偏实际应用的性能对比——主要是多媒体创作方面的,包括UL Procyon的视频编辑测试,PugetBench的Premiere和Lightroom测试。
注意这组对比的处理器和前面几个对比的型号不同,Intel阵营选的是酷睿Ultra 7 155H和酷睿i7-1360P。AMD这边仍然是Ryzen 7 7840U。Intel方面说,这是尽可能找了一些接近配置的机型去做对比。Intel给出的第一方结果数据是,Meteor Lake阵营相比竞品,在这三项中的性能领先幅度达到了31%、41%和19%。
这个领先幅度还是相当大的。不过这种高层级、真实负载的测试对比,比的应该就不只是CPU的性能了,多媒体编解码器、GPU加速可能都包含其中。
另外在系统性能部分,Intel给出的,当然还有游戏性能水平。但和往常不同的是,Intel这次给的游戏性能测试,主要是为了反映酷睿Ultra的核显性能。
核显,2倍性能提升
现在Intel开始直接将Meteor Lake的核显称作Arc GPU了,这是以前Intel独显的名字。主要是因为新核显的确大量借鉴了Arc独显的经验。新核显在芯片封装层面基本是独占了一片chiplet/tile的,其规模缩放灵活性理论上也会更好。Intel Innovation大会上,Intel就说新版核显Xe-LPG,相比于前代的Xe-LP,性能和能效(每瓦性能)都实现了翻番;同时新增光线追踪单元,新增DirectX 12 Ultimate特性支持(包括光线追踪、网格着色等)等。
媒体引擎新增AV1编码支持,最高至8K 10b HDR规格;显示引擎部分同时支持4路通道,对HDMI 2.1, DP2.1 20G, eDP 1.4b也都做出了支持。这两个部分现在实际上和图形单元并不在一起,但习惯上会放在一起讨论。
大众更关心的图形性能提升,源自于 Xe-LPG相比过去提高了主频、扩大了规模,也提升了架构效率。酷睿Ultra 7用上了顶配的8个Xe核心,总共128个矢量引擎;几何管线双倍拓宽;后端也有对应提升;每个Xe核心也对应了1个光线追踪单元。堆料就比此前用了好几代96EU的Xe-LP核显强了不少。
用核显来玩游戏,酷睿Ultra 7 165H相比酷睿i7-1370P,在不同的游戏中,包括《生化危机:村庄》《CS2》《守望先锋》等游戏帧率都有可观的提升。尤其《博德之门3》的游戏帧率是前代的2倍:
更多同学可能会关心酷睿Ultra的核显,相比隔壁AMD正在市场上大杀四方的Radeon 780M核显怎么样。Intel表示他们选了4台不同的笔记本来做这项测试,两台采用酷睿Ultra 7,还有两台都采用AMD的Ryzen 7 7840U。
综合18款不同游戏在1080p分辨率下的测试结果,酷睿Ultra 7 165H相比竞品有着16%的游戏性能优势。这对想用轻薄本来玩游戏的用户而言显然是个好消息。
还有一点格外值得一提,即Intel的核显现在也能通过DP4a指令来做AI超分,也就是核显现在也支持XeSS了。XeSS能够将低分辨率的画面,以近乎原生画质水平升格到高分辨率。比如540p分辨率的画面可以提升到1080p,那么GPU的渲染压力就低了很多,也就提升了帧率。
这类AI超分特性原本是独显才有的,但实际上它对图形渲染资源稀缺的核显而言也非常重要。Intel给出的数据是,用酷睿Ultra 7 165H玩游戏,开启XeSS的情况下(应该是极致性能档),游戏帧率平均能够提升39%——这对用核显玩游戏显然又是个巨大的加分项;而±39%往往是游戏流畅与否的分水岭。活动现场演示现在《赛博朋克2077》也能流畅运行,这在前两年还是不可想象的。
而且在加上XeSS以后,酷睿Ultra的实际游戏性能能够比上代酷睿最高高出3倍(官方特别列举了游戏《幽灵使者》),且能效也能有3倍领先。
有关酷睿Ultra的AI和其他组成部分
有关AI的部分,包括AI功能演示,AI PC的新特性,我们做了另外撰文。我们之前也特别介绍过Meteor Lake内部集成的这颗NPU,Intel的AI软件栈、生态情况,以及Intel是如何借用XPU(CPU+GPU+NPU)来做更高效的本地AI推理的。
这里简单分享本次公布的一些数字和关键信息,(1)Intel公布酷睿Ultra的AI“总体算力可以达到34TOPS”,囊括了不同的处理器单元,尤其前文提到E-core的VNNI指令执行加强就是其中的组成部分。
(2)酷睿Ultra能跑200亿参数规模的LLM大语言模型。1秒时间完成512x512分辨率文生图,6秒1024x768高画质文生图。
(3)Intel预计到2025年,会将超过1亿台带有AI加速器(NPU)的PC投放到市场上。
(4)在不同的AI工作中,酷睿Ultra相比AMD的竞品,有着不同程度的性能领先。比如Lightroom中的AI照片编辑,Stable Diffusion的文生图等。虽然这个对比没有拉来Ryzen 7 8040系列有些说不过去,而且GIMP Stable Diffusion这种对比项应该主要是欺负AMD还没有就软件层面,着力在这块做布局与优化。
(5)酷睿Ultra相比上代产品,生成式AI性能强1.7倍,视频电话中使用AI特性(如背景移除)由于负载主要转移到了NPU单元上,功耗降低了38%;在UL Procyon AI测试中能效提升2.5倍。
(6)Intel在AI方面的ISV合作伙伴很快要达到100家,有了超过300个具备AI特性的应用。与一家名为Superpower的ISV合作,让LLaMa2-7B跑在酷睿Ultra上。“也和国内很多大语言模型厂商合作,国内拿到监管许可的厂商基本都有合作,并在酷睿Ultra平台上做适配”。
最后还有个相关酷睿Ultra处理器的重要组成部分没谈:以前都是放在PCH芯片组的部分去讲的。而酷睿Ultra现如今的chiplet式设计不再需要额外的PCH芯片组,IO支持情况汇总如下,这里就不再多做解释了,看图即可:
这张图基本也汇总了这一代酷睿Ultra的亮点,包括异构核心设计,新加入的LP E-core核心;核显性能大幅提升,NPU作为专用AI加速单元的引入等。总的来说,Meteor Lake是CPU重在提升能效,GPU核显性能大幅跃升,并引入AI PC概念的一代处理器产品——这是其面向用户时,产品层面的价值。
而在半导体制造技术层面,我们还是想强调,Intel 4工艺、EUV的采用,以及Foveros 3D封装技术,整体都基于chiplet的设计,为未来10年的处理器发展奠定了基础。