上次Dell灵越14 Plus的体验文章里,我们谈到后续要做AI Benchmark;另有部分读者吐槽文中出现的一段Python代码测试能说明个啥;还有拉来对比的MacBook Air并非一个量级的笔记本……我们还是要填上这个坑。
最近拿到一台联想ThinkPad X13 Gen 3(以下简称ThinkPad X13)——这个系列素有小X1 Carbon之称。虽然在名义上常被人称作“办公本”或“商务本”,但其体态和定位都基本可明确为轻薄本。我们打算对这台轻薄本做个AI Benchmark。借着这篇文章,我们也能大致窥见今年的PC轻薄本和低压CPU,在性能表现上达到了怎样的程度,毕竟此前体验的都是采用标压处理器的“全能本”。
虽说用不带独显的轻薄本、办公本来跑AI测试还是挺不靠谱的,因为真的要做AI开发,显然不会用这样的配置来干这么重的活儿。但这两年的笔记本处理器动不动就12核心,光跑Cinebench渲染也是可惜了…倒不只是图一乐,这样的测试对各位预估同核心微架构、不同规模的CPU,应当也能有个概念。
为对测试成绩有个大致的量级认知,我们仍然拉来MacBook Air(M1 7-core GPU, 16GB RAM, 256GB SSD)做主要对比对象。定价上,这台ThinkPad X13 Gen 3(酷睿i5-1240P,16GB RAM,512GB SSD)和最入门款的MacBook Air是差不多的,从选购的角度有对比的价值。
实际上在售的M1 + 16GB RAM配置MacBook Air价格仍然达到了9000+元。当然主要也是因为我们手上没有M2版MacBook Air的关系…何况虽说比的不是M2,但i5-1240P毕竟也不是Intel产品线里最强的芯片嘛。
除了MacBook Air之外,在某些测试里,本文也会加入2021款MateBook X Pro(上一代酷睿,酷睿i7-1165G7, 16GB RAM)和2022款ROG幻16(酷睿i9-12900H, 24GB RAM)的测试成绩作为参考。
MacBook Air(M1)和ThinkPad X3 Gen 3的体态很相近,价格也相似
这是台性能释放奇特的笔记本
在谈性能之前,照例先看看ThinkPad X13笔记本在系统层面的性能释放水平,以搞清楚它在轻薄本行列,在性能表现上是否具有代表性。
ThinkPad X13 Gen 3的主要配置信息如下:
系统层面,ThinkPad X13的亮点还是比较多的。比如说这块SSD是妥妥的高端货,和知名的980Pro同出一门。无线连接部分,这台本子支持接插nano-SIM卡,实现4G通信——算是出差商务人士的一大便利特性吧。
作为商务本,绝大部分配置项都算比较有诚意,而且镁铝合金机身的轻薄程度虽然还没到X1 Carbon的水平,但也已经相当不错。槽点也是有的,主要是这块300nit亮度的1080p屏幕,在满世界1440p的世界里已经比较落伍了;还有指纹识别比较难用……
从拆解可见,内存颗粒来自SK海力士;SSD则来自三星——从此前我们拆过的几台本子来看,现在OEM厂商给当代SSD加的散热配置也真是越来越豪华,上下都有导热界面材料
4G通信模块是上海移远通信的EM05-CE,这个模块还挺知名;内部芯片来源不明
WiFi模块则是Intel AX211
系统层面的体验依然不是本文的重点。核心部分的处理器Intel酷睿i5-1240P——这里的后缀P是今年Intel针对12代酷睿新增的系列代号。Intel给P系列官方设定的TDP(基础功耗)是28W,属于低压处理器系列。
和更低功耗设定的U系列(15W/9W TDP)相比,P系列和H系列(45W TDP)用的是同一块die。换句话说,P系列属于H系列的下放;而U系列则在“低压”与“超低压”属性上更纯粹一些。所以Intel形容P系列在12代酷睿处理器的定位上是“高性能轻薄本”。我们手上这台ThinkPad X13所用的处理器酷睿i5-1240P,和同系列i7的主要差异在核心频率和cache大小上。
热管下面的应该就是酷睿i5-1240P处理器了
虽说不应对轻薄本的性能释放抱太大期望,不过ThinkPad传统的侧边散热鳍片都还在,那应该就比常规轻薄本的性能释放更好吧?
不过实际情况比较复杂(以下所有测试均插电,并采用Windows操作系统电源策略设定中的“最佳性能”;测试环境温度:24℃):
这是跑4轮Cinebench R23,用HWiNFO记录的CPU封装温度(红线)与功耗(蓝线)曲线。头两轮还是比较正常的:第一轮测试时,CPU封装功耗能够冲高到55W;随后缓缓下滑到35W附近;第二轮能冲高至42W左后,后续平稳在33W。这两轮测试的CPU封装温度一般在97℃附近跳动。这已经超出了去年不少轻薄本的性能释放水平。
而第三轮的情况就回到了轻薄本定位上——第三轮测试前半程还能坚持在35W的功耗水平上,但后半程骤降至27W附近,并滑向24W。此时CPU封装温度掉到了85℃附近。第四轮测试中,除了起初功耗曾一度冲高到41W,后续一路跌到了18W。CPU封装温度此时只有70℃。
18W这个数字在轻薄本上也不算罕见。但ThinkPad X13的起点高,基于其散热设计,抛开系统层面的其他限制不谈,这样的持续性能释放可以被称作保守。这对一些长时间的高负载应用不友好,比如说游戏、AI应用等。不过ThinkPad X13原本也不是用来干这些的,办公场景基本也不需要长时间高负载的持续性能输出。
但这的确将影响到我们下面要做的许多测试;也说明ThinkPad X13的确不适合用来搞AI——虽然是废话。
半小时的Cinebench R23循环测试结果与上述情况基本吻合。第一轮测试时,ThinkPad X13还能拿到10002分的成绩,但到了第15轮,就只剩下75%的性能水平了。这个程度的性能折损和一些极致轻薄本很相似,只不过并不是温度墙限制所致。
实际上,ThinkPad X13的突发性能供给还是给力的。我们在PCMark 10现代办公测试过程中多次观察到将近60W的瞬间功耗释放(主要发生在网页浏览、照片编辑测试中;要知道官配电源也就65W的功率)——这种突发性能释放也正是不少办公应用、网页浏览等场景需要的。说明联想对于这台本子的定位认知还是相当清晰。
我们认为这样的策略放在P系列轻薄本上是比较合理的。今年有不少P系列轻薄本的性能释放都堪称激进,比如同样用酷睿i5-1240P的联想Yoga Slim 7i Pro,据说PL1都设定在了50W,导致它比不少i7的多核性能都要高。这是越级要干H系列的活儿了,其效率在这种功耗下实则又不会多好。
用AIDA64进行30分钟的CPU压力测试(FPU压力测试),CPU封装的温度和功耗走势比较“蜿蜒”。ThinkPad X13的行为方式似乎倾向于在持续的全力性能输出一会儿后,就休息一会儿,等到了某个时间点再全力输出。散热系统在此期间其实也没什么压力。
全程有几个相对稳定的功耗输出点:35W、25W、18W;温度自然也随着功率的变化上下跳动。
另外还有一个从系统层面来看、ThinkPad X13可能并不怎么适合用来玩游戏的证据:
这是用AIDA64 + FuMark进行CPU和GPU的双重压力测试下,处理器封装功耗(蓝线)与温度(红线),以及CPU核心功耗(绿线)、GPU核心功耗(黄线)的变化情况。
CPU核心功耗全程都算相对稳定,维持在了13-19W之间;而GPU核心(核显)的功耗摇摆幅度就比较大了。受制于整体处理器的封装功耗限制,GPU核心起初也能分配到20W的功耗,但在测试进行到4分多钟的时候,骤降至2W附近;然后一段时间内在1-3W区间内工作,比手机GPU还节能(删去)…
这对于某些对CPU有性能需求的3D游戏而言,是会产生影响的,比如《原神》。不过联想在系统层面对此也有策略。Lenovo Vantage(类似于电脑管家)有个Game Boost模式,我们猜在游戏场景里可以规避这种情况的发生。后面的游戏测试也可印证这一点。
用轻薄本跑AI Benchmark
接下来就让我们用这个并不适合搞AI的笔记本,来娱乐性质地跑一跑AI Benchmark吧。这个测试的意义或许并没有那么大的另一个原因是,针对ThinkPad X13和MacBook Air,我们都没有启用GPU、NPU加速,单纯是用CPU跑的——AI Benchmark本身似乎也还暂时不支持苹果GPU、Intel GPU或其他单元的加速。
另外就是我们所用的瑞士苏黎世联邦理工学院的AI Benchmark,面向PC的测试还相当不完善,这个项目目前还处在Alpha阶段(AI Benchmark v.0.1.2)。虽然项目介绍里说只需要敲几行命令,用Python就能跑AI Benchmark,但我们在前期环境配置过程里还是遇到了各种问题,比如各组件的版本适配问题,像macOS系统还有内置Python和后装Python不同版本等等问题。好在所有测试都顺利跑完了。但基于该项目所处的早期阶段,以及部分项目我们的优化设定仍然不够,以下测试结果仅供参考。
作为对比,我们手上还有一台此前测过的ROG幻16——处理器是笔记本中的天花板酷睿i9-12900H(除了HX系列),还配了独显:笔记本版GeForce RTX 3070 Ti。那么一方面,我们用i9-12900H也跑了一遍AI Benchmark;另一方面则藉由CUDA和cuDNN,用GPU也跑一遍AI Benchmark,作为成绩参考。
所有测试基于TensorFlow库(TensorFlow 2.9),测试内容比较轻量。实际上TensorFlow 2.4在适配苹果ML Compute后,GPU加速似乎已经取得了阶段性成果。但我们的测试没有用上这部分资源。未来若还有机会,会在GPU加速方面做进一步的深入。
因为测试项目比较多,这里只列出了部分子项的测试结果。每个测试模型分为inference(推理)和training(训练)两部分成绩。
从结果来看,酷睿i9-12900H的成绩算是基本符合预期,在CPU中明显领先——毕竟在核心数、核心频率方面都有优势;而英伟达GeForce RTX 3070 Ti Laptop,作为GPU因为有着大量并行计算单元,能够以快N倍的速度在大量矩阵乘加运算中表现出巨大的性能优势。
酷睿i5-1240P的表现在此好像并不理想;苹果M1在部分子项里有比较亮眼的成绩(有macOS专项优化?)。前文我们提到,ThinkPad X13系统层面的持续性能输出不稳定,CPU经常出现性能颠簸,对这样时间稍长的测试应该会有大量的负加成。但这不是最重要的。
这类测试,软件和各类中间件在其中造成的影响极为巨大。所以我们再度借助Windows 11操作系统的WSL子系统跑个Ubuntu,在Ubuntu子系统里面再跑一次AI Benchmark。
这轮测试过程中,比较神奇的是,测试程序还特别提示了“此TensorFlow binary针对Intel的OneAPI Deep Neural Network库做了优化,所以会充分利用AVX2、AVX_VNNI和FMA指令”(不过我们知道12代酷睿禁用了AVX-512指令集);不知道为何用Windows的Powershell来跑就没有这项提示(TensorFlow版本问题?)。
大约因为有Ubuntu(和OneDNN?)的加持,这次ThinkPad X13的酷睿i5-1240P跑出来的成绩相较于单纯在Windows 11系统中的跑分有大幅提升。很多子项有超过1倍的性能进步。且在绝大部分项目上,相较于M1 CPU也有了显著优势。基于我们上次的跑分,理论上如果换用原生Linux,成绩还有提升空间。成绩汇总最终得到下图:
再次强调,前三者都是基于CPU的测试,且系统与平台均存在差异(注意i9-12900H和3070Ti Laptop是用Windows跑的)。未来我们会持续改进测试流程,并加入更多处理器或加速单元的测试。这次的测试在各方面的准备上都比较仓促,且测试程序能够反映实际性能的程度本身也相对初级,就权当是对CPU绝对性能的某个反映维度吧。
CPU与GPU理论性能测试
让我们回到轻薄本职能的正轨,以及ThinkPad X13办公和娱乐的正职。真实负载测试前还是要看看处理器的理论性能水平。首先是CineBench R23和Geekbench 5:
测试结果基本符合预期:酷睿i5-1240P的基频和睿频相较于更高定位的酷睿处理器都不算高,1.7GHz基频/4.4GHz睿频理论上会拉低单核性能表现——毕竟咱以前接触的那些高端处理器动不动就5GHz频率。不过和M1比,i5-1240P在Cinebench R23测试中依然有优势。至于多线程性能,这一代酷睿大幅增多核心的优势,在此时也就能显现出来。
另外,新版Blender Benchmark(3.2.1)渲染测试已经完全去掉了Iris Xe加速支持;加上此前我们提到,Blender对M1 GPU加速支持仍然很初级,所以这项测试,我们就也当作是CPU理论性能对比吧,结果如上。
GPU性能也算是我们之前吐槽苹果芯片的一个重点,即因为其生态发展的滞后,真实应用与GPU通用计算加速过程里,苹果GPU表现出来的效率是比较低下的。
不过一方面是酷睿i5-1240P并没有用上满血96EU的Iris Xe GPU,另一方面则是M1 GPU在堆料上明显更充沛(从GPU占据的die size可以看得出来,虽然这里参测的M1也是7核GPU的残血版),在3DMark这类图形理论性能测试里,M1一定是有优势的。
这项测试中,我们将华为MateBook X Pro 2021的测试成绩特别列了出来。这是一款更为纯粹的轻薄本,去年我们测过。MateBook X Pro 2021所用的处理器是11代酷睿i7-1165G7——这颗处理器内部堆了96EU的Iris Xe核显。
单纯从GPU执行单元数量来看,ThinkPad X13还少了16个EU,MateBook X Pro 2021应当有更优的表现才对。但实际情况却并非如此。这个结果能够充分说明,系统层面的设计对于芯片性能的发挥会造成多大程度的影响。也不光是MateBook X Pro 2021的处理器稳定性能发挥只有15W,应当还在于ThinkPad X13的LPDDR5内存更高的带宽对于核显性能发挥也有帮助。
游戏、办公和生产力创作表现
所以具体到游戏里,得到的测试成绩也大致相似:96EU也未必干得过80EU。但有所不同的是,像我们之前多次提过的,M1 GPU理论性能虽然更高,但由于其开发生态仍然不成熟,在更真实的应用场景里,其性能还很难得到充分发挥。所以MacBook Air在很多游戏里,体验甚至还不及80EU Iris Xe核显的ThinkPad X13。
这和芯片厂商之外的更多“中间商”也有很大关系,包括图形标准API、游戏引擎开发商、游戏开发者等角色。所以说软件生态的高下,是影响着是否浪费芯片die size和成本的根本问题。这一点也适用于前文聊到的AI。
当然,这一测试也算是图一乐,毕竟MacBook Air和ThinkPad X13都不是用来玩3A游戏的。不过ThinkPad X13在这项测试里的成绩还是超出了我们预期,总体表现在同等配置和定位的笔记本里都算中上水平。
值得一提的是,网游测试中,Steam平台的CS:GO此前在支持macOS后,M1似乎在游戏帧率上持续得到“神优化”,都能跑100+ fps了。可惜实际游戏体验并不好,卡顿和bug都不少,macOS到目前为止都不是游戏玩家们的选择。
多媒体创作方面,这次我们将Adobe四件套升级到了2022版。除了较大程度受制于CPU单核性能的Photoshop项目,酷睿处理器仍然有优势;像After Effects这类已经开始原生支持M1的测试项,测试成绩就得到了较大幅度的提升——就我们的测试来看,只是换个软件版本,这一项的提升幅度相比上一版似乎就有80%,还是充分说明了生态的重要性。
至于视频编辑工具Premiere Pro,这是苹果芯片的主场。我们也观察了Pr测试的分项——Pr测试对视频剪辑过程中,视频回放流畅性、视频编码输出速度、增加特效的性能等都有考察。Intel在特效这类对多核性能有需求的场景下得分仍然不错,丢分项主要在GPU上。
主流的办公测试工具,macOS都不支持,包括UL Procyon、PCMark。所以我们将MateBook X 2021的成绩拿来对比。可以看出今年的低压版酷睿i5,相较于去年低压版酷睿i7,在Word、Excel这两项上有了大幅提升——虽然如前文所述,这两台笔记本的性能发挥差异也是比较大的。
UL Procyon的测试项目还是相当复杂的,执行的Word、Excel脚本基本都算重度负载;所以说ThinkPad X13是真适合用来写Word和做Excel表格(删去)。
说“真实负载”还是少不了PCMark 10现代办公测试的。这个测试实际上恰到好处地吻合了ThinkPad X13这样的办公笔记本;其中测试分项包括应用启动速度、视频会议、网页浏览、表格、文档写作、照片编辑、视频编辑等。这才是ThinkPad X13的正职,而不是跑AI或者游戏……
PCMark 10更新到现在,还真的不单是CPU性能的反映。比如其中网页浏览、视频编辑、渲染与可视化都大量用到了GPU加速。从与MateBook X Pro 2021的这三项对比,也能看出96EU也未必就比80EU强。
目前为数不多能跨平台比日常真实负载的测试就是CrossMark了。CrossMark的测试大方向包含生产力、创作、响应。测试流程里能看到,其中的细分项包括照片编辑、照片整理、视频编辑、网页浏览等。
所以CrossMark本质上应该就属于PCMark 10的跨平台版。可惜CrossMark提供的测试细节比较少。单就CrossMark的测试结果来看,轻薄本日常最常见的这些项目里,ThinkPad X13的表现还是优于MacBook Air的。
除了后半部分的常规测试外,本文花了一些篇幅用两台轻薄本跑AI Benchmark,虽然实际价值不大,不过随着PC CPU厂商这两年在技术上的内卷,处理器核心数增多:从4、5年前的双核,到现在的12核,能干的活儿和干活儿的效率都已经不可同日而语,这也是我们现在能用轻薄本跑AI的基础。
另外随着传统芯片厂商都开始在GPU方面做大投入——比如Intel开始了独立GPU的布局,虽说本文并未就AI负载的GPU加速做多少尝试,而且CUDA目前仍然有着绝对优势,但这方面的竞争未来只会更加激烈。希望下次我们在做AI Benchmark测试的时候,处理器核显的加速都已经能开出来斗一斗了。