我们用MacBook Air和ThinkPad跑了跑AI，结果……-电子工程专辑



 0

 收藏

 分享

扫码分享到微信好友

 扫一扫

扫码查看更多文章

虽说用不带独显的轻薄本、办公本来跑AI测试还是挺不靠谱的，因为真的要做AI开发，显然不会用这样的配置来干这么重的活儿。但这两年的笔记本处理器动不动就12核心，光跑Cinebench渲染也是可惜了…倒不只是图一乐，这样的测试对各位预估同核心微架构、不同规模的CPU，应当也能有个概念。

上次Dell灵越14 Plus的体验文章里，我们谈到后续要做AI Benchmark；另有部分读者吐槽文中出现的一段Python代码测试能说明个啥；还有拉来对比的MacBook Air并非一个量级的笔记本……我们还是要填上这个坑。

最近拿到一台联想ThinkPad X13 Gen 3（以下简称ThinkPad X13）——这个系列素有小X1 Carbon之称。虽然在名义上常被人称作“办公本”或“商务本”，但其体态和定位都基本可明确为轻薄本。我们打算对这台轻薄本做个AI Benchmark。借着这篇文章，我们也能大致窥见今年的PC轻薄本和低压CPU，在性能表现上达到了怎样的程度，毕竟此前体验的都是采用标压处理器的“全能本”。

为对测试成绩有个大致的量级认知，我们仍然拉来MacBook Air（M1 7-core GPU, 16GB RAM, 256GB SSD）做主要对比对象。定价上，这台ThinkPad X13 Gen 3（酷睿i5-1240P，16GB RAM，512GB SSD）和最入门款的MacBook Air是差不多的，从选购的角度有对比的价值。

实际上在售的M1 + 16GB RAM配置MacBook Air价格仍然达到了9000+元。当然主要也是因为我们手上没有M2版MacBook Air的关系…何况虽说比的不是M2，但i5-1240P毕竟也不是Intel产品线里最强的芯片嘛。

除了MacBook Air之外，在某些测试里，本文也会加入2021款MateBook X Pro（上一代酷睿，酷睿i7-1165G7, 16GB RAM）和2022款ROG幻16（酷睿i9-12900H, 24GB RAM）的测试成绩作为参考。

MacBook Air（M1）和ThinkPad X3 Gen 3的体态很相近，价格也相似

这是台性能释放奇特的笔记本

在谈性能之前，照例先看看ThinkPad X13笔记本在系统层面的性能释放水平，以搞清楚它在轻薄本行列，在性能表现上是否具有代表性。

ThinkPad X13 Gen 3的主要配置信息如下：

系统层面，ThinkPad X13的亮点还是比较多的。比如说这块SSD是妥妥的高端货，和知名的980Pro同出一门。无线连接部分，这台本子支持接插nano-SIM卡，实现4G通信——算是出差商务人士的一大便利特性吧。

作为商务本，绝大部分配置项都算比较有诚意，而且镁铝合金机身的轻薄程度虽然还没到X1 Carbon的水平，但也已经相当不错。槽点也是有的，主要是这块300nit亮度的1080p屏幕，在满世界1440p的世界里已经比较落伍了；还有指纹识别比较难用……

从拆解可见，内存颗粒来自SK海力士；SSD则来自三星——从此前我们拆过的几台本子来看，现在OEM厂商给当代SSD加的散热配置也真是越来越豪华，上下都有导热界面材料

4G通信模块是上海移远通信的EM05-CE，这个模块还挺知名；内部芯片来源不明

WiFi模块则是Intel AX211

系统层面的体验依然不是本文的重点。核心部分的处理器Intel酷睿i5-1240P——这里的后缀P是今年I ntel 针对1 2 代酷睿新增的系列代号。Intel给P系列官方设定的TDP（基础功耗）是28W，属于低压处理器系列。

和更低功耗设定的U系列（15W/9W TDP）相比，P系列和H系列（45W TDP）用的是同一块die。换句话说，P系列属于H系列的下放；而U系列则在“低压”与“超低压”属性上更纯粹一些。所以Intel形容P系列在12代酷睿处理器的定位上是“高性能轻薄本”。我们手上这台ThinkPad X13所用的处理器酷睿i5-1240P，和同系列i7的主要差异在核心频率和cache大小上。

热管下面的应该就是酷睿i5-1240P处理器了

虽说不应对轻薄本的性能释放抱太大期望，不过ThinkPad传统的侧边散热鳍片都还在，那应该就比常规轻薄本的性能释放更好吧？

不过实际情况比较复杂（以下所有测试均插电，并采用Windows操作系统电源策略设定中的“最佳性能”；测试环境温度：24℃）：

这是跑4轮Cinebench R23，用HWiNFO记录的CPU封装温度（红线）与功耗（蓝线）曲线。头两轮还是比较正常的：第一轮测试时，CPU封装功耗能够冲高到55W；随后缓缓下滑到35W附近；第二轮能冲高至42W左后，后续平稳在33W。这两轮测试的CPU封装温度一般在97℃附近跳动。这已经超出了去年不少轻薄本的性能释放水平。

而第三轮的情况就回到了轻薄本定位上——第三轮测试前半程还能坚持在35W的功耗水平上，但后半程骤降至27W附近，并滑向24W。此时CPU封装温度掉到了85℃附近。第四轮测试中，除了起初功耗曾一度冲高到41W，后续一路跌到了18W。CPU封装温度此时只有70℃。

18W这个数字在轻薄本上也不算罕见。但ThinkPad X13的起点高，基于其散热设计，抛开系统层面的其他限制不谈，这样的持续性能释放可以被称作保守。这对一些长时间的高负载应用不友好，比如说游戏、AI应用等。不过ThinkPad X13原本也不是用来干这些的，办公场景基本也不需要长时间高负载的持续性能输出。

但这的确将影响到我们下面要做的许多测试；也说明ThinkPad X13的确不适合用来搞AI——虽然是废话。

半小时的Cinebench R23循环测试结果与上述情况基本吻合。第一轮测试时，ThinkPad X13还能拿到10002分的成绩，但到了第15轮，就只剩下75%的性能水平了。这个程度的性能折损和一些极致轻薄本很相似，只不过并不是温度墙限制所致。

实际上，ThinkPad X13的突发性能供给还是给力的。我们在PCMark 10现代办公测试过程中多次观察到将近60W的瞬间功耗释放（主要发生在网页浏览、照片编辑测试中；要知道官配电源也就65W的功率）——这种突发性能释放也正是不少办公应用、网页浏览等场景需要的。说明联想对于这台本子的定位认知还是相当清晰。

我们认为这样的策略放在P系列轻薄本上是比较合理的。今年有不少P系列轻薄本的性能释放都堪称激进，比如同样用酷睿i5-1240P的联想Yoga Slim 7i Pro，据说PL1都设定在了50W，导致它比不少i7的多核性能都要高。这是越级要干H系列的活儿了，其效率在这种功耗下实则又不会多好。

用AIDA64进行30分钟的CPU压力测试（FPU压力测试），CPU封装的温度和功耗走势比较“蜿蜒”。ThinkPad X13的行为方式似乎倾向于在持续的全力性能输出一会儿后，就休息一会儿，等到了某个时间点再全力输出。散热系统在此期间其实也没什么压力。

全程有几个相对稳定的功耗输出点：35W、25W、18W；温度自然也随着功率的变化上下跳动。

另外还有一个从系统层面来看、ThinkPad X13可能并不怎么适合用来玩游戏的证据：

这是用AIDA64 + FuMark进行CPU和GPU的双重压力测试下，处理器封装功耗（蓝线）与温度（红线），以及CPU核心功耗（绿线）、GPU核心功耗（黄线）的变化情况。

CPU核心功耗全程都算相对稳定，维持在了13-19W之间；而GPU核心（核显）的功耗摇摆幅度就比较大了。受制于整体处理器的封装功耗限制，GPU核心起初也能分配到20W的功耗，但在测试进行到4分多钟的时候，骤降至2W附近；然后一段时间内在1-3W区间内工作，比手机GPU还节能（删去）…

这对于某些对CPU有性能需求的3D游戏而言，是会产生影响的，比如《原神》。不过联想在系统层面对此也有策略。Lenovo Vantage（类似于电脑管家）有个Game Boost模式，我们猜在游戏场景里可以规避这种情况的发生。后面的游戏测试也可印证这一点。

用轻薄本跑AI Benchmark

接下来就让我们用这个并不适合搞AI的笔记本，来娱乐性质地跑一跑AI Benchmark吧。这个测试的意义或许并没有那么大的另一个原因是，针对ThinkPad X13和MacBook Air，我们都没有启用GPU、NPU加速，单纯是用CPU跑的——AI Benchmark本身似乎也还暂时不支持苹果GPU、Intel GPU或其他单元的加速。

另外就是我们所用的瑞士苏黎世联邦理工学院的AI Benchmark，面向PC的测试还相当不完善，这个项目目前还处在A lpha 阶段（AI Benchmark v.0.1.2）。虽然项目介绍里说只需要敲几行命令，用Python就能跑AI Benchmark，但我们在前期环境配置过程里还是遇到了各种问题，比如各组件的版本适配问题，像macOS系统还有内置Python和后装Python不同版本等等问题。好在所有测试都顺利跑完了。但基于该项目所处的早期阶段，以及部分项目我们的优化设定仍然不够，以下测试结果仅供参考。

作为对比，我们手上还有一台此前测过的R OG 幻 1 6——处理器是笔记本中的天花板酷睿i9-12900H（除了HX系列），还配了独显：笔记本版GeForce RTX 3070 Ti。那么一方面，我们用i9-12900H也跑了一遍AI Benchmark；另一方面则藉由CUDA和cuDNN，用GPU也跑一遍AI Benchmark，作为成绩参考。

所有测试基于TensorFlow库（TensorFlow 2.9），测试内容比较轻量。实际上TensorFlow 2.4在适配苹果ML Compute后，GPU加速似乎已经取得了阶段性成果。但我们的测试没有用上这部分资源。未来若还有机会，会在GPU加速方面做进一步的深入。

因为测试项目比较多，这里只列出了部分子项的测试结果。每个测试模型分为inference（推理）和training（训练）两部分成绩。

从结果来看，酷睿i9-12900H的成绩算是基本符合预期，在CPU中明显领先——毕竟在核心数、核心频率方面都有优势；而英伟达GeForce RTX 3070 Ti Laptop，作为GPU因为有着大量并行计算单元，能够以快N倍的速度在大量矩阵乘加运算中表现出巨大的性能优势。

酷睿i5-1240P的表现在此好像并不理想；苹果M1在部分子项里有比较亮眼的成绩（有macOS专项优化？）。前文我们提到，ThinkPad X13系统层面的持续性能输出不稳定，CPU经常出现性能颠簸，对这样时间稍长的测试应该会有大量的负加成。但这不是最重要的。

这类测试，软件和各类中间件在其中造成的影响极为巨大。所以我们再度借助Windows 11操作系统的WSL子系统跑个Ubuntu，在Ubuntu子系统里面再跑一次AI Benchmark。

这轮测试过程中，比较神奇的是，测试程序还特别提示了“此TensorFlow binary针对Intel的OneAPI Deep Neural Network库做了优化，所以会充分利用AVX2、AVX_VNNI和FMA指令”（不过我们知道12代酷睿禁用了AVX-512指令集）；不知道为何用Windows的Powershell来跑就没有这项提示（TensorFlow版本问题？）。

大约因为有Ubuntu（和OneDNN？）的加持，这次ThinkPad X13的酷睿i5-1240P跑出来的成绩相较于单纯在Windows 11系统中的跑分有大幅提升。很多子项有超过1倍的性能进步。且在绝大部分项目上，相较于M1 CPU也有了显著优势。基于我们上次的跑分，理论上如果换用原生Linux，成绩还有提升空间。成绩汇总最终得到下图：

再次强调，前三者都是基于CPU的测试，且系统与平台均存在差异（注意i9-12900H和3070Ti Laptop是用Windows跑的）。未来我们会持续改进测试流程，并加入更多处理器或加速单元的测试。这次的测试在各方面的准备上都比较仓促，且测试程序能够反映实际性能的程度本身也相对初级，就权当是对CPU绝对性能的某个反映维度吧。

CPU与GPU理论性能测试

让我们回到轻薄本职能的正轨，以及ThinkPad X13办公和娱乐的正职。真实负载测试前还是要看看处理器的理论性能水平。首先是CineBench R23和Geekbench 5：

测试结果基本符合预期：酷睿i5-1240P的基频和睿频相较于更高定位的酷睿处理器都不算高，1.7GHz基频/4.4GHz睿频理论上会拉低单核性能表现——毕竟咱以前接触的那些高端处理器动不动就5GHz频率。不过和M1比，i5-1240P在Cinebench R23测试中依然有优势。至于多线程性能，这一代酷睿大幅增多核心的优势，在此时也就能显现出来。

另外，新版Blender Benchmark（3.2.1）渲染测试已经完全去掉了Iris Xe加速支持；加上此前我们提到，Blender对M1 GPU加速支持仍然很初级，所以这项测试，我们就也当作是CPU理论性能对比吧，结果如上。

GPU性能也算是我们之前吐槽苹果芯片的一个重点，即因为其生态发展的滞后，真实应用与GPU通用计算加速过程里，苹果GPU表现出来的效率是比较低下的。

不过一方面是酷睿i5-1240P并没有用上满血96EU的Iris Xe GPU，另一方面则是M1 GPU在堆料上明显更充沛（从GPU占据的die size可以看得出来，虽然这里参测的M1也是7核GPU的残血版），在3DMark这类图形理论性能测试里，M1一定是有优势的。

这项测试中，我们将华为MateBook X Pro 2021的测试成绩特别列了出来。这是一款更为纯粹的轻薄本，去年我们测过。MateBook X Pro 2021所用的处理器是11代酷睿i7-1165G7——这颗处理器内部堆了96EU的Iris Xe核显。

单纯从GPU执行单元数量来看，ThinkPad X13还少了16个EU，MateBook X Pro 2021应当有更优的表现才对。但实际情况却并非如此。这个结果能够充分说明，系统层面的设计对于芯片性能的发挥会造成多大程度的影响。也不光是MateBook X Pro 2021的处理器稳定性能发挥只有15W，应当还在于ThinkPad X13的LPDDR5内存更高的带宽对于核显性能发挥也有帮助。

游戏、办公和生产力创作表现

所以具体到游戏里，得到的测试成绩也大致相似：96EU也未必干得过80EU。但有所不同的是，像我们之前多次提过的，M1 GPU理论性能虽然更高，但由于其开发生态仍然不成熟，在更真实的应用场景里，其性能还很难得到充分发挥。所以MacBook Air在很多游戏里，体验甚至还不及80EU Iris Xe核显的ThinkPad X13。

这和芯片厂商之外的更多“中间商”也有很大关系，包括图形标准API、游戏引擎开发商、游戏开发者等角色。所以说软件生态的高下，是影响着是否浪费芯片die size和成本的根本问题。这一点也适用于前文聊到的AI。

当然，这一测试也算是图一乐，毕竟MacBook Air和ThinkPad X13都不是用来玩3A游戏的。不过ThinkPad X13在这项测试里的成绩还是超出了我们预期，总体表现在同等配置和定位的笔记本里都算中上水平。

值得一提的是，网游测试中，Steam平台的CS:GO此前在支持macOS后，M1似乎在游戏帧率上持续得到“神优化”，都能跑100+ fps了。可惜实际游戏体验并不好，卡顿和bug都不少，macOS到目前为止都不是游戏玩家们的选择。

多媒体创作方面，这次我们将Adobe四件套升级到了2022版。除了较大程度受制于CPU单核性能的Photoshop项目，酷睿处理器仍然有优势；像After Effects这类已经开始原生支持M1的测试项，测试成绩就得到了较大幅度的提升——就我们的测试来看，只是换个软件版本，这一项的提升幅度相比上一版似乎就有80%，还是充分说明了生态的重要性。

至于视频编辑工具Premiere Pro，这是苹果芯片的主场。我们也观察了Pr测试的分项——Pr测试对视频剪辑过程中，视频回放流畅性、视频编码输出速度、增加特效的性能等都有考察。Intel在特效这类对多核性能有需求的场景下得分仍然不错，丢分项主要在GPU上。

主流的办公测试工具，macOS都不支持，包括UL Procyon、PCMark。所以我们将MateBook X 2021的成绩拿来对比。可以看出今年的低压版酷睿i5，相较于去年低压版酷睿i7，在Word、Excel这两项上有了大幅提升——虽然如前文所述，这两台笔记本的性能发挥差异也是比较大的。

UL Procyon的测试项目还是相当复杂的，执行的Word、Excel脚本基本都算重度负载；所以说ThinkPad X13是真适合用来写Word和做Excel表格（删去）。

说“真实负载”还是少不了PCMark 10现代办公测试的。这个测试实际上恰到好处地吻合了ThinkPad X13这样的办公笔记本；其中测试分项包括应用启动速度、视频会议、网页浏览、表格、文档写作、照片编辑、视频编辑等。这才是ThinkPad X13的正职，而不是跑AI或者游戏……

PCMark 10更新到现在，还真的不单是CPU性能的反映。比如其中网页浏览、视频编辑、渲染与可视化都大量用到了GPU加速。从与MateBook X Pro 2021的这三项对比，也能看出96EU也未必就比80EU强。

目前为数不多能跨平台比日常真实负载的测试就是CrossMark了。CrossMark的测试大方向包含生产力、创作、响应。测试流程里能看到，其中的细分项包括照片编辑、照片整理、视频编辑、网页浏览等。

所以CrossMark本质上应该就属于PCMark 10的跨平台版。可惜CrossMark提供的测试细节比较少。单就CrossMark的测试结果来看，轻薄本日常最常见的这些项目里，ThinkPad X13的表现还是优于MacBook Air的。

除了后半部分的常规测试外，本文花了一些篇幅用两台轻薄本跑AI Benchmark，虽然实际价值不大，不过随着PC CPU厂商这两年在技术上的内卷，处理器核心数增多：从4、5年前的双核，到现在的12核，能干的活儿和干活儿的效率都已经不可同日而语，这也是我们现在能用轻薄本跑AI的基础。

另外随着传统芯片厂商都开始在GPU方面做大投入——比如Intel开始了独立GPU的布局，虽说本文并未就AI负载的GPU加速做多少尝试，而且CUDA目前仍然有着绝对优势，但这方面的竞争未来只会更加激烈。希望下次我们在做AI Benchmark测试的时候，处理器核显的加速都已经能开出来斗一斗了。

责编：Luffy

本文为EET电子工程专辑原创文章，禁止转载。请尊重知识产权，违者本司保留追究责任的权利。

阅读全文，请先

消费电子嵌入式设计人工智能处理器/DSP 业界新闻

我们用MacBook Air和ThinkPad跑了跑AI，结果……

这是台性能释放奇特的笔记本

用轻薄本跑AI Benchmark

CPU与GPU理论性能测试

游戏、办公和生产力创作表现

杂志声明