有关Intel Arc显卡“更新驱动、性能就暴涨”的说法,应该是自前年Arc显卡发布之后就广泛传播的。去年我们也做过Arc A750显卡体验,证实了此前这款显卡在更新驱动后,对于不少老游戏的性能加成:也算是印证了更新驱动,约等于换张显卡的说法。
自这一代代号为Alchemist的Arc独立显卡问世以后,Arc驱动的确至少已经更新了几十个大版本:此前我们也打趣说,Intel软件团队估计是加班不少,才在短短这么点时间内更新了这么多的驱动。而且不只是用于支持游戏的驱动,还在于对AI推理达成支持的中间件。这年头做个显卡果然不似往年那么简单了。
最近我们拿到一款来自Sparkle的Arc A770 Titan OC Edition显卡。借此机会,一方面我们想看看为期一年半、几十个版本的驱动更新,对于Arc A770究竟带来了多大程度的游戏性能提升;另一方面也想窥探一下,现在的Intel独显拿来做本地AI推理,能做哪些事,以及AI的实际性能表现如何。
本文是其中的上篇,游戏体验测试部分;后续的下篇会做AI推理,包括LLM大语言模型、Stable Diffusion等在内的体验分享。
谈谈Intel的这颗旗舰显卡
Intel Arc系列显卡产品中,目前面向桌面平台最高端定位的就是Arc 7系里的Arc A770了。Sparkle的这块显卡则应当算是其中的最顶配:不仅显存上足了16GB,而且OC超频意味着核心频率相比于普通版本能达到更高。
桌面平台的Arc 7系和5系显卡,中央那颗GPU处理器都是ACM-G10 die,基于台积电N6工艺,总共217亿晶体管,die size 406mm²。相比我们之前体验过的Arc A750,A770开启的算力单元也更多。
相比A750的主要硬件资源差异见下表。另外,从Sparkle的官方资料来看,这颗Titan OC超频版Arc A770的核心频率可以达到2300MHz,比常规版高了200MHz。我们通过FurMark烤甜甜圈测试,看到HWinfo记录最高2400MHz的boost频率,板卡功耗最高230W。
简单说一说测试这枚显卡搭建的平台。主要是选配酷睿i7-14700K处理器,64GB DDR5-4800内存,以及华硕Prime Z690-P WiFi主板。虽然不是顶级平台,但和Arc A770搭配还是绰绰有余的。
此前Intel官方有提过,搭配近两代酷睿i5的CPU,能够看到Arc驱动程序带来最大程度的性能提升;搭配酷睿i7和i9当然也能看到提升,只不过幅度没那么大。
CPU:Intel Core i7-14700K
GPU:Sparkle Arc A770 Titan OC Edition
内存:2 ×32GB DDR5-4800
SSD:1TB三星980 PRO(外挂2TB三星T7 Shield)
主板:ASUS PRIME Z690-P WIFI(BIOS Ver.3202, 2024.2.21)
电源:航嘉GX800X
操作系统:Windows 11 Professional Build 22631.3235(23H2)
值得一提的是,我们搭的平台存在CPU散热瓶颈。从此前的稳定性测试可知,该平台下酷睿i7-14700K稳定状态大约可达到其峰值性能的93%左右(受制于散热风扇)。不过理论上这不会影响到游戏测试,因为基于数据追踪,大部分游戏测试的瓶颈还是在显卡上,CPU在游戏应用里也很难达到长时间的全核满载。
有关测试方法:对比3个版本的驱动
我们对于Arc A770的定位认知是,在2k(2560×1440)分辨率下玩大部分3A游戏大作,在特效全开时,应当做到至少平均60fps。所以我们的测试会给出1080p与2k分辨率,不同游戏在特效几乎全开的情况下,平均帧及部分1% low帧数据。
注意,这里的特效全开是指把游戏的图形设置项,除光线追踪以外,能开的尽量都开。某些游戏预设最高档画质(如“极高”或“最高”)其实是没有将特效子项全部打开或开到最高档的,比如《原神》最高档画质预设,“场景细节”和“全局光照”项目就没有拉到最高水平,则我们会将这些手动选择至最高。
对于诸如XeSS、FSR这类超分项目的选择,则主要基于游戏预设推荐。例如《赛博朋克2077》“超级”画质预设开启XeSS 1.2质量档、锐化0.5,则我们在体验测试时也会保留这类项目的选择。这么做对于玩家考虑购入Arc A770应该也会更有实际参考价值。
测试尽量选择内置benchmark程序的游戏——这对表现游戏全局性能需求是最有发言权的,毕竟我们自己选择测试场景会有偏颇。本次测试有3款游戏没有自带benchmark,分别是《原神》《英雄联盟》《半条命2》。
有些游戏自带的benchmark参考价值并不大,比如《无主之地2》——这款游戏在特效全开时,benchmark会把重点放在物理测试上,GPU占用率反倒没那么高;相应的,它不能反映这款游戏自身的游戏全流程性能需求。所以测试个体差异还是需要留意的。
另外更重要的是,本次测试主要是对比不同版本的Arc显卡驱动程序是否带来了性能提升,所以我们选了三个版本的驱动来做对比,分别是3490、4887、5333(31.0.101.x)。选择这三个驱动版本的原因是:3490是Intel于2022年10月发布的首个驱动版本;而4887则是2023年10月——也就是初版发布1年后的驱动更新;5333是截止到发稿前最新的驱动版本。
在测试游戏之前,按照惯例还是先跑一跑3Dmark的几个测试。因为我们发现,几乎所有驱动版本跑Time Spy, Fire Strike之类的测试得到的成绩都差不多,所以直接给结果(系统性能分,非单纯的图形分):
这三个测试分别对应了DirectX 12, DirectX 11与Vulkan API,在此作为Arc A770绝对图形最优性能的参考。
我们知道,受到图形API版本、游戏优化等条件影响,实际游戏——尤其是很多老游戏,很难达到其基准测试的理论最优性能。不过Arc显卡现在的情况真的比一年多以前好了太多。
2k分辨率+画质拉满,3A游戏基本能通吃了
我们知道Arc系列显卡在发布最初,对基于DirectX 12的新游戏普遍是很友好,也更能发挥性能的。毕竟以Arc显卡推出的时间点,Intel在写驱动时更偏向对新游戏的支持也合情合理。
所以不意外的,首轮对DirectX 12游戏的测试表现出三个不同版本驱动,游戏性能基本一致:
部分游戏的1% low帧测试,刻在文末查看
由于时间关系,我们测试DirectX 12游戏时偷了个懒(也因为穷…)。实际上这些被测游戏里,只有《赛博朋克2077》和《战争机器5》是原生基于DirectX 12开发的;其他游戏都是最早基于DirectX 11开发,后续才加入DirectX 12支持。
除了光追之类的新特性,相比于DX 11,DirectX 12所处的层级更低,也就更利于对硬件资源的利用。原生基于DirectX 12开发的游戏能够更充分地利用新版API的诸多新特性;而对原生基于DirectX 11开发、后来加入DirectX 12支持的游戏来说,游戏公司实际并不会完全重写游戏代码,而仅对其中一部分做出改动;而且开发之初也不会考虑特别面向DirectX 12,效率自然不一样。
不过如果和下文给出的这些游戏的DirectX 11版做对比,仍然很容易发现,DirectX 12有着明确更高的效率。这也算是技术迭代的优越性吧。
从针对DirectX 12游戏的测试不难发现两点。第一,Arc A770在2k分辨率下基本可以畅玩3A游戏;第二,至少在我们测试的游戏里,三版驱动更新对于DirectX 12游戏性能提升并不大——不过本次测试样本量小,从Arc驱动更新日志来看,实际包括《极限竞速》《阿凡达:潘多拉边境》等在内的DX12游戏都有获得过提升。
Arc显卡驱动相对DirectX 12游戏整体来说,帧率最初就是比较理想的,所以整体提升不大也在意料之中。
本次体验无意于测试光线追踪和AI超分技术,所以并没有将这些热门项目纳入考量。其中有关《消逝的光明2:重装上阵》为什么要开启光追做测试,主要是因为这个游戏区分DirectX 11和12两个API版本的方法,就在于是否开启光追。
值得一提的是,实际体验表明持续的驱动更新修复了3490这类早期驱动版本中存在的bug,比如《消逝的光明2》开启光追后,3490驱动会让游戏画面产生不少闪烁的彩块;我们过去的测试也发现早期驱动版本在部分游戏中存在贴图错误和对象显示不全等问题……现在这些问题基本已经不存在了。
DX11游戏体验进步很大
这次测试的重头戏其实是DirectX 11游戏。因为Intel去年8月份宣布在Q3’23 Update(31.0.101.4571)驱动更新中,重构了面向DirectX 11的部分。当时Intel说在更新驱动过后,DirectX 11游戏会获得平均19%的帧率提升,流畅度提升20%(1% low帧)。
后续则听闻在4885、5186等多个驱动版本上,更多DirectX 11游戏实现性能跃升——从近期的驱动更新日志来看,针对不同DX11游戏的优化工作还在持续。我们随机选了几个DirectX 11游戏做体验测试,好些是不在Intel的游戏优化列表中的:
不同游戏的性能提升幅度有较大差异。像《纪元1800》这样的游戏,驱动版本迭代带来的性能提升超过了50%;《原神》也有多达25%的性能进化。《文明VI》则很好地表现了游戏驱动更新带来的三级跳,4887相较3490驱动,性能提升18%;而最新的5333又在4887的基础上,让这款游戏的性能提升了25%...
某些游戏表现出的更多是体验层面的提升。比如《全面战争:战争之锤III》,1080p分辨率下,驱动更新带来了大约30%的帧率提升;测试全程的最低帧也从45fps提升到了63fps。这对体验提升的价值是相当大的。
某些游戏的提升在平均帧柱状图上并不能很好地表现出来。如《消逝的光明2》DirectX 11版,1080p画质下,最早版本驱动的最低帧不到60fps,4887驱动将这个值提升到了70fps,而5333驱动又将最小帧率值提至90fps——这个最小值甚至都超过了过去两个版本的平均帧。
另外,如果再回过头去比较某些游戏的DirectX 12版,也很容易发现DX12的优越性。比如《纪元1800》这款游戏的DirectX 12版,在1080p画质下,无论是哪个版本的驱动,Arc A770都能跑到125fps的帧率。而切换回DirectX 11,历史版本的两个驱动,帧率就只有80-90fps;最新版5333驱动才让帧率提到了大约120fps。
再比如《古墓丽影:暗影》,1080p分辨率DirectX 12版的平均帧稳定在115fps,而DirectX 11版即便上了最新驱动,也不到90fps的帧率。看来不光是Intel的软件工程师在加班,游戏公司的工程师们也是有在努力做事的…
再回头看看那些老游戏
最后照例还是要看看基于DirectX 9的老游戏。Intel给DirectX 9老游戏提速,或者说全面重构DirectX 9相关部分的驱动是在去年2月份开始,当时的Q1’23 Update驱动更新(4091)终于是让一大堆老游戏在Arc显卡上焕发了新生。
其实老游戏的平均帧率本身不是什么大问题,因为大部分老游戏的图形渲染负载对于现在的显卡来说是小意思。而体验提升更多的应该从帧生成时间的角度去考虑——不过受限于体验时间,我们无法细致到将frametime和GPU busy等相关数据做一一呈现。未来有时间我们再做这方面更为系统的考量。
不出意外的,对于《蝙蝠侠:阿卡姆之城》《武装突袭2:箭头行动》这样的游戏,新版本的驱动切实带来了成倍的平均帧提升;《彩虹六号:围攻》及《半条命2》这样的主视角射击游戏也有40-50%的性能提升。
《英雄联盟》似乎在这一年间多次更新过游戏版本以后,对3490这样的旧版驱动也显得更友好了(似乎以前只能跑200+帧)。而且不知为何,5333新版驱动在跑《英雄联盟》时,2k分辨率下的游戏帧率反倒比1080p分辨率下略高,跑了好多次都如此。这可能与游戏版本,及其缩放策略有关。
另外值得一提的是,《彩虹六号:围攻》是本次测试中唯一一个不仅有DirectX版,而且有Vulkan版的游戏,所以我们也测了其Vulkan版的表现。Vulkan的效率还是显著高于古早的DirectX 9的,所以游戏帧率也明显更高。
尤其3490版驱动时期,DirectX 9版只能跑176fps,Vulkan版就已经能跑将近290fps了,中间API层效率强了62%....毕竟Vulkan也是个低层级的API。看起来Arc驱动更新也带来了Vulkan效率的小幅提升。
最后给出上述某些游戏的1% low帧测试数据,仅供参考。
我们之所以没有对全部测试都做1% low帧统计,一方面是因为游戏内置benchmark的转场会大幅影响到MSI Afterburner这类工具的统计准确性,另一方面是部分老游戏的benchmark流程很短,某些系统层面的性能扰动会致使1% low帧数据准确性受到很大影响。
不过准确的1% low帧本身是基于frametime(而非简单的低帧率取平均)所作的统计,所以对反映游戏体验会更有价值。
就笔者个人来说,现在拿Arc显卡跑全高画质、4k分辨率的《原神》已经比半年前妥当了非常多。去年我们在做A750测试时还提过,可以玩4k原神,但有些勉强……这只是一个例子,这类变化,显然都是驱动更新带来的,尤其是这半年多以来,对DirectX 11游戏的优化。
针对这款Sparkle Arc A770 OC Edition显卡,在不久以后的下篇中,我们还将体验其AI性能表现——这也是AI PC话题大热以来,显卡们绕不过的一个话题了。
- 正常情况 待机48W 温度48度样子 1 你待机CPU有核显使用 可以降低功耗温度 2.你分辨率低于2K 刷新低于60HZ 待机功耗也会有明显降低 如果没有 基本随便你怎么设置待机功耗温度待机变化不大
- 未细看,5k 60hz DP 输出,系统限制状态 35W
- 这卡待机功耗多少啊