此前我们写过一篇文章综合评价联发科天玑9000芯片,提到这颗芯片作为明年要大举推向市场的旗舰SoC,有许多令人期待之处。最近一波天玑9000和骁龙8 Gen 1的抢跑成绩,也进一步验证了天玑9000明年定位旗舰的实力——已公开的这波结果也是此前我们没想到的。这其中比较令人惊喜的,是天玑9000的游戏表现……

此前我们写过一篇文章综合评价联发科天玑9000芯片,提到这颗芯片作为明年要大举推向市场的旗舰SoC,有许多令人期待之处。最近一波天玑9000和骁龙8 Gen 1的抢跑成绩,也进一步验证了天玑9000明年定位旗舰的实力——已公开的这波结果也是此前我们没想到的。

这其中比较令人惊喜的,是天玑9000的游戏表现。极客湾最近发布针对天玑9000工程机的测试表明,这颗芯片在《原神》这类高负载游戏中的持续性能和能效相当亮眼,在某些维度能够对隔壁竞品造成相当的压力。以天玑9000选配Arm Mali-G710 MC10规格,整体结果还是让我们十分意外的。

前不久我们刚刚汇总了一篇有关近两年手机GPU图形计算与游戏性能的文章:虽说抛开芯片的面积效益不谈,高通Adreno失去昔日优势地位已成定局,但今年10核心Mali-G710能有如此优秀的表现,实在是让人感叹技术竞争之无常。

当然,游戏作为抽象层级比较高的一类应用,性能、功耗、综合体验考验的并不单是GPU,而是整个系统层面的能力,包括CPU、操作系统、驱动和各种中间件。本文我们单纯从天玑9000芯片的角度,来尝试分析一下,天玑9000芯片是如何达成旗舰级的游戏体验的。这对我们理解当代移动平台的图形计算技术也有帮助。

先从总体来看天玑9000

首先还是看看有关天玑9000芯片的主要配置:

  • 制造工艺:TSMC 4nm;
  • CPU:1x Cortex-X2 3.05GHz + 3x Cortex-A710 2.85GHz + 4x Cortex-A510 1.8GHz;
  • GPU:Mali-G710 MC10;
  • APU:APU 590,4x 性能核 + 2x 通用核
  • ISP:Imagiq 790,最高支持90亿像素/秒吞吐,3.2亿像素摄像头;3个18bit HDR Fusion ISP;更先进的AI video架构;
  • 媒体与显示:MiraVision 790,支持8K AV1视频播放;显示输出支持最高WQHD+ @144Hz/FHD+ @180Hz;支持全球HDR新标准;
  • Modem:M80,5G Rel.16;支持下行载波聚合3CC最高300MHz频宽(3x100MHz)、7Gbps速率;上行R16 UL增强;UltraSave 2.0节电特性支持;
  • 其他连接:WiFi 6E(6GHz);蓝牙5.3;完整的GNSS支持;
  • 内存支持:LPDDR5x-7500Mbps;

CPU部分不再细说:是首个Armv9指令集方案,1+3+4的三簇设计算是常规,频率整体比隔壁竞品高,实则能够一定程度表现台积电N4工艺相比三星4LPE/4LPP的高频能力。

比较值得一提、相关天玑9000 的一大亮点在于存储子系统,CPU部分的L3 cache拉满到了8MB——这也是Arm此前发布Cortex-X2时推荐的L3 cache大小;以及System Level Cache增大至6MB。这两个值对于存储敏感型应用是很有价值的,比如说游戏。联发科在发布会上提到这两级cache的增大,能够帮助减少25%的带宽消耗。尤其对于移动GPU这类TBR基于tile延迟渲染的图形加速器而言,对性能、功耗都会有帮助。

天玑900010GPU够用吗?

既然主要谈游戏性能,那么GPU自然就非常重要了。天玑9000选配的是10核Arm Mali-G710。有关这颗GPU的架构改进,此前我们也已经撰文探讨过。从大方向来看,Mali-G710和G77、G78一样,都属于Valhall架构。Valhall架构的前两代,G78相比G77的改进的确比较小。

不过G710在shader核心、纹理单元方面都有规模上的显著扩大。比较大的变化在于每个shader核心的执行引擎(Execution Engine)数增至2个。而且执行引擎内部也有变化,在warp size和整体吞吐不变的情况下,处理单元分成了4组4-wide处理元素。如此一来,每核每周期FMA吞吐翻翻,而且能耗也有显著下降。

配套TMU纹理单元在吞吐上也翻倍了,且面积效益(性能密度)有了相当大的提升。当然并不能就此简单地说,Mali-G710的一个shader核心就相当于G78的两个shader核心;但规模扩大依然是显著的。

另外G710把job manager换成了所谓的CSF(Command Stream Frontend),处理调度和draw call。这个模块中,尤其固件层的引入能够针对一些较复杂的图形负载,提供更具弹性的性能表现,减少驱动开销、提升效率。另外还有指令模拟等新特性。

Arm官方给出Mali-G710的shader核心数可选配范围在7-16个,整体性能相较上代提升为20%。此前Mali-G78的满配核心数是24个。其实从纸面上来看,天玑9000的Mali-G710 MC10,在核心规格上堆得还是颇为保守的——当然此处我们并未加入shader核心频率的考量。

但有一点不要忘记,下图我们总结了近两年移动GPU性能的时候也发现,核心数有时候并不靠谱。比如说谷歌Tensor芯片,规格为20核心的Mali-G78,但其持续性能还不及只配了14个Mali-G78核心的三星Exynos 2100。

这是多方面原因造成的,包括工艺、峰值功耗,还有OEM厂商的系统设计与调度策略。Android平台的图形算力峰值性能价值其实并不是很大,且游戏总是更追求持续性能。毕竟玩游戏可不是每次都只玩1分钟。这两年Android阵营的旗舰芯片普遍陷入了峰值性能与持续性能严重不对等的怪圈,这种风气相当不好。

我们也拿到了天玑9000的GFXBench Aztec Ruins高画质离屏渲染测试(Vulkan)与Manhattan 3.1离屏渲染测试的性能成绩(持续性能暂缺)。这个结果还是相当出乎我们的意料。这表明Mali-G710的核心与配套加料还挺充分。或者说天玑9000 GPU的频率可能会定得比较高。

当然,如前文所述,这与CPU和整颗芯片的cache容量也有着莫大关联。至少就峰值性能水平来看,还是相当有潜力的。这就让人非常期待来年天玑9000手机的实际游戏表现。毕竟持续性能考验的还是OEM厂商的系统设计能力。

不过我们没有天玑9000在这两项测试中的平均功耗成绩。如此前撰文提到的,近两年的手机旗舰SoC在进行这两项GFXBench图形性能测试时,在某些点的瞬时功耗都能拉到10W以上,首轮跑分平均功耗也有8-9W。这对手机而言是相当惊悚的功耗水平,也是不可持续的。希望天玑9000不要延续这样的“传统”。后文还将就此做更多的介绍。

联发科针对天玑9000的GPU项目宣传数字,给出的都是实际游戏帧数。基于GFXBench测试成绩,以上列出的大部分主流手机游戏达成“满帧”就在意料之中了。

针对更多人关心的持续游戏性能,联发科此前也给出了《原神》这个高负载游戏的24分钟帧率曲线。通过网上目前可以看到的测试来看,天玑9000在功耗和发热方面当有相当出色的表现。

另外插个题外话,《原神》是个对CPU资源需求也比较大的游戏。影响游戏帧率的主要因素包括GPU性能、驱动程序效率、API效率、CPU性能、draw call、带宽等。对于《原神》这种包含大量对象的游戏来说,draw call数量庞大。Draw call是指CPU调用API,指挥GPU去工作的过程。CPU的性能对《原神》这样的游戏而言也格外重要。

天玑9000的Geekbench 5单核与多核性能成绩似乎是秒杀Android阵营全场的。

GPU这部分的最后,我们再花点笔墨聊聊 “动态光照”和“光线追踪”。此前《手机游戏与AI将走向哪儿?谈谈联发科眼中的未来技术趋势》一文中曾谈到过联发科对于全局光照和光线追踪的布局。

联发科在这次发布会上说:“天玑9000也支持最新的动态光照游戏技术。随着游戏的运行,支持更多动态光源,让光影更能真实表现,让手机也能运行3A品质的手游大作。”记得联发科在前不久的媒体沟通会上提到过,开放世界游戏的全局光照实现是颇具挑战性的。因为开放世界游戏的游戏场景动态变化频繁,场景对象和面数都可能很多。

上图中提到动态光照优化技术,实现带宽降低,也是基于移动GPU的延迟渲染特点达成的。主要是通过片内cache/buffer来减少数据搬运和光照计算。此前联发科说这样的优化能够“支持10倍数量的动态光源交互,节省20%带宽。”当然除了硬件微架构上的变动,也有计算机图形学方面的演进。这个例子应当算是比较典型的、移动平台节能提效方案了;也是此前联发科技术积累在天玑9000芯片上的一个重要体现。

此外在此前的沟通中,联发科提到已经在和Arm就光线追踪进行分阶段合作,以前的芯片产品就已经在为光追做准备,包括“渲染指令计算、缓存机制,现在是融入在了IP里面的”。

而且这次发布会上,腾讯游戏发言人也提到天玑系列5G芯片对于移动光追技术的布局,与腾讯之间的合作。联发科和腾讯共同开发的游戏光追“双引擎”(包括“光追引擎”和“降噪后处理引擎”)现在应该是能够为开发者所用的。这显然也是将来光追游戏布局的重要组成部分。

谈谈备受关注的游戏能效表现

如前文所述,光有图形计算的峰值性能对日常游戏体验而言,是没有参考意义的。此时天玑9000的功耗、发热,应该是更多用户关心的话题。

有关功耗,虽然我们暂时没有具体的数字。不过联发科在发布会上特别提到了“全局能效优化技术”。这个词估计是整颗SoC芯片,各种节电设计方案的叠加,不仅限于某一个IP,包括前文提到GPU微架构上的不少节电方案(以及后文还将提到的部分方案)。

联发科在天玑9000发布会上提到,天玑9000在轻载应用上(比如朋友圈、淘宝购物、浏览新闻等)相比竞品可省38%的功耗;中载的视频录像方面,节省功耗9%-12%;重载的游戏表现方面,“MOBA沙盒类游戏下,连续玩10分钟,可以比竞品省25%的功耗。而且手机表面温度更低”,“连续玩60分钟,较竞品在表面温度上可以降低5-9℃”。

虽说手机表面温度这种东西很大程度与OEM厂商的系统设计相关,但能够实现这一点,理论上应当是芯片层面微架构、工艺升级共同达成的。一方面说明Mali-G710升级比较靠谱,另一方面也说明联发科在做PPA权衡时,选择10个核心的配置(以及其他设计上的调整:比如说有可能联发科选择了GPU不同步时钟域的方案)、外加其他IP组成部分(包括CPU)都比较合理。

如果以上数据都可信,那么对于游戏综合体验,以及游戏高负载续航而言,天玑9000显然是个不错的选择。

有关“全局能效优化技术”,联发科说得还是比较抽象,未曾明言具体有哪些技术。猜想我们前面列举的包括采用台积电N4、图形计算的动态光照、GPU微架构设计上的调整,乃至并非本文重点的ISP、APU、modem(典型如UltraSave 2.0)等都涵盖其中。

有关游戏的节能,这里还能列举的一个典型技术就是超分(Super Resolution/Super Sampling)了。在普通用户市场上,英伟达DLSS开始宣传超分技术,让此类技术在游戏用户中家喻户晓。所谓的超分,也就是将低分辨率的画面upscale为高分辨率——如此一来,GPU只需更低的渲染开销,就能获得接近原生高分辨率的画质,起到提升游戏帧率、同时降低功耗的作用。

联发科的游戏超分技术也是此前就开始做布局的。具体方案是以GPU+APU来达成AI超分。技术思路和英伟达、Intel应当是比较类似的。这项技术的达成,与天玑9000上的APU 590自然是分不开的。此前我们撰文谈到过,联发科这次的APU在性能和能效方面,达成了对几乎所有手机芯片的碾压。当然这并非本文要谈的重点。

这项技术如果能够得到游戏开发者的积极响应,并在未来普及,那么以更省电的方式来游戏,甚至对于光线追踪的尽早普及,都将是十分有意义的。

低功耗是联发科在近两次发布会上反复提到的,强调低功耗是联发科技术上的特色和优势。“功耗”一词在整场发布会上被提到了大约25次。“在我们设计天玑9000初期,就考虑到功耗和发热的问题。我们的设计团队开始的时候,坚持采用功耗表现最好的台积电最新4nm制程。天玑9000在芯片架构上做了全面的架构优化,不管CPU、GPU、APU、ISP、modem等等的IP模块上做了最好的能效曲线。”而且也特别强调了“打游戏不发烫”。

因为篇幅原因,我们只能列出游戏相关的一部分低功耗技术。实际上像M80 5G modem,采用联发科的UltraSave 2.0省电技术,结合R16新标准的一些5G节能技术,“进一步降低27%的功耗”;再比如Imagiq 790 ISP,据说在4K HDR全功能录制视频时,功耗能做到“比竞品低30%”……

还有个HyperEngine游戏引擎

在现代图形计算技术上,其实还有很多低功耗相关的方案,比如说VRS。不过这类技术被联发科归类到了所谓的HyperEngine中的智能调控引擎方案里。VRS也就是可变速率着色,是指对于画面中没那么重要的对象(比如不怎么影响视觉体验的背景),可以不必做很精细的渲染,也就能够起到降低功耗的效果。

这张图给出了联发科AI-VRS(可变渲染技术)在开启和关闭之间,GPU资源占用情况。除此之外,还有资源调度优化方案,都能够不同程度地对游戏降低功耗起到帮助作用。

对联发科产品和技术熟悉的读者应该很清楚HyperEngine技术。这是联发科的“游戏引擎”。天玑9000将HyperEngine升级到了5.0版本。HyperEngine总共包括4个主要的组成部分,除了前面提到的智能调控引擎以外,还有网络引擎、操控引擎和画质引擎。

这几大引擎的提升除了画质引擎的光追支持,前文已经提过,这里网络引擎、操控引擎都是对游戏体验的加成。比如网络引擎强调优化极端场景下的时延问题。这类技术在2年多以前刚刚发布的时候,还是相当惊艳的,包括当时的WiFi不同频段,甚至加上LTE的并发;以及抗握姿干扰、复杂网络环境适应性等。

天玑9000的网络引擎在联发科的宣传中是“MediaTek FastPath专有协议快速通道+WiFi/蓝牙双连抗干扰2.0+智能天线2.0”,能够在遭遇弱网、握姿屏蔽和存在干扰的时候,以期尽可能维持在<100ms的网络延迟下。

操控引擎本次更新的是“智能屏显同步技术”。这项技术的本质是从触控到显示这个周期内,降低延迟的技术。其实这类技术和桌面PC平台游戏技术进化的思路是一致的,英伟达有个Reflex技术,是让PC和显示器更快地响应鼠标与键盘输入。这类细微体验差异,对电竞和高阶玩家是很有帮助的。

低延迟对游戏体验加成的另一个技术点,还在于天玑9000对蓝牙5.3的支持,加上蓝牙LE Audio以后,联发科表示蓝牙连接的音效延迟可以降低32%。这对用蓝牙耳机玩游戏的用户而言,应当是相当有价值的了。

关键的2022

本文主要谈的就是天玑9000在游戏方面的一些技术与努力。有关这颗芯片能谈的其实还有很多,比如说APU、ISP。这次发布会上,联发科还特别谈到了APU 590配套的开发环境与开发工具,及生态发展情况,是此前联发科不曾公开谈论过的(如下图)。

因为篇幅的关系,本文对天玑9000芯片相关游戏特性之外的其他构成不再多做介绍。

许多普通消费用户更关心的应该还是搭载天玑9000的终端产品。天玑9000手机应当会在明年一季度末上市。发布会上我们听到有关终端产品的信息主要包括

  • “OPPO下一代Find X旗舰系列,将首发天玑9000”;
  • “vivo将成为率先采用天玑9000旗舰芯片的终端厂商”;
  • “Redmi下一代旗舰K50也正蓄势待发”…“天玑9000是K50宇宙不可或缺的关键性能拼图”;
  • “未来将跟荣耀的新产品进一步深入合作”。

与此同时,京东也和联发科合作开启了“京东天玑旗舰店”。天玑9000的产品造势不可谓不盛。就如此前评论文章谈到的,联发科显然是要抓住天玑9000的机会,大肆开拓旗舰手机市场。所以这款产品的重要性是不言而喻的。

事实上,联发科当前已经是智能手机应用处理器出货量份额最高的品牌。在旗舰与高端市场上有所作为,将成为新的一年里,联发科实现营收增长、明确品牌地位的重要一役。天玑9000的存在有可能会成为旗舰手机市场洗牌的关键。在Nuvia成果问世以前,高通明年的日子会更不好过。

责编:Luffy Liu

本文为EET电子工程专辑原创文章,禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
阅读全文,请先
您可能感兴趣
尽管Imagination在RISC-V领域取得了一定的成就,但公司似乎认为继续投入资源于RISC-V处理器核心的开发并不符合其长期战略目标。Imagination决定终止其基于RISC-V指令集架构的GPGPU内核的研发工作,并将重心转向其擅长的GPU和AI领域......
Ken Glueck认为,美国2800亿美元的芯片法案所取得的成就,将被出口管制框架夺走,“因为在一项IFR中,它成功地将美国公司的全球芯片市场缩小了80%,并将其交给了中国。”
Intel在CES上发布了面向笔记本的酷睿Ultra 200H, 200HX, 200U系列,基本完善了这一代酷睿Ultra处理器产品线...这也是面向高性能笔记本的酷睿Ultra二代处理器初次亮相。
NVIDIA刚才在CES上发布了GeForce RTX 50系显卡,据说这一代的5070就能达到上代4090的性能水平...
刚才的CES主题演讲中,黄仁勋发布一款与众不同的“AI PC”,但它似乎又不是个PC...
随着制程技术的不断升级,芯片制造成本也大幅攀升。苹果从A7芯片的晶圆价格5000美元,到A17和A18 Pro芯片的18000美元,晶圆成本上涨了约300%。每平方毫米的成本从A7时期的0.07美元增加到A17和A18 Pro的0.25美元......
• 目前,iPhone在翻新市场中是最热门的商品,并将长期主导着翻新机的平均销售价格。 • 全球翻新机市场持续向高端化发展,其平均销售价格(ASP)现已超过新手机。 • 新兴市场是增长的最大驱动力,消费者对高端旗舰产品有着迫切需求。 • 由于市场固化和供应链的一些问题限制推高中国、东南亚和非洲等大市场的价格。 • 2024年,这些翻新机平均销售价格将首次超过新手机。
从全球厂商竞争来看,三季度凭借多个新品发布,石头科技市场份额提升至16.4%,连续两季度排名全球第一……
2025年1月9日,美国 拉斯维加斯丨全球瞩目的国际消费电子产品展(CES 2025)盛大开幕,来自世界各地的科技巨头与创新企业齐聚一堂共同展示最新的科技成果。中国高性能微控制器产品及嵌入式解决方案提供商上海先楫半导体科技有限公司(先楫半导体,HPMicro)闪耀登场,发布了专注于机器人运动与控制的高性能MCU产品——HPM6E8Y系列,为火热的机器人市场注入新的活力。
最新Wi-Fi HaLow片上系统(SoC)为物联网的性能、效率、安全性与多功能性设立新标准,配套USB网关,可轻松实现Wi-Fi HaLow在新建及现有Wi-Fi基础设施中的快速稳健集成
大疆发布DJI Matrice 4T旗舰无人机,售价38888元。该无人机可用于电力巡检、应急抢险、公共安全、水利林业监测等众多应用场景。DJI Matrice 4T的镜头模组拥有“六个眼”,除了广角
‌‌Jan. 9, 2025 产业洞察根据TrendForce集邦咨询最新研究,随着人型机器人迈向高度系统整合,并有望从工业场景走进家庭生活,前端的AI模型训练将更为关键,以满足更多后端理解与互动需求
手机充电器ic U6773S助推充电便利好享受面对手机存储空间不足的问题,我们可以从多个方面入手,清理缓存、卸载不必要的应用、移动文件至外部存储、使用云存储服务等等。面对手机充电器充电速度慢、效率低的
中国上海,2025年1月9日——中微半导体设备(上海)股份有限公司(以下简称“中微公司”,上交所股票代码:688012)和南昌中微半导体设备有限公司共同拥有的发明专利“一种化学气相沉积装置及其清洁方法
随着Mini/Micro LED技术发展和小间距产品成熟,LED显示行业在更多细分场景下的高增长潜力正在加速释放。Mini LED背光市场自2021年进入起量元年后,年复合增长率达50%;Micro
亚化咨询重磅推出《中国半导体材料、晶圆厂、封测项目及设备中标、进口数据全家桶》。本数据库月度更新,以EXCEL表格的形式每月发送到客户指定邮箱。中国大陆半导体大硅片项目表(月度更新)中国大陆再生晶圆项
日前,国家发展改革委等部门介绍了加力扩围实施“两新”政策有关情况,今年第一批消费品以旧换新资金810亿已经预下达。很多网友没有看懂具体政策,下面快科技给大家简单梳理一下,其实一句话来说就是:国四车、家
戴尔科技AI PC产品组合助力终端用户释放创造力并提高工作效率。 戴尔科技统一旗下产品组合品牌命名,旨在帮助用户更轻松、快速地找到相匹配的PC、配件及服务。 搭载英
点击蓝字 关注我们SUBSCRIBE to US如果你听说过深度伪造(deepfakes),即人们做着从未做过的事或者说着从未说过的话的高度逼真视频,你可能会认为这是一种可疑的技术发展成果。例如,它们
日前,奥康国际发布公告表示终止发行股份购买资产。根据公告,2024 年 12 月 24 日,奥康国际披露《关于筹划发行股份购买资产事项的停牌公告》,公司拟筹划以发行股份或支付现金的方式购买联和存储科技