高通 Adreno GPU 产品线已经在多代骁龙手机系统级芯片(SoC)中取得了显著成就。
高通的目标不仅限于手机市场,随着AI PC的机会,高通显然有更远大的抱负:进军更高功率和性能需求的领域。骁龙 X Elite,特别是其集成显卡Adreno X1,如何在竞争激烈的笔记本电脑市场中脱颖而出。
Adreno X1:命名和架构
高通为其最新的骁龙 X Elite 选择了一个新颖的命名方式,将其集成显卡称为 Adreno X1。尽管内部驱动程序依然称其为 Adreno 741,这意味着 Adreno X1 是 Adreno 730 的扩展版本。Adreno 730 曾在骁龙 8+ Gen 1 手机芯片中表现不俗,而 Adreno X1 则进一步提升了性能。
在测试过程中,Adreno X1 在三星 Galaxy Book4 Edge 上表现优异,而英特尔的 Core Ultra 7 155H 和 AMD 的 Phoenix 也在各自的设备中进行了对比测试。
● GPU 性能:频率与内存子系统
为了应对高性能需求的 PC 游戏,高通对 Adreno X1 的频率进行了提升。在骁龙 X Elite 的高端版本中,Adreno X1 可以达到1.5 GHz的频率,而在我们测试的版本中被限制在1.25 GHz。这一频率远高于 Adreno 730 在骁龙 8+ Gen 1 中的900 MHz。
高通还增强了内存子系统,采用了128位的LPDDR5X内存控制器,支持高达64GB的DRAM容量,确保了GPU的稳定运行。与英特尔的 Xe-LPG iGPU 和 AMD 的 RDNA 3 iGPU 相比,Adreno X1 在理论FP32吞吐量上表现非常接近。
● 着色器处理器与执行单元
Adreno X1 由多个着色器处理器(SP)组成,每个SP包含两个微着色器处理器纹理处理器(uSPTP)。这种结构类似于AMD的RDNA系列和Nvidia的Maxwell及Pascal架构。Adreno X1 使用大型64宽或128宽向量(波),这使得它在处理数据时能够保持较高的效率。
高通没有公开Adreno X1的最大占用率,但每个uSPTP都拥有192KB的寄存器文件容量,比Adreno 730的64KB提高了50%。然而,这一改进并未完全解决高端着色器程序在使用大量寄存器时的延迟问题。
内存访问与缓存结构
Adreno X1在内存访问和缓存方面也进行了优化。每个uSPTP专用的2KB纹理缓存确保了基本的内存访问效率。与AMD和英特尔的iGPU相比,Adreno X1在缓存带宽和延迟方面具有一定的竞争力。它新增了128KB的集群缓存,进一步优化了内存访问。
在内存带宽上,骁龙 X Elite 的理论带宽高于测试的其他芯片,但在实际测试中,英特尔和AMD的芯片在缓存带宽上表现更为优异。
Adreno X1配备了3MB的GMEM(片上内存),这在传统的平铺渲染模式下表现尤为出色。尽管GMEM在计算和光线追踪中不如缓存那样灵活,但它仍然提供了高带宽和低延迟的优点,特别适合高效的渲染任务。
在实际应用测试中,Adreno X1在FluidX3D等复杂计算任务中表现稍显不足,但在许多其他常见的图形和计算任务中,依然展示了强大的竞争力。高通通过对Adreno X1的架构改进,使其在FP32和FP16计算中表现尤为突出。
小结
高通骁龙 X Elite 的Adreno X1显卡通过提升频率、增强内存子系统、优化缓存结构等多方面的改进,展示了其在高性能集成显卡领域的竞争力。
尽管在某些特定任务中还存在一些不足,Adreno X1为高通进军高性能笔记本市场奠定了坚实的基础。在未来的图形处理和计算任务中,有理由期待Adreno X1能够带来更多的惊喜和突破。