AMD在2月发布了新一代RDNA 4的RX 9070系列显卡,两款显卡都搭载了Navi 48芯片。
接下来还有RX 9060系列,将在2025年第二季度发布,搭载的是Navi 44芯片,至于两者之间存在的性能差距,AMD准备了RX 9070 GRE填补产品线空缺。
根据VideoCardz最新了解到的数据,RX 9070 GRE将搭载Navi 48 XL芯片,配备48个CU,也就是3072个流处理器,屏蔽了大概四分之一的GPU内核。
其加速频率达到2.79GHz,低于RX 9070 XT的2.97GHz,但是高于RX 9070的2.52GHz。
RX 9070 GRE搭配的是12GB显存,与之前的RX 9070 XT和RX 9070一样是GDDR6,不过速率会低一些,从20Gbps降至18Gbps。
这意味着在192-bit位宽下,RX 9070 GRE的显存带宽比起RX 9070 XT和RX 9070少了约三分之一,降至432GB/s。
在默认状态下,RX 9070 GRE的峰值FP32算力可达RX 9070的约95%,此外,用户还可以通过显存超频来进一步提升性能。
AMD预计将在未来几周内正式公布这张显卡,目前还不清楚是只在中国市场推出,还是会在全球发售。
随着RX 9070 GRE的规格参数曝光,外媒也对其性能进行了预估。
预估结果显示,RX 9070 GRE在光线追踪方面与NVIDIA的RTX 5060 Ti 16GB相当,但在Steel Nomad测试中,RX 9070 GRE的性能高出约34%。
这意味着,如果AMD RX 9070 GRE的定价比RTX 5060 Ti 16GB略高的话,那么这款显卡将在中端市场具有极强的竞争力。
作为游戏卡,如今的AI性能也非常关键。
NVIDIA AI之强大,不仅仅在于硬件性能好,更离不开生态优化适配,可以发挥最佳效率,AMD相比之下就差了很多,但也在努力追赶。
现在,Stability AI发布了ONNX框架优化的Stable Diffusion模型,在兼容的AMD Radeon显卡、锐龙集显上最多可以提速达3.8倍。
AMD表示,过去一年来,一直在与OSV、OEM、ISV厂商合作,优化AMD硬件上的AI应用,包括硬件设计、驱动程序、编译器、机器学习模型等等。
根据官方公布的数据,经过优化之后,SDXL 1.0、SDXL Turbo在AMD硬件上的推理性能,对比基础的PyTroch模型最高提升3.8倍,SD3.5则可提升最多2.6倍。
实际图片、视频生成应用中,SDXL 1.0、SDXL Turbo、SD3.5 Large、SD3.5 Large Turbo在RX 9070 XT显卡上的效率分别提升了3.1倍、1.5倍、3.3倍、2.1倍。
SDXL 1.0、SD3.5 Large、SD3.5 Large Turbo在锐龙AI MAX+ 395上的效率,则分别提升了1.4倍、3.3倍、3.0倍。
AMD硬件优化版的Stable Diffusion模型有一个特殊的“_amdgpu”后缀标记(比如stable-diffusion-3.5-large_amdgpu),现在已经可以在Stability AI或者Hugging Face上下载了。
你也可以使用AMD、TensorStack AI联合打造的最新版Amuse 3.0。
注意,AMD GPU驱动版本不要低于24.30.31.05预览版,或者等待即将发布的25.4.1正式版。