华硕Tony大叔发布了RTX 5090/D的详尽评测跑分、液氮超频视频,其中还特别展示了RTX 5090/5090D所用GB202 GPU核心的内核照片,还是第一次见到。
GB202采用升级版台积电4NP工艺制造,和上代AD102使用的4N相比属于增强版,其实都属于5nm级别,只不过属于NVIDIA单独定制——这命名也是够乱的。
GB202集成晶体管多达922亿,比AD102 763亿增加了大约21%,而面积从616平方毫米增加到761平方毫米,幅度约为23.5%,换言之密度反而略微降低了。
GB202还是12组GPC,但是每组GPC内部的TPC数量从6组增加到8组,而每组TPC中依然是两组SM,每组SM则还是128个CUDA核心,满血核心总计24756个CUDA核心,RTX 5090/5090D都屏蔽了11组TPC,幅度约为11%。
可以确认的是,RTX 5090D并没有删减Tensor核心数量,还是680个,因此推测是通过底层软件限制了AI算力——不知道是否有可能破解?
计算单元中间大块区域是缓存。GB202的一级缓存从16MB增加到21.5MB,二级缓存从72MB增加到96MB,都和CUDA核心增加比例相同,也就是同步扩大。
计算单元中间竖向长条区域则是编解码器,满血核心拥有4组第九代编码引擎NVENC、4组第九代解码引擎NVEDC,RTX 5090/5090分别只开启了3组和2组。
底部边缘是PCIe 5.0 x16 PHY物理层和5条视频输出接口,顶部和左右边缘则都是GDDR7显存控制器,每组32-bit,一共16组构成了512-bit的位宽。
超频部分,Tony大叔将RTX 5090核心频率超到了3390MHz,显存等效频率则是34GHz。
实测3DMark Time Spy Extreme突破了3万分(世界第三),Fire Strike Ultra接近3.7万分,世界第一,Port Royal超过4.3万分,也是世界第一。
根据TechPowerUp的测试,英伟达RTX 5090显卡在PCIe4.0x16接口下的游戏性能损失非常小,仅为1%左右。
这一结果对于使用Gen 4 x16平台的用户来说是一个好消息,意味着在不支持PCIe5.0的系统中使用RTX 5090几乎不会影响性能。
具体测试结果显示,RTX 5090在PCIe4.0x16下的游戏性能损耗会随着分辨率的提高而相对降低,在4K分辨率下,游戏性能的损失浮动较为稳定。
在1080P、PCIe4.0x16下,RTX 5090的平均游戏性能损失约为1.07%;在2K、PCIe4.0x16下,损失约为1.29%;在4K、PCIe4.0x16下,损失约为0.74%。
不过在某些特定游戏中,性能损失可能会明显,例如,在《黑神话:悟空》中,RTX 5090在1080P、PCIe5.0x16下的帧率为112,而在PCIe4.0x16下,帧率降至98.7,性能损失约为11%,但在2K和4K分辨率下,性能表现则恢复正常。
对于那些因主板限制或使用外部解决方案而必须使用较少PCIe通道的用户,PCIe4 x4配置在1080p下的性能为89%,在1440p下为90%,在4K下为94%,性能有一定损失。
总的来说,如果使用的是PCIe4.0x16,可以放心使用RTX 5090,几乎不会有任何性能损失,较老的PCIe3.0 x16或PCIe4.0x4也很难发现明显的性能损失,尽管确实存在。
RTX 5090/5090D已经性能解禁,很快就会上市,这次供货之紧张绝对前所未有,比如英国顶级零售商OCUK就透露,他么手里只有几块RTX 5090,开卖的时候最多也就十几块,简直不能更离谱。
这种情况下,黄牛总是最亢奋的,已经跃跃欲试。
无论是美国的eBay,还是中国的京东,电商平台上已经有很多人开始叫卖RTX 5090/5090D,价格都相当离谱,动不动就是原价的几倍,eBay上有7000美元,京东上则有四五万元。
甚至还有监守自盗的。
eBay上有人发帖称,他是某零售商的员工,有购买RTX 5090的名额,但他自己不想升级电脑,所以将名额拿出来拍卖,标价是原价的两倍多,但保证拍到就能买到RTX 5090。
他还提出了非常苛刻的条件:产品如有任何缺陷都概不负责,功能问题视为制造缺陷同样概不负责,不能退货,也不能退款,最多帮忙联系厂家换货。
所以,如果你真的想要RTX 5090/5090D,耐心等等吧。