当地时间9月20日晚间,英伟达 (NVIDIA)在GTC 2022大会上的“GeForce Beyond”环节,正式发布了RTX 40系列显卡。英伟达这次发布了三款GeForce RTX 40系列显卡,分别是GeForce RTX 4090以及GeForce RTX 4080的12GB和16GB版本。
(图自:英伟达,下同)
全新Ada架构
据英伟达CEO黄仁勋介绍,40系显示芯片将采用全新的“Ada”架构,这个名字也是为了致敬19世纪英国数学家埃达·洛夫莱斯(Ada Lovelace),她是著名英国诗人拜伦之女,建立了循环和子程序概念,也被认为是地球上最早的计算机程序员。
这款芯片最多可以包含760亿个晶体管和超过16384个CUDA核心,较上一代Ampere架构多70%。这得益于台积电的4N工艺和美光科技的GDDR6X显存,理论能效较上一代Ampere 8nm工艺提高一倍,意味着有更高的超频潜力。
新一代Ada架构
作为此次发布的RTX 40系列显卡核心,Ada Lovelace 核心将其中的SM多单元处理器、RT Core(光追核心)以及Tensor Core(可理解为AI核心)都进行了换代升级,其中的RT Core(光追核心)拥有两倍的光线与三角形求交性能,并且通过全新的引擎来减少了开销,Tensor Core则是提升了性能。
三款显卡的特性
黄仁勋强调,新一代RTX 4090旗舰显卡搭载了全球最快的游戏GPU,在完整的光线追踪游戏中,与上一代采用DLSS 2的RTX 3090 Ti相比,采用DLSS 3的RTX 4090的性能提升可达4倍。
在现代游戏中,RTX 4090的性能提升高达2倍,同时保持了相同的450W功耗。RTX 4090具有760亿个晶体管、16384个CUDA核心和24 GB高速美光GDDR6X显存,在4K分辨率的游戏中持续以超过100 FPS运行。
RTX 4080则有两个版本,16GB版拥有9728个CUDA核心和16 GB高速美光GDDR6X显存,在现代游戏中的性能可达GeForce RTX 3080 Ti的2倍;即使在较低功率下,性能也比GeForce RTX 3090 Ti更强大。12GB版则拥有7680个CUDA核心和12GB 美光 GDDR6X显存,其性能也比RTX 3090 Ti强。
有分析认为,12GB版的规格更像是RTX 4070 Ti级别或者70级别的规格,但是这次被老黄拉到了80级别。
每款显卡更多的具体参数规格目前尚未更多的信息流出,如RT核心数量、Tensor Core数量等信息,根据已知信息,汇总的RTX 40系列显卡部分关键参数如下供大家参考。
- RTX 4090使用AD102-300核心,台积电4nm工艺,显存拥有384bit显存位宽,显存带宽为1008GB/s。其核心频率基准频率为2230MHz,BOOST频率为2520MHz,设计TGP为450W;
- RTX 3080 16GB使用AD103-300核心,台积电4nm工艺,显存拥有256bit显存位宽,显存带宽为720GB/s。其核心频率基准频率为2210MHz,BOOST频率为2505MHz,设计TGP为350W;
- RTX 3080 12GB使用AD103-400核心,台积电4nm工艺,显存拥有192bit显存位宽,显存带宽为504GB/s。其核心频率基准频率为2310MHz,BOOST频率为2610MHz,设计TGP为285W。
光追性能再升级
Ada Lovelace 核心性能提升的一大关键是来自于SM多单元处理器方面的升级,英伟达全新引入了Shader Execution Reordering这一项着色器执行重排序技术,通俗的话说起来就是让GPU的处理过程也有了类似于CPU处理过程中的乱序处理能力,可以有效的提升性能,可获得2-3倍的光线追踪性能提升。
英伟达还着重介绍了依托新架构的DLSS 3技术。DLSS 3.0技术包含四项组件,而在其中最为关键的是新加入的AI帧生成器。而这一个技术相比较于DLSS 2.0此前采用AI在高帧率帧和低帧率帧中进行读取重渲染的过程而生成中间帧的过程有所区别,DLSS 3.0是利用深度学习的AI在像素级帧到帧方向的运动、速度信息基础上进行预测并通过一系列的处理在不影响原有游戏处理管线的情况下进行中间帧的生成,大幅度提高了游戏的帧数表现。这一个DLSS 3.0技术在英伟达的演示中,表现非常出色,也是此次发布的三张RTX 40系列显卡原有极大性能提升的一个关键。
简单来说,过去两代DLSS技术均通过AI算法提高渲染速度,而最新的DLSS 3已经进步到可以渲染插帧,并利用“光流场”技术,在无需GPU或CPU运算的就能提高渲染速度。
全新架构还搭载了Opacity Micromap引擎,将光线追踪的Alpha-Test集合性能提升2倍。全新的Micro-Mesh引擎则能够在不带来更多的BVH构建和存储资源消耗的前提下提升图形的丰富度。
最后,全新Tensor Core新增了Hooper FP8 Transformer Engine可以提供1.4 petaFLOPS张量处理性能。
为了展现新技术的效果,英伟达也在现场展示了对性能要求极高/优化糟糕著称的《赛博朋克2077》实机测试,在光追效果全开到最大的背景下,DLSS 3能够将画面帧数从20多帧提高至近百帧。黄仁勋表示,在《赛博朋克2077》这样的现代游戏上,显卡为了计算光的角度,对每个像素都要进行600余次计算,较2018年首次引入实时光追时提高了16倍。
据悉,华硕、七彩虹、耕升、影驰、技嘉、映众、微星和索泰等也即将推出GeForce RTX 4090和4080 GPU标频版和超频版。NVIDIA也将限量推出RTX 4090和RTX 4080(16GB)FE版。同时,GeForce RTX 40系列GPU还会通过宏碁,外星人,华硕,戴尔,惠普,联想和微星等OEM的产品出售。
价格也升级
在性能获得巨大升级的同时,这一代英伟达游戏显卡的价格也再创新高。
RTX 4090将于10月12日正式发售,价格为1599美元(12999元人民币),相比上一代RTX 3090 11999元的其售价涨价1000元。
RTX 40系列显卡售价
RTX 4080 12GB内存版本起售价为899美元(人民币7199元),而16 GB版本的起售价为1199美元(人民币9499元),两款4080显卡将在11月上市。值得一提的是,2020年RTX 3080系列发布时的官方起售价为699美元(人民币5499元),本次40系列的价格直接上了一个“档次”。
- 科技含量高的就可以肆意涨价