9月2日,据外媒报导,英伟达公司(Nvidia)当地时间周二发布了一系列功能强大的游戏显卡,由于疫情原因,发布会地址还是选在了英伟达首席执行官黄仁勋(Jensen Huang)家中的厨房——远程视频发布。
发布会上,黄仁勋激动地表示:“20年后,我们再回首往事,会发现游戏从今天起腾飞。”
新发布的GeForce RTX 3090、3080和3070显卡将以比以往芯片版本高两倍的性能和几乎两倍的功率改善视频游戏图形。显卡GPU基于全球速度最快、效率最高的第二代 RTX 架构 Ampere,采用美光科技(Micron Technology Inc)的新存储技术设计,并且由三星电子(Samsung Electronics)代工生产。
系列显卡的价格从499美元到1499美元不等:
售价为499美元的RTX 3070的运行速度比售价为1199美元的RTX 2080 Ti快,并且比其最初的RTX 2070快60%;
售价为699美元的中端RTX 3080的运行速度比RTX 2080快两倍;
售价为1499美元的RTX 3090被称作“8K BFGPU”,运行速度比其旗舰产品Titan RTX快50%。
RTX 3090不光是性能巨兽、价格巨兽,体格上也是,足足占用了三个 PCI 槽,高度长度都秒杀如今所有显卡,黄仁勋在发布会视频中要拿起这块显卡都超级吃力。
这是首张能驱动 8K 游戏的显卡,可在 RTX 开启、DLSS 8K 和 HDR Shadowplay 功能下进行 8K 游戏,并且在大部份现代游戏中可达到甚至超越 60fps。不过现在 8K 的显示器或电视都非常稀少,小编暂时还没Get到这款万元级显卡的最佳用途。
和早前流出的消息差不多,RTX 3090 有着更坚固的机械结构,全新的低矮叶片弹簧,全新的12针电源接口,以英伟达的说法是能“提供更多组件和散热所需的空间”,但还是能通过专属的转接器与现有的 8 针脚电源相容。PCB电路板比上代缩小一半。
处理能力为30 Shader-TFLOP/s,超过 2080 Ti 的 13.4 TFLOPs 一倍,FP32浮点吞吐量是上一代的2倍。
同时具备第二代RT Core(光追核心) 计算能力为58 RT-TFLOPS,是上一代的2倍, 支持光线追踪、着色与计算。
第三代Tensor Cores(张量核心) 算力高达238 Tensor-TFLOPS,是上一代的2倍,能够更快速、更高效地运行AI技术,比如DLSS深度学习超采样抗锯齿。
以往当 GPU 需要图形数据时,都需要通过 CPU 呼叫来调用存取,而NVIDIA RTX IO实现了基于GPU的快速加载、游戏资源解压,输入/输出性能是传统硬盘存储的最高达100倍,并结合微软全新的Windows DirectStorage API,可以让GPU接手原本需要几十个CPU核心的工作,从而实现近乎瞬时的游戏加载,上次哪里退出现在就从哪里直接开始,而且帧率更高。
但这功能要等待游戏开发者实作,届时才能真的感受到 PCIe Gen4 SSD 对于游戏读取效能的提升。
RTX 3090 支持 HDMI 2.1,可用一根数据线连接到8K HDR电视,实现超高分辨率游戏。可以输出达 4K 120Hz 的画面,也内建了变动调节帧率的能力,如果显示器有对应的支持的话,就能避免撕裂了。这也是首款支持全新AV1解码器的独立GPU,8K HDR网络视频所需带宽比以往减少50%。
散热方案采用双轴流通式,一体成型前后双风扇设计(RTX 3090/3080),结合机箱风扇和风道,散热性能比上代提高2倍,风流增加55%,效率提高30%,静音提高3倍。
主流 GeForce RTX 3080 是旗舰级游戏卡,标准的 2 Slot、长高设计,并采用新一代散热设计,通过缩小电路板、正反双扇,以及更多的散热鳍片,确保显卡 GPU 与背面不会产生热点,并引导机壳散热气流。
GeForce RTX 3080 效能将是 RTX 2080 的两倍提升,具备着 30 Shader-TFLOPS、58 RT-TFLOPS、238 Tensor-TFLOPS,搭配着 10GB G6X 内存,等效频率19GHz,可以在4K分辨率下获得60FPS稳定帧率。
有趣的是,RTX 3090 和 RTX 3080 发布后,美国媒体报道称GPU 市场突然涌入大量二手 GeForce RTX 2080 Ti 显卡,价格甚至低于 500 美元。而在以往,这款显卡二手平均价格在 600-700 美元左右。
相对 3090 与 3080 的新设计,GeForce RTX 3070 维持类似的设计,但改回熟悉的正面双扇配置,并有着击落上代卡皇 RTX 2080 Ti 的效能。
GeForce RTX 3070 具备着 20 Shader-TFLOPS、40 RT-TFLOPS、163 Tensor-TFLOPS,搭配着 8GB G6X 内存。
RTX 3070定位在4K、2K游戏甜点卡,价格不到RTX 2080 Ti的一半,但是平均性能更高,同时比RTX 2070快足足60%。
英伟达长期以来一直与各种芯片制造商合作生产GPU,最近则更多依靠台积电(TSMC)生产最先进的芯片。
令人疑惑的是,本次三星将采用8纳米工艺,而不是最新的5纳米工艺制造新的GA102-300 GPU。三星 8 纳米工艺是在 2017 年开始量产,作为进军 7 纳米 EUV 所铺陈的技术,主要仍是延续 10 纳米工艺。虽然三星 7纳米其实也已量产,但比较起来,8 纳米更为成熟,所以才获得英伟达采用。
对此,英伟达方面也表示,他们与三星合作定制了工艺流程,因此英伟达芯片将比使用相同8纳米工艺的其他三星制造的芯片快约10%。
不过依之前的消息来看,英伟达用三星最大的原因应还是在于价格,据传三星产能还有不少空缺,可以近台积电 6 折的价格来抢单。
这颗GPU集成多达280亿个晶体管,拥有 10496 个 CUDA 核心,频率 1.70 GHz, “处理技术要复杂得多。我认为人们已经将其简化到几乎荒谬的程度,”黄仁勋在上个月的一次电话会议上对投资者说,并解释了为什么该公司并不总是使用最新的芯片制造技术。
英伟达的芯片使用多种技术来提高图形性能,例如使用人工智能处理器来预测光线在场景中如何移动,而不是手动计算每条光线。
最新的芯片还使用了美光自2006年以来一直在开发的显示存储技术GDDR6X,支持PAM4信令,提供760GB/s的超高带宽,可以将存储在英伟达芯片中的数据量增加一倍,达到24GB。
“与传统内存不同,GDDR6X具有无可比拟的数据速率,可以跟上游戏创新和数据密集型应用程序的步伐,”美光计算与网络业务部门高级副总裁兼总经理汤姆·埃比(Tom Eby)说。
定制化的工艺,加上最新显存技术,让Ampere GPU对比上代 Turing,有着 1.9x Perf/W 的性能功耗增长。尽管三星 8 纳米可能已经不差,但与台积电 7 纳米相比,裸晶尺寸肯定较大,所以有散热方面的疑虑,而且这次RTX 30系列全线采用的美光显存,此前也传出有相关问题。
最后,英伟达表示,GeForce RTX 3080将于9月17日上市,RTX 3090将于9月24日上市,而RTX 3070将在10月份的某个时候上市。在英伟达的第三财季于10月底结束之前,该公司将有大约6周的时间来销售新显卡。
截至当地时间周二美股收盘,英伟达股价上涨3.37%,报收于552.84美元,这是该股连续第三天创下历史新高。今年以来,该公司股价累计飙升135%。