GTC22|NVIDIA实现性能巨大飞跃,GeForceRTX40系列开创神经网络渲染新时代

英伟达NVIDIA中国 2022-09-21 19:21

NVIDIA 发布 GeForce RTX 40 系列 GPU,旨在为游戏玩家和创作者提供革命性性能,其中新旗舰产品 RTX 4090 GPU 的性能相较上一代提升最高可达 4 倍。


作为全球首款基于全新 NVIDIA Ada Lovelace 架构的 GPU,RTX 40 系列在性能和效率上都实现了巨大的代际飞跃,意味着实时光线追踪和利用 AI 生成像素的神经网络渲染的新时代已然来临。


NVIDIA 创始人兼首席执行官黄仁勋在 GTC 大会主题演讲的 GeForce Beyond 特别直播上介绍到:"RTX 光线追踪和神经网络渲染的时代正在全面展开,全新  NVIDIA® Ada Lovelace 架构将其推向了新的高度。”


"Ada 为游戏玩家提供了质的飞跃,并正在为完全基于仿真的未来游戏铺路。Ada 的性能是上一代产品的 4 倍,并为整个行业设立新标准。" 黄仁勋表示。


NVIDIA Racer RTX 是利用 GeForce RTX 40 系列 GPU 和 NVIDIA DLSS 3 创建未来游戏内容的例子


DLSS 3 可生成全新帧以加速游戏性能


黄仁勋还宣布 NVIDIA DLSS 3 --用于游戏和创作应用的 Deep Learning Super Sampling 深度学习超级采样是神经网络图形技术的下一次革命。这项由人工智能驱动的技术可以生成全新帧,从而大幅提高游戏性能。DLSS 3 也可以通过允许 GPU 生成全新帧来克服受 CPU 限制的游戏。


DLSS 3 即将加入到全球最热门的游戏引擎包括 Unity Engine 和虚幻引擎中。同时,DLSS 3 也已获得众多全球领先的游戏开发者的支持,超过 35 款游戏和应用即将支持该技术。



此外,RTX 40 系列 GPU 具有一系列新的技术创新,包括:


  • 流式多处理器具有高达 83 TFLOPS 的着色器能力,吞吐量超过上一代产品 2 倍。

  • 第三代RT Cores 的有效光线追踪计算能力达到 191 TFLOPS,是上一代产品 2.8 倍。

  • 第四代 Tensor Cores 具有高达 1.32 Petaflops 的 FP8 张量处理性能,超过上一代使用 FP8 加速性能的 5 倍。

  • 着色器执行重排序(SER)通过即时重新安排着色器负载来提高执行效率,从而更好地利用 GPU 资源。作为与 CPU 的乱序执行一样的重大创新,SER 为光线追踪带来最高可达 3 倍的性能提升,整体游戏性能提升可高达 25%。

  • Ada 光流加速器带来 2 倍的性能提升,使 DLSS 3 能够预测场景中的运动,使神经网络能够在保持图像质量的同时提高帧率。

  • 架构上的改进,与 TSMC 4N 定制工艺技术紧密结合,实现了高达 2 倍的性能功耗比飞跃。

  • 双 NVIDIA 编码器(NVENC)将输出时间至多缩短一半,并支持 AV1。OBS、Blackmagic Design DaVinci Resolve、Discord 以及更多的公司都已在采用 NVENC AV1 编码器。


全新光线追踪技术让游戏更具沉浸感


几十年来,用正确的物理照明来实时渲染光线追踪场景一直被认为是图形学领域的重大突破。同时,随着 3D 游戏和图形学不断努力提供对现实世界最精确地展现,环境和物体渲染的几何复杂性也在不断增加。


实现物理准确的图形需要巨大的计算能力。像《赛博朋克 2077》 (Cyberpunk 2077)之类的现代光线追踪游戏,我们对每个像素执行超过 600 次光线追踪计算来确定光照,这与四年前推出的首批光线追踪游戏相比,提升达 16 倍。


全新第三代 RT Cores 可以提供 2 倍的光线与三角形求交性能,以及两个全新的重要硬件单元。Opacity Micromap 引擎将光线追踪的 Alpha-Test 几何性能提升 2 倍;而全新的 Micro-Mesh 引擎可动态生成微网格,以产生额外的几何图形。Micro-Mesh 引擎可在提升几何图形丰富度的同时,不以传统复杂几何图形处理的性能和存储成本为代价。


RTX Remix、新 AV1 编码器重新定义创作


RTX 40 系列 GPU 和 DLSS 3 为所有 NVIDIA Studio 的创作者带来了助力。3D 艺术家无需代理就可以利用精确的物理学和逼真的材料渲染完整的光线追踪环境,并实时查看效果。


视频编辑和直播也因 GPU 性能的提升和全新第八代编码器中 AV1 的加入而得以提升。NVIDIA Broadcast 软件开发工具包有三个更新,包括:面部表情预估,眼神追踪,以及虚拟绿幕的质量改进,现已提供给合作伙伴。


包含在 NVIDIA Studio 全套创意应用中的 NVIDIA Omniverse 即将增加 NVIDIA RTX Remix。NVIDIA RTX Remix 是一个 MOD 平台,用于为经典游戏添加 RTX 效果。RTX Remix 允许 MOD 爱好者轻松捕捉游戏素材,利用强大的 AI 工具自动增强材质,并通过光线追踪和 DLSS 快速将游戏 RTX 化。


推出《传送门》(Portal)RTX版


NVIDIA Lightspeed Studios 利用 RTX Remix 重新设计了 Valve 的经典电子游戏《传送门》(Portal),该游戏被认为是有史以来最好的视频游戏之一。全景光线追踪和 DLSS 3 等先进的图形功能为该游戏带来了引人注目的全新画质和整体体验。恰逢《传送门》(Portal)15 周年,《传送门》(Portal)RTX 版免费 DLC 将于 11 月发布。


GeForce RTX 4090 和 4080:全新的终极 GPU


GeForce RTX 4090 GPU 是全新 GeForce RTX 40 系列的旗舰产品,是全球首款基于全新 NVIDIA Ada Lovelace 架构的游戏 GPU


RTX 4090 是全球最快的游戏 GPU,在功耗、静音、散热等方面技惊四座。在完整的光线追踪游戏中,与上一代采用 DLSS 2 的 RTX 3090 Ti 相比,采用 DLSS 3 的 RTX 4090 的性能提升可达 4 倍。在现代游戏中,RTX 4090 的性能提升高达 2 倍,同时保持了相同的 450W 功耗。RTX 4090 具有 760 亿个晶体管、16384 个 CUDA® 核心和 24 GB 高速美光 GDDR6X 显存,在 4K 分辨率的游戏中持续以超过 100 FPS 运行。RTX 4090 将于 10 月 12 日上市,建议零售价 ¥12999 元起。


NVIDIA 还宣布推出采用两种配置版本的 RTX 4080。

  • RTX 4080 16GB 拥有 9728 个 CUDA 核心和 16 GB 高速美光 GDDR6X 显存,在现代游戏中的性能可达 GeForce RTX 3080 Ti 的 2 倍;在较低功率下,性能比 GeForce RTX 3090 Ti 更强大。

  • RTX 4080 12GB 则拥有 7680 个 CUDA 核心和 12GB 美光 GDDR6X 显存,比上一代旗舰 GPU -- RTX 3090 Ti 性能更强大。


两种配置版本的 RTX 4080 将于 11 月上市,建议零售价分别为 ¥9499 元起和 ¥7199 元起。


购买途径


华硕、七彩虹、耕升、影驰、技嘉、映众、微星和索泰等顶级显卡供应商将在中国推出 GeForce RTX 4090 和 4080 GPU 标频版和超频版。 


NVIDIA 也将限量推出 RTX 4090 和 RTX 4080(16GB)FE 版,以满足渴望获得 FE 版设计的粉丝需求。


GeForce RTX 40 系列 GPU 还会通过宏碁,外星人,华硕,戴尔,惠普,联想和微星等全球领先 OEM 的产品出售。



即刻扫描下方海报二维码
观看 GTC 主题演讲重播。

评论
  • 百佳泰特为您整理2025年1月各大Logo的最新规格信息,本月有更新信息的logo有HDMI、Wi-Fi、Bluetooth、DisplayHDR、ClearMR、Intel EVO。HDMI®▶ 2025年1月6日,HDMI Forum, Inc. 宣布即将发布HDMI规范2.2版本。新规范将支持更高的分辨率和刷新率,并提供更多高质量选项。更快的96Gbps 带宽可满足数据密集型沉浸式和虚拟应用对传输的要求,如 AR/VR/MR、空间现实和光场显示,以及各种商业应用,如大型数字标牌、医疗成像和
    百佳泰测试实验室 2025-01-16 15:41 108浏览
  • 80,000人到访的国际大展上,艾迈斯欧司朗有哪些亮点?感未来,光无限。近日,在慕尼黑electronica 2024现场,ams OSRAM通过多款创新DEMO展示,以及数场前瞻洞察分享,全面展示自身融合传感器、发射器及集成电路技术,精准捕捉并呈现环境信息的卓越能力。同时,ams OSRAM通过展会期间与客户、用户等行业人士,以及媒体朋友的深度交流,向业界传达其以光电技术为笔、以创新为墨,书写智能未来的深度思考。electronica 2024electronica 2024构建了一个高度国际
    艾迈斯欧司朗 2025-01-16 20:45 25浏览
  • 随着消费者对汽车驾乘体验的要求不断攀升,汽车照明系统作为确保道路安全、提升驾驶体验以及实现车辆与环境交互的重要组成,日益受到业界的高度重视。近日,2024 DVN(上海)国际汽车照明研讨会圆满落幕。作为照明与传感创新的全球领导者,艾迈斯欧司朗受邀参与主题演讲,并现场展示了其多项前沿技术。本届研讨会汇聚来自全球各地400余名汽车、照明、光源及Tier 2供应商的专业人士及专家共聚一堂。在研讨会第一环节中,艾迈斯欧司朗系统解决方案工程副总裁 Joachim Reill以深厚的专业素养,主持该环节多位
    艾迈斯欧司朗 2025-01-16 20:51 30浏览
  • 随着智慧科技的快速发展,智能显示器的生态圈应用变得越来越丰富多元,智能显示器不仅仅是传统的显示设备,透过结合人工智能(AI)和语音助理,它还可以成为家庭、办公室和商业环境中的核心互动接口。提供多元且个性化的服务,如智能家居控制、影音串流拨放、实时信息显示等,极大提升了使用体验。此外,智能家居系统的整合能力也不容小觑,透过智能装置之间的无缝连接,形成了强大的多元应用生态圈。企业也利用智能显示器进行会议展示和多方远程合作,大大提高效率和互动性。Smart Display Ecosystem示意图,作
    百佳泰测试实验室 2025-01-16 15:37 115浏览
  • 实用性高值得收藏!! (时源芯微)时源专注于EMC整改与服务,配备完整器件 TVS全称Transient Voltage Suppre,亦称TVS管、瞬态抑制二极管等,有单向和双向之分。单向TVS 一般应用于直流供电电路,双向TVS 应用于电压交变的电路。在直流电路的应用中,TVS被并联接入电路中。在电路处于正常运行状态时,TVS会保持截止状态,从而不对电路的正常工作产生任何影响。然而,一旦电路中出现异常的过电压,并且这个电压达到TVS的击穿阈值时,TVS的状态就会
    时源芯微 2025-01-16 14:23 110浏览
  • 近期,智能家居领域Matter标准的制定者,全球最具影响力的科技联盟之一,连接标准联盟(Connectivity Standards Alliance,简称CSA)“利好”频出,不仅为智能家居领域的设备制造商们提供了更为快速便捷的Matter认证流程,而且苹果、三星与谷歌等智能家居平台厂商都表示会接纳CSA的Matter认证体系,并计划将其整合至各自的“Works with”项目中。那么,在本轮“利好”背景下,智能家居的设备制造商们该如何捉住机会,“掘金”万亿市场呢?重认证快通道计划,为家居设备
    华普微HOPERF 2025-01-16 10:22 122浏览
  • 一个易用且轻量化的UI可以大大提高用户的使用效率和满意度——通过快速启动、直观操作和及时反馈,帮助用户快速上手并高效完成任务;轻量化设计则可以减少资源占用,提升启动和运行速度,增强产品竞争力。LVGL(Light and Versatile Graphics Library)是一个免费开源的图形库,专为嵌入式系统设计。它以轻量级、高效和易于使用而著称,支持多种屏幕分辨率和硬件配置,并提供了丰富的GUI组件,能够帮助开发者轻松构建出美观且功能强大的用户界面。近期,飞凌嵌入式为基于NXP i.MX9
    飞凌嵌入式 2025-01-16 13:15 104浏览
  • 电竞鼠标应用环境与客户需求电竞行业近年来发展迅速,「鼠标延迟」已成为决定游戏体验与比赛结果的关键因素。从技术角度来看,传统鼠标的延迟大约为20毫秒,入门级电竞鼠标通常为5毫秒,而高阶电竞鼠标的延迟可降低至仅2毫秒。这些差异看似微小,但在竞技激烈的游戏中,尤其在对反应和速度要求极高的场景中,每一毫秒的优化都可能带来致胜的优势。电竞比赛的普及促使玩家更加渴望降低鼠标延迟以提升竞技表现。他们希望通过精确的测试,了解不同操作系统与设定对延迟的具体影响,并寻求最佳配置方案来获得竞技优势。这样的需求推动市场
    百佳泰测试实验室 2025-01-16 15:45 141浏览
  • 日前,商务部等部门办公厅印发《手机、平板、智能手表(手环)购新补贴实施方案》明确,个人消费者购买手机、平板、智能手表(手环)3类数码产品(单件销售价格不超过6000元),可享受购新补贴。每人每类可补贴1件,每件补贴比例为减去生产、流通环节及移动运营商所有优惠后最终销售价格的15%,每件最高不超过500元。目前,京东已经做好了承接手机、平板等数码产品国补优惠的落地准备工作,未来随着各省市关于手机、平板等品类的国补开启,京东将第一时间率先上线,满足消费者的换新升级需求。为保障国补的真实有效发放,基于
    华尔街科技眼 2025-01-17 10:44 36浏览
  •  光伏及击穿,都可视之为 复合的逆过程,但是,复合、光伏与击穿,不单是进程的方向相反,偏置状态也不一样,复合的工况,是正偏,光伏是零偏,击穿与漂移则是反偏,光伏的能源是外来的,而击穿消耗的是结区自身和电源的能量,漂移的载流子是 客席载流子,须借外延层才能引入,客席载流子 不受反偏PN结的空乏区阻碍,能漂不能漂,只取决于反偏PN结是否处于外延层的「射程」范围,而穿通的成因,则是因耗尽层的过度扩张,致使跟 端子、外延层或其他空乏区 碰触,当耗尽层融通,耐压 (反向阻断能力) 即告彻底丧失,
    MrCU204 2025-01-17 11:30 39浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦