今年年头的CES随Intel和英伟达产品的轮番发布,还真有点儿2023新年PC风向标的意思——全年的电脑CPU、GPU重要产品都相继问世了。
既然是消费电子向的展览,英伟达在CES 2023之上公开新技术的主要方向还是PC显卡、图形技术及周边生态——Special Address主题演讲有一半的篇幅都给了GeForce显卡和游戏。其实Omniverse、汽车、机器人也都算是发布重点,后续我们也会对汽车相关发布做更详细的报道。
本篇就谈谈英伟达新年面向消费市场的图形产品及技术更新,这部分的发布主要包括:
- 面向台式机的显卡新品GeForce RTX 4070 Ti;
- 面向笔记本的40系(Ada Lovelace架构)显卡新品,涵盖GeForce RTX 4050、4060、4070、4080、4090;
- 面向笔记本的第五代Max-Q技术;
- DLSS 3游戏生态扩展情况;
其实跟游戏及个人生活密切相关的发布,还涵盖了GeForce NOW云游戏平台的一些重要内容,只不过严格意义上并不算消费向——而且暂时跟我们关系也不算大。除了GeForce NOW游戏与网络扩展,这部分的发布还包括:
- 发布RTX 4080 SuperPOD for GeForce NOW——也就是GeForce NOW云游戏的基础设施更新,每个用户可分配到64TFLOPS算力,英伟达说达到了Xbox Series X的5倍;
- GeForce NOW新增NVIDIA Reflex支持,面向云上竞技类游戏玩家;
- RTX 4080加入GeForce NOW Ultimate Membership会员计划;
- 汽车开始引入GeForce NOW,首批合作企业包括比亚迪、现代、极星。
聊聊2023年的高性能笔记本
有关面向台式机的GeForce RTX 4070 Ti显卡更新,这里不多赘述——RTX 4070 Ti是性能与上代旗舰GeForce RTX 3090 Ti性能差不多的显卡,网上已有的报道不少——对这一代Ada Lovelace架构感兴趣的同学,可以去看看去年我写的剖析文章。
不过此前英伟达对GeForce RTX 4070 Ti的宣传有个亮点,就是在达到类似RTX 3090 Ti性能水平的同时,功耗从450W降低到了285W。毕竟这代40系显卡不仅更新了Ada Lovelace新架构,而且工艺也换用了TSMC 定制4N。这次英伟达对于RTX 4070 Ti的性能和效率提升表述是这样的:相比于RTX 3090 Ti,在DLSS 3的加持下,RTX 4070 Ti在不少游戏中达成了1.8倍的性能提升,同时只需要将近一半的功耗。
当然450W÷2的GPU功耗水平仍然无法放进笔记本里,这是笔记本平台需要单独做GPU产品线的原因。对笔记本这种功耗半敏感型、有便携性要求的设备而言,系统设计的一大关键,就是GPU的效率水平。这其实也是阻碍轻薄本乃至部分全能本应用高性能GPU的关键。
英伟达在CES上说,笔记本平台这一代的Ada Lovelace显卡相比上一代,功耗降低了2/3。比如RTX 3070 Laptop原本需要120W的功耗达成的性能水平,这代架构只需要40W。这听起来就相当诱人了——不过猜测应该是算上了DLSS 3这类技术。因为以当代GPU芯片制造工艺和设计水平的单纯进化,是很难达成这么大跨步的效率改进的。
英伟达称GeForce RTX 40系笔记本GPU,达成了有史以来最大幅度的能效进步(3倍)。结合Intel这边13代酷睿处理器(Raptor Lake-S)此前提到只需要25%的功耗就达成接近12代酷睿性能水平的宣传,今年的高性能笔记本——包括游戏本、设计本、移动工作站之类的设备形态,应该会相当有看点。
如果单纯看性能,上面这张图是英伟达给出的RTX 40系显卡,相比上一代Ampere架构30系显卡,在不同游戏中的性能提升幅度。如果加上DLSS 3补帧方案,《赛博朋克2077》这种游戏的帧率提升能有最高4倍,虽然这张图也是完全没有给任何具体产品和画质设定信息。
比较让人印象深刻的是,英伟达在主题演讲中说:“受益于RTX 40系产品,14英寸笔记本能够做到以前绝对无法完成的工作,比如在Blender中的超快速3D渲染、比如Adobe Photoshop或Premiere Pro之类应用的AI工具使用等。”英伟达在PPT中标称这些设计类应用性能提升是2022主流笔记本的20倍——虽然不知道这20倍具体是怎么算的。
英伟达提到一点,说这代Ada Lovelace笔记本的性能可以达到PlayStation 5游戏机的两倍,但尺寸却仅有其1/6。惊叹于技术进步之余,还是不忘默默暗讽了隔壁A卡一把的。
以上是本次发布的面向笔记本平台的从RTX 4090到RTX 4050的GPU大略规格。其实光看这些也看不出个啥。从国外媒体给出的信息来看GeForce RTX 4090 Laptop显卡的die部分是AD103——和桌面RTX 4080一样。从上表来看,4090 Laptop用了AD103 die的一部分。其单精度算力和桌面级RTX 4070 Ti可能是差不多的水平——还是比RTX 3080 Ti Laptop有不小性能提升的。
英伟达也在会上宣布了部分确定的RTX 40系笔记本新品。其一是华硕ZenBook Pro 14,会有RTX 4070、4060、4050不同档可选;功耗是上代GPU的1/3;标称渲染性能,上代原本需要2.5小时的渲染工作,这一代据说只需要10分钟;999美元起售,2月底开售。
还有外星人Alienware x16,搭配的是RTX 4090或4080。这款本子在宣传上是玩4K游戏,以4K分辨率做AV1编码的游戏直播,以及以4K分辨率在Omniverse里做3D设计的。从Alienware这种本子的新发布,还是可以看到近些年笔记本性能的飞速发展。(顺带一提,今年Nvidia Broadcast更新中提到了一项RTX Video Super Resolution超分特性,是用AI来给网络视频流做超分,RTX客户端把1080p视频超分为4k;这个技术应该是可以做搭配的)
当然这两款笔记本只是代表,英伟达在会上给出了各OEM厂商的12款设计。这些都可以作为新一年GeForce笔记本的标版去看。今年的确可以期待一下笔记本设备的性能和效率提升——CPU和GPU同时的。
有关笔记本上的Max-Q
虽说PC市场目前还在下滑通道上,英伟达对笔记本市场似乎还是相当看好,他们给出的数据是去年1300万台14英寸笔记本售出,是2020年的2倍之多。“其中的95%都只能做基础的生产力工作。”也就是说,RTX显卡在笔记本市场上还有很大的渗透空间。如果RTX显卡能够以更低的功耗和尺寸塞进笔记本,则这个市场的增长潜力还十分巨大。
英伟达在笔记本上推Max-Q技术好些年了——Max-Q这个词在英伟达的定义里就指代速度快、轻薄、安静、高能效的笔记本。我们此前撰文谈过其中的部分技术:Max-Q本身是需要OEM厂商做系统设计配合的。
随Ada Lovelace架构的问世,Max-Q已经发展到了第五代。这一代Max-Q相比第四代主体上多了4个要点。首先是DLSS 3——也就是此前英伟达发布的AI超分+补帧技术方案,后文会对此做简单扩展;第二是超低电压GDDR6显存——英伟达说是跟内存制造商合作达成的方案;
其三是所谓的三段速控制(tri-speed memory control),“让GPU显存能够动态切换到全新的、更低功耗状态”。这主要相关的好像是一种更细粒度的内存控制方案,毕竟这年头的图形渲染算力密集型应用中,单显存功耗已经高到令人震惊的程度;
最后是Ada架构的片上存储优化。虽然具体不知道是怎么优化的,不过英伟达说这项举措达成了带宽翻番、容量增加16倍、提升了时钟门控。估计说的是L2 cache。
Max-Q的其他历史技术就不多着墨了,比如说Whisper Mode(控制风扇产生的噪音)、Battery Boost(基于AI实时优化GPU与CPU功耗用度、电池使用、画面质量、帧率等)、Dynamic Boost(CPU与GPU功耗动态管理)、Advanced Optimus(独显与核显连接切换)等,都属于功耗、噪音、性能等各方面做权衡的方案,也都包含在其中。
英伟达说在过去6年间,Max-Q达成了效率方面22倍的提升,也不知道具体是怎么算的。从英伟达给出的曲线图来看,第四代和第五代Max-Q的效率提升最为陡峭。就我们的理解,近两代效率提升的主要贡献来源都是AI技术:Battery Boost 2.0就是第四代引入的;而第五代Max-Q的DLSS 3本身也是AI技术的持续应用。
DLSS 3之中引入的AI补帧,或者说藉由Tensor core在渲染管线之后生成帧,应该是达成这一代GPU节能的重要组成部分。不过DLSS这样的技术,要在GPU世界真正达成英伟达理想中的效率提升,生态的铺开仍然是基础。
图形渲染算力之外的AI
英伟达DLSS最初是一种AI超分技术,也就是藉由AI技术和专门的AI加速单元,将原本低分辨率的游戏画面超分为高分辨率。AI超分是这两年的大热门,另一边的移动GPU厂商也在做这方面的技术。
第三代DLSS是在画面分辨率upscale之外,新增了一种AI插帧(frame generation)方案——且因为AI插帧流程位于渲染之后,这本质上属于CV技术,则反映到需要源源不断、实时输出帧的游戏中,就有概率显著增加延迟——所以DLSS 3把NVIDIA Reflex降低延迟的技术方案加了进来。
有关DLSS 3如何补帧,以及Ada Lovelace架构为此新增专用硬件单元之类的问题并不是本文要探讨的重点,我在此前的文章里有过比较详细的解释,有兴趣的同学可移步了解。从去年GTC上英伟达的演示来看,DLSS 3对于游戏插帧及缩短延迟的效果还是相当不错。
基于AI技术来摸到传统图形渲染单元堆料难以达成的高度,似乎也是现在摩尔定律放缓时代的主旋律。玩个游戏,有一半的帧、70%的像素不再是渲染出来的,而是“凭空”生成的,这件事情想想还是非常不可思议。不过效率提升与功耗降低是实打实的。
实际上此前英伟达宣传中提及Ada Lovelace架构显卡综合性能提升4倍,以及这次说笔记本显卡效率提升3倍,其中都需要DLSS 3或者说AI的参与。这件事情本身是需要行业和用户转变思路的:似乎到目前为止,仍有不少人认为对GPU而言,图形单元浮点算力提升才是实打实的;AI生成的那些东西都不能算升级。
须知Tensor core本身也是晶体管构建的,上层也需要各种中间件、库和其他软件方面的努力,自下而上的各环节打通难度并不比当年图形生态搭建过程简单。而且AI原本就是各行各业的发展未来。只要的的确确提升了体验,就应当将其视作行业技术发展正轨的一部分。
不过DLSS技术是否真正达成了“4倍”、“3倍”的提升,还是要看这个技术的普及程度如何。因为作为一种加速器,并不是开发者想让它加速,它就凭空给程序做加速的:DLSS要求开发生态接入。尤其这次的DLSS 3还新增了Reflex模块。所以英伟达现如今在任何活动上都不忘宣传DLSS生态的发展情况。
好在英伟达GPU的市场容量够大,这方面的基础还不错。英伟达在CES上说,目前接入DLSS的游戏和应用已经超过了250款。“开发者采用DLSS 3技术的速度,比以往任何英伟达技术的采用速度都要快,现有50款已经发布或很快就要发布的DLSS 3游戏。”DLSS 3的发布是去年9月份的事情,其后续发展还是值得做重点观察的:毕竟“4倍”和“3倍”的福利需要生态助力。
这次活动的主题演讲前半部分,英伟达给了挺多DLSS 3新游戏的宣传和演示——当然顺带也在宣传自家光追生态。这些即将发布或将加入DLSS 3技术支持的游戏包括《巫火(Witchfire)》《浩劫前夕(The Day Before)》《Warhaven》《王权与自由(Throne and Liberty)》《原子之心(Atomic Heart)》等。
期待2023年会有更多游戏接入到DLSS或者同类生态吧——人类要在游戏、3D设计方面完成接下来这个属于AI技术的性能跨越,并让大众接受其作为事实上的标准,仍然是需要时间的。
事实上DLSS 3的应用并不限于游戏这类应用,隔壁Omniverse生态也在积极宣传DLSS 3——即便开着光追做设计,也能借着AI技术来达成4K分辨率的画面品质。这对Omniverse或者未来的元宇宙而言,应该也都是一大吸引力吧。
有关图形技术话题,本届CES的发布实则还有不少。有兴趣的同学可以去关注一下今年Omniverse和NVIDIA Studio的更新,也相当有料:比如说去年大火、做游戏MOD的RTX Remix即将提供early access,能把简笔画基于AI转成细节丰富影像的NVIDIA Canvas,新增Canvas 360特性,以及前文就提到的NVIDIA Broadcast新增目光接触功能和虚光效果,还有RTX Video Super Resolution视频串流超分特性等等。
英伟达的全栈软硬件和不同应用方向,应该都是相辅相成的,PC GPU作为游戏显卡时是其中一环。与其说由于英伟达Ada Lovelace更新,今年的笔记本产品可能会和往年不同;倒不如说AI正在深刻变革这个时代,并且深入到每个人生活的方方面面。未来几年GPU的一大看点应该就在AI上。