今年年头的CES随Intel和英伟达产品的轮番发布,还真有点儿2023新年PC风向标的意思。英伟达在CES 2023之上发布了面向笔记本的40系显卡。与其说由于这次更新,今年的笔记本产品可能会和往年不同;倒不如说AI正在深刻变革这个时代,并且深入到每个人生活的方方面面。

今年年头的CES随Intel和英伟达产品的轮番发布,还真有点儿2023新年PC风向标的意思——全年的电脑CPU、GPU重要产品都相继问世了。

既然是消费电子向的展览,英伟达在CES 2023之上公开新技术的主要方向还是PC显卡、图形技术及周边生态——Special Address主题演讲有一半的篇幅都给了GeForce显卡和游戏。其实Omniverse、汽车、机器人也都算是发布重点,后续我们也会对汽车相关发布做更详细的报道。

本篇就谈谈英伟达新年面向消费市场的图形产品及技术更新,这部分的发布主要包括:

  • 面向台式机的显卡新品GeForce RTX 4070 Ti;
  • 面向笔记本的40系(Ada Lovelace架构)显卡新品,涵盖GeForce RTX 4050、4060、4070、4080、4090;
  • 面向笔记本的第五代Max-Q技术;
  • DLSS 3游戏生态扩展情况;

其实跟游戏及个人生活密切相关的发布,还涵盖了GeForce NOW云游戏平台的一些重要内容,只不过严格意义上并不算消费向——而且暂时跟我们关系也不算大。除了GeForce NOW游戏与网络扩展,这部分的发布还包括:

  • 发布RTX 4080 SuperPOD for GeForce NOW——也就是GeForce NOW云游戏的基础设施更新,每个用户可分配到64TFLOPS算力,英伟达说达到了Xbox Series X的5倍;
  • GeForce NOW新增NVIDIA Reflex支持,面向云上竞技类游戏玩家;
  • RTX 4080加入GeForce NOW Ultimate Membership会员计划;
  • 汽车开始引入GeForce NOW,首批合作企业包括比亚迪、现代、极星。

 

聊聊2023年的高性能笔记本

有关面向台式机的GeForce RTX 4070 Ti显卡更新,这里不多赘述——RTX 4070 Ti是性能与上代旗舰GeForce RTX 3090 Ti性能差不多的显卡,网上已有的报道不少——对这一代Ada Lovelace架构感兴趣的同学,可以去看看去年我写的剖析文章

不过此前英伟达对GeForce RTX 4070 Ti的宣传有个亮点,就是在达到类似RTX 3090 Ti性能水平的同时,功耗从450W降低到了285W。毕竟这代40系显卡不仅更新了Ada Lovelace新架构,而且工艺也换用了TSMC 定制4N。这次英伟达对于RTX 4070 Ti的性能和效率提升表述是这样的:相比于RTX 3090 Ti,在DLSS 3的加持下,RTX 4070 Ti在不少游戏中达成了1.8倍的性能提升,同时只需要将近一半的功耗。

当然450W÷2的GPU功耗水平仍然无法放进笔记本里,这是笔记本平台需要单独做GPU产品线的原因。对笔记本这种功耗半敏感型、有便携性要求的设备而言,系统设计的一大关键,就是GPU的效率水平。这其实也是阻碍轻薄本乃至部分全能本应用高性能GPU的关键。

英伟达在CES上说,笔记本平台这一代的Ada Lovelace显卡相比上一代,功耗降低了2/3。比如RTX 3070 Laptop原本需要120W的功耗达成的性能水平,这代架构只需要40W。这听起来就相当诱人了——不过猜测应该是算上了DLSS 3这类技术。因为以当代GPU芯片制造工艺和设计水平的单纯进化,是很难达成这么大跨步的效率改进的。

英伟达称GeForce RTX 40系笔记本GPU,达成了有史以来最大幅度的能效进步(3倍)。结合Intel这边13代酷睿处理器(Raptor Lake-S)此前提到只需要25%的功耗就达成接近12代酷睿性能水平的宣传,今年的高性能笔记本——包括游戏本、设计本、移动工作站之类的设备形态,应该会相当有看点。

如果单纯看性能,上面这张图是英伟达给出的RTX 40系显卡,相比上一代Ampere架构30系显卡,在不同游戏中的性能提升幅度。如果加上DLSS 3补帧方案,《赛博朋克2077》这种游戏的帧率提升能有最高4倍,虽然这张图也是完全没有给任何具体产品和画质设定信息。

比较让人印象深刻的是,英伟达在主题演讲中说:“受益于RTX 40系产品,14英寸笔记本能够做到以前绝对无法完成的工作,比如在Blender中的超快速3D渲染、比如Adobe Photoshop或Premiere Pro之类应用的AI工具使用等。”英伟达在PPT中标称这些设计类应用性能提升是2022主流笔记本的20倍——虽然不知道这20倍具体是怎么算的。

英伟达提到一点,说这代Ada Lovelace笔记本的性能可以达到PlayStation 5游戏机的两倍,但尺寸却仅有其1/6。惊叹于技术进步之余,还是不忘默默暗讽了隔壁A卡一把的。

以上是本次发布的面向笔记本平台的从RTX 4090到RTX 4050的GPU大略规格。其实光看这些也看不出个啥。从国外媒体给出的信息来看GeForce RTX 4090 Laptop显卡的die部分是AD103——和桌面RTX 4080一样。从上表来看,4090 Laptop用了AD103 die的一部分。其单精度算力和桌面级RTX 4070 Ti可能是差不多的水平——还是比RTX 3080 Ti Laptop有不小性能提升的。

英伟达也在会上宣布了部分确定的RTX 40系笔记本新品。其一是华硕ZenBook Pro 14,会有RTX 4070、4060、4050不同档可选;功耗是上代GPU的1/3;标称渲染性能,上代原本需要2.5小时的渲染工作,这一代据说只需要10分钟;999美元起售,2月底开售。

还有外星人Alienware x16,搭配的是RTX 4090或4080。这款本子在宣传上是玩4K游戏,以4K分辨率做AV1编码的游戏直播,以及以4K分辨率在Omniverse里做3D设计的。从Alienware这种本子的新发布,还是可以看到近些年笔记本性能的飞速发展。(顺带一提,今年Nvidia Broadcast更新中提到了一项RTX Video Super Resolution超分特性,是用AI来给网络视频流做超分,RTX客户端把1080p视频超分为4k;这个技术应该是可以做搭配的)

当然这两款笔记本只是代表,英伟达在会上给出了各OEM厂商的12款设计。这些都可以作为新一年GeForce笔记本的标版去看。今年的确可以期待一下笔记本设备的性能和效率提升——CPU和GPU同时的。

 

有关笔记本上的Max-Q

虽说PC市场目前还在下滑通道上,英伟达对笔记本市场似乎还是相当看好,他们给出的数据是去年1300万台14英寸笔记本售出,是2020年的2倍之多。“其中的95%都只能做基础的生产力工作。”也就是说,RTX显卡在笔记本市场上还有很大的渗透空间。如果RTX显卡能够以更低的功耗和尺寸塞进笔记本,则这个市场的增长潜力还十分巨大。

英伟达在笔记本上推Max-Q技术好些年了——Max-Q这个词在英伟达的定义里就指代速度快、轻薄、安静、高能效的笔记本。我们此前撰文谈过其中的部分技术:Max-Q本身是需要OEM厂商做系统设计配合的。

随Ada Lovelace架构的问世,Max-Q已经发展到了第五代。这一代Max-Q相比第四代主体上多了4个要点。首先是DLSS 3——也就是此前英伟达发布的AI超分+补帧技术方案,后文会对此做简单扩展;第二是超低电压GDDR6显存——英伟达说是跟内存制造商合作达成的方案;

其三是所谓的三段速控制(tri-speed memory control),“让GPU显存能够动态切换到全新的、更低功耗状态”。这主要相关的好像是一种更细粒度的内存控制方案,毕竟这年头的图形渲染算力密集型应用中,单显存功耗已经高到令人震惊的程度;

最后是Ada架构的片上存储优化。虽然具体不知道是怎么优化的,不过英伟达说这项举措达成了带宽翻番、容量增加16倍、提升了时钟门控。估计说的是L2 cache。

Max-Q的其他历史技术就不多着墨了,比如说Whisper Mode(控制风扇产生的噪音)、Battery Boost(基于AI实时优化GPU与CPU功耗用度、电池使用、画面质量、帧率等)、Dynamic Boost(CPU与GPU功耗动态管理)、Advanced Optimus(独显与核显连接切换)等,都属于功耗、噪音、性能等各方面做权衡的方案,也都包含在其中。

英伟达说在过去6年间,Max-Q达成了效率方面22倍的提升,也不知道具体是怎么算的。从英伟达给出的曲线图来看,第四代和第五代Max-Q的效率提升最为陡峭。就我们的理解,近两代效率提升的主要贡献来源都是AI技术:Battery Boost 2.0就是第四代引入的;而第五代Max-Q的DLSS 3本身也是AI技术的持续应用。

DLSS 3之中引入的AI补帧,或者说藉由Tensor core在渲染管线之后生成帧,应该是达成这一代GPU节能的重要组成部分。不过DLSS这样的技术,要在GPU世界真正达成英伟达理想中的效率提升,生态的铺开仍然是基础。

 

图形渲染算力之外的AI

英伟达DLSS最初是一种AI超分技术,也就是藉由AI技术和专门的AI加速单元,将原本低分辨率的游戏画面超分为高分辨率。AI超分是这两年的大热门,另一边的移动GPU厂商也在做这方面的技术

第三代DLSS是在画面分辨率upscale之外,新增了一种AI插帧(frame generation)方案——且因为AI插帧流程位于渲染之后,这本质上属于CV技术,则反映到需要源源不断、实时输出帧的游戏中,就有概率显著增加延迟——所以DLSS 3把NVIDIA Reflex降低延迟的技术方案加了进来。

有关DLSS 3如何补帧,以及Ada Lovelace架构为此新增专用硬件单元之类的问题并不是本文要探讨的重点,我在此前的文章里有过比较详细的解释,有兴趣的同学可移步了解。从去年GTC上英伟达的演示来看,DLSS 3对于游戏插帧及缩短延迟的效果还是相当不错。

基于AI技术来摸到传统图形渲染单元堆料难以达成的高度,似乎也是现在摩尔定律放缓时代的主旋律。玩个游戏,有一半的帧、70%的像素不再是渲染出来的,而是“凭空”生成的,这件事情想想还是非常不可思议。不过效率提升与功耗降低是实打实的。

实际上此前英伟达宣传中提及Ada Lovelace架构显卡综合性能提升4倍,以及这次说笔记本显卡效率提升3倍,其中都需要DLSS 3或者说AI的参与。这件事情本身是需要行业和用户转变思路的:似乎到目前为止,仍有不少人认为对GPU而言,图形单元浮点算力提升才是实打实的;AI生成的那些东西都不能算升级。

须知Tensor core本身也是晶体管构建的,上层也需要各种中间件、库和其他软件方面的努力,自下而上的各环节打通难度并不比当年图形生态搭建过程简单。而且AI原本就是各行各业的发展未来。只要的的确确提升了体验,就应当将其视作行业技术发展正轨的一部分。

不过DLSS技术是否真正达成了“4倍”、“3倍”的提升,还是要看这个技术的普及程度如何。因为作为一种加速器,并不是开发者想让它加速,它就凭空给程序做加速的:DLSS要求开发生态接入。尤其这次的DLSS 3还新增了Reflex模块。所以英伟达现如今在任何活动上都不忘宣传DLSS生态的发展情况。

好在英伟达GPU的市场容量够大,这方面的基础还不错。英伟达在CES上说,目前接入DLSS的游戏和应用已经超过了250款。“开发者采用DLSS 3技术的速度,比以往任何英伟达技术的采用速度都要快,现有50款已经发布或很快就要发布的DLSS 3游戏。”DLSS 3的发布是去年9月份的事情,其后续发展还是值得做重点观察的:毕竟“4倍”和“3倍”的福利需要生态助力。

这次活动的主题演讲前半部分,英伟达给了挺多DLSS 3新游戏的宣传和演示——当然顺带也在宣传自家光追生态。这些即将发布或将加入DLSS 3技术支持的游戏包括《巫火(Witchfire)》《浩劫前夕(The Day Before)》《Warhaven》《王权与自由(Throne and Liberty)》《原子之心(Atomic Heart)》等。

期待2023年会有更多游戏接入到DLSS或者同类生态吧——人类要在游戏、3D设计方面完成接下来这个属于AI技术的性能跨越,并让大众接受其作为事实上的标准,仍然是需要时间的。

事实上DLSS 3的应用并不限于游戏这类应用,隔壁Omniverse生态也在积极宣传DLSS 3——即便开着光追做设计,也能借着AI技术来达成4K分辨率的画面品质。这对Omniverse或者未来的元宇宙而言,应该也都是一大吸引力吧。

有关图形技术话题,本届CES的发布实则还有不少。有兴趣的同学可以去关注一下今年Omniverse和NVIDIA Studio的更新,也相当有料:比如说去年大火、做游戏MOD的RTX Remix即将提供early access,能把简笔画基于AI转成细节丰富影像的NVIDIA Canvas,新增Canvas 360特性,以及前文就提到的NVIDIA Broadcast新增目光接触功能和虚光效果,还有RTX Video Super Resolution视频串流超分特性等等。

英伟达的全栈软硬件和不同应用方向,应该都是相辅相成的,PC GPU作为游戏显卡时是其中一环。与其说由于英伟达Ada Lovelace更新,今年的笔记本产品可能会和往年不同;倒不如说AI正在深刻变革这个时代,并且深入到每个人生活的方方面面。未来几年GPU的一大看点应该就在AI上。

责编:Illumi
阅读全文,请先
您可能感兴趣
面对AI时代带来的差异化趋势、软件应用及开发时间长、软硬件协同难、高复杂度高成本等挑战,国产EDA仍需不断探索和创新。
股东诉讼指控英伟达的首席执行官黄仁勋隐藏了公司记录性收入增长主要由其旗舰产品GeForce GPU的挖矿销售驱动,而非游戏销售,导致投资者对公司的盈利来源和风险敞口产生错误认知。
今年初的GTC上,黄仁勋就说机器人的“ChatGPT时刻”要来了。也就是说这波AI驱动的机器人热潮要来了...最近的ROSCon China 2024大会似乎也能看到这种迹象...
华为Mate 70系列中的Mate 70搭载了麒麟9010芯片,而Mate 70 Pro/Pro+/RS则首发了麒麟9020芯片。近日,百万粉丝的网红博主@杨长顺维修家 对华为Mate 70 RS进行了拆解……
常情况下,英特尔的CEO在65岁时退休,而现年63岁的基辛格突然被退休,让市场感到意外。为了确保平稳过渡,英特尔董事会立即着手寻找新的CEO人选……
虽然英特尔CEO基辛格突然退休的消息令市场感到意外,但投资者似乎将其解读为利好信号,英特尔甚至股价一度上涨。
目前,智能终端NFC功能的使用频率越来越高,面对新场景新需求,ITMA多家成员单位一起联合推动iTAP(智能无感接近式协议)标准化项目,预计25年上半年发布1.0标准,通过功能测试、兼容性测试,确保新技术产业应用。
中科院微电子所集成电路制造技术重点实验室刘明院士团队提出了一种基于记忆交叉阵列的符号知识表示解决方案,首次实验演示并验证了忆阻神经-模糊硬件系统在无监督、有监督和迁移学习任务中的应用……
C&K Switches EITS系列直角照明轻触开关提供表面贴装 PIP 端子和标准通孔配置,为电信、数据中心和专业音频/视频设备等广泛应用提供创新的多功能解决方案。
投身国产浪潮向上而行,英韧科技再获“中国芯”认可
点击蓝字 关注我们安森美(onsemi)在2024年先后推出两款超强功率半导体模块新贵,IGBT模块系列——SPM31 IPM,QDual 3。值得注意的是,背后都提到采用了最新的FS7技术,主要性能
近期,多个储能电站项目上新。■ 乐山电力:募资2亿建200MWh储能电站12月17日晚,乐山电力(600644.SH)公告,以简易程序向特定对象发行A股股票申请已获上交所受理,募集资金总额为2亿元。发
来源:IT之家12 月 18 日消息,LG Display 韩国当地时间今日宣布,已将自行开发的“AI 生产系统”投入到 OLED 生产线的日常运行之中,该系统可提升 LG Display 的 OLE
阿里资产显示,随着深圳柔宇显示技术有限公司(下称:“柔宇显示”)旗下资产一拍以流拍告终,二拍将于12月24日开拍,起拍价为9.8亿元。拍卖标的包括位于深圳市龙岗区的12套不动产和一批设备类资产,其中不
又一地,新型储能机会来了?■ 印度:2032储能增长12倍,超60GW据印度国家银行SBI报告,印度准备大幅提升能源存储容量,预计到2032财年将增长12 倍,超60GW左右。这也将超过可再生能源本身
 “ 担忧似乎为时过早。 ”作者 | RichardSaintvilus编译 | 华尔街大事件由于担心自动驾驶汽车可能取消中介服务,Uber ( NYSE: UBER ) 的股价在短短几周内从 202
扫描关注一起学嵌入式,一起学习,一起成长在嵌入式开发软件中查找和消除潜在的错误是一项艰巨的任务。通常需要英勇的努力和昂贵的工具才能从观察到的崩溃,死机或其他计划外的运行时行为追溯到根本原因。在最坏的情
点击蓝字 关注我们电网和可再生能源系统向着更智能、更高效的方向发展助力优化能源分配构建更加绿色和可靠的能源未来12 月 24 日 上午 9:30 - 11:302024 德州仪器新能源基础设施技术直播
极越汽车闪崩,留下一地鸡毛,苦的是供应商和车主。很多人都在关心,下一个倒下的新能源汽车品牌,会是谁?我们都没有未卜先知的超能力,但可以借助数据管中窥豹。近日,有媒体统计了15家造车新势力的销量、盈亏情
亲爱的企业用户和开发者朋友们距离2024 RT-Thread开发者大会正式开幕仅剩最后3天!还没报名的小伙伴,抓紧报名噢,12月21日不见不散!大会时间与地点时间:2024年12月21日 9:30-1