以前我们都说,高算力场景对功耗是不敏感的,毕竟真正对功耗敏感的是电池驱动设备。但现在PC台式机、数据中心服务器都在谈功耗和能效,大概和世界主旋律的碳中和有很大关系。今年的Computex上,英伟达谈到如果全球的所有AI、HPC和数据分析工作全都跑在英伟达的GPU服务器上,那么“我们预计每年能够节约超过12万亿Wh,相当于200万辆车一年的消耗”。几个月前的GTC上,Hopper架构GPU,以及Grace超级芯片的发布大概都有往这个方向靠的意思。
今年的Computex(以及ISC国际超级计算机大会),英伟达的新发布和更新主要在系统层面,以及和更多OEM厂商的合作。换句话说,这其实是一次英伟达生态发展成果分享会。虽说全球所有AI、HPC和数据分析工具全都部署英伟达GPU有些夸张,但生态扩张趋势也差不多是这么走的吧:这其中涉及到游戏、专业视觉、汽车、数据中心、机器人、HPC/AI等等。
RTX GPU生态的扩张:亲自下场比M1 Max
大方向上,英伟达的此次新发布主要还是分成了图形计算和数据中心两部分。图形计算相关的,当然不必寄希望于这么快就能看到GeForce RTX 40系列GPU了,这波发布还是生态资讯分享。
英伟达RTX GPU的两大看点在于对光线追踪和DLSS超分特性的支持上。前者基于光线追踪图形技术,通过反向模拟光线的传播,能够实现图形世界更逼真的光影效果;而DLSS则是基于深度学习的Super Sampling技术,可以将低分辨率的画面upscale为高分辨率。这样一来GPU就只需要渲染低分辨率的画面,最终用户也能看到接近原生高分辨率的画质了。
这两项特性是需要“生态”的,或者说需要由游戏或专业图形工具的开发者,做出对应的支持的。这也是RTX GPU真正能够获得用户黏性的基础。黄仁勋在会后的答记者问中说,现在已经有超过250款游戏加入到了RTX生态内,未来还会看到更多。本次英伟达宣布更多游戏加入到RTX生态中(似乎是12款),着重介绍的是《杀手3》以及《F1 22》;这些游戏的最新版应该都已经有了光追和DLSS选项。
除了光追和DLSS,本次“成果分享会”的另一个重点是Nvidia Reflex技术也扩充了合作伙伴团队。我们过去曾撰文介绍过Reflex——它是个面向电竞市场的技术,旨在降低交互延迟——就是从玩家点击鼠标,或敲击键盘操作,到屏幕画面做出响应之间的延迟时间。
Reflex生态涉及的组成部分就相对更为多样了,不仅包含面向游戏开发者的API——实现游戏引擎与渲染的实时“对齐”,而且也需要显示器与鼠标外设厂商做出支持。当前已经支持Reflex技术的游戏有38款,Reflex显示器22款,鼠标45款。
英伟达在主题演讲中提到,游戏《翼星求生(Icarus)》下个月就要对Reflex做出支持了。
Reflex生态的外设产品上,英伟达宣布华硕ROG Swift 500Hz游戏显示器加入Reflex家族。这款显示器采用一种“ETN面板”——应该是指Esports TN面板,“达成最大的动态清晰度”,据说这块面板的响应速度快60%;具备G-SYNC Esports Mode电竞模式支持(一种应用于竞技游戏的预设,包括gamma值调节增加暗部细节等);一个亮点是加入一种所谓的Esports Vibrance模式,据说能让游戏画面色彩更鲜艳;当然也不会缺了Nvidia Reflex Analyzer的支持,即对系统延迟进行检测的工具。
除此之外,英伟达也宣布了本次Computex上由OEM厂商发布的不少新款游戏与工作站级笔电,基于RTX GPU,包括华硕Zenbook Pro 16X、宏碁ConceptD5、联想Yoga Slim 7i Pro X等。
比较令人意外的是,在笔记本这个品类上,英伟达不多见地将自家GPU和苹果M1 Max(MacBook Pro 16”)做了比较,如上图所示。也算是给了苹果在自家发布会任意吊打GeForce RTX GPU的一点回敬吧——毕竟早前发布M1 Max的时候,苹果可是亲口说出其GPU性能媲美笔记本版GeForce RTX 3080的。如我们此前的评测所说,M1 Max的多番落败,与苹果GPU生态落后还是有很大关系。
Omniverse的几个更新:元宇宙得添砖加瓦
图形计算相关的技术更新上,当然不只是合作伙伴的增多。Omniverse也有新能力的引入。Omniverse作为目前英伟达图形计算生态内最重要的平台之一,加速建设原本也是这家公司的常态了。
• 比如说Omniverse Cloud新增了“Simple Share”特性,用户点击一下就能把自己的Omniverse场景发给其他人查看。这原本就是Omniverse Cloud的精髓所在——Omniverse Cloud的本质是将Omniverse云化,在非RTX GPU设备上,也能用Omniverse。
• Omniverse Audio2Face新增了一个叫Audio2Emotion的东西——这是个AI动画特性,基于一个简单的音频文件,就能通过AI生成真实的面部表情;
• Omniverse XR进入beta测试版,这是虚拟现实方面的Omniverse助力;
• Omniverse Machinima更新——Machinima是藉由现有的3D素材(包括各类游戏、动画等),二创电影、短片的平台。本次更新包括加入更多的内容、工具以及素材。
数据中心生态更新:Grace CPU要开始卖了
说完图形计算,就该是英伟达当前营收的另一个支柱:数据中心业务了。更新没多久的英伟达FY2023 Q1财报显示,其数据中心业务季度营收37.5亿美元,同比增长83%——营收占比已经超过了游戏业务(FY2022 Q4就已经超过)。
这一财季对英伟达而言是非常重要的一个季度,因为英伟达在本季发布了很多重磅级产品,包括Hopper架构的新一代H100 GPU,基于NVLink-C2C互联的Grace CPU超级芯片,Spectrum-4 400Gbps交换机、Nvidia OVX——应用于Omniverse数字孪生的可扩展服务器参考设计,医疗设备行业的Clara Holoscan MGX平台等等。
这次Computex上,相关其数据中心业务的更新包括有:
第一,宣布Grace参考设计,就是应用Grace CPU超级芯片(2颗Grace CPU)的一些系统级设计,包括应用于云图形与游戏的CGX,应用于Omniverse数字孪生的OVX,应用于HPC的HGX,以及更偏向于AI计算的HGX。这几个系统全部加上了英伟达自己的Grace CPU超级芯片(2颗Grace CPU封装在一起超级芯片)和BlueField-3 DPU,部分为Grace Hopper芯片CPU+GPU方案。
比如HGX根据不同应用就分成了HGX Grace和HGX Grace Hopper,分别对应于采用Grace CPU超级芯片的版本,以及采用Grace Hopper芯片(Grace CPU+Hopper GPU)的方案。两者都是为2U机架设计的。
对于HGX参考设计,英伟达也面向下游客户提供Grace Hopper与Grace CPU超级芯片模组,以及对应的PCB参考设计。合作伙伴可以基于自己的系统架构来修改英伟达的参考设计,便于打造基于Grace的服务器。
这波宣布的OEM合作伙伴有6家。华硕、富士康工业互联网、技嘉、超微、QCT、纬颖科技等会成为首批Grace系统供应商。Grace系统预计将在明年上半年出货。
第二,发布面向主流服务器的Nvidia Liquid Cooled GPU,也就是加了液冷方案的PCIe板卡GPU。英伟达在主题演讲之前的媒体活动中提到,数据中心大约40%的能耗是用在散热上的,所以英伟达很自然地想到了自己出个液冷方案,应用于数据中心PCIe GPU,“直接芯片液冷散热”。
英伟达表示,这项技术能够达成30%的能耗降低;而液冷数据中心在相同空间下现在就能装下以前2倍的性能了,似乎是因为液冷方案的GPU只占据一个PCIe槽位。而且液冷方案也能帮助达到更高的功耗利用率(PUE)。准备应用液冷GPU的OEM厂商包括华硕、华擎、富士康、技嘉、新华三、浪潮、英业达、宁畅、QCT、超微、纬颖科技、 αFUSION。
第三,发布Jetson AGX Orin开发者套件。Jetson AGX Orin是英伟达去年GTC上宣布要推出的,替代更早的Xavier,是主要可应用于机器人的硬件产品,其上包括安培架构GPU和Arm Cortex-A78 CPU。新发布的Jetson AGX Orin开发者套件售价399美元起。
未来会有不同版本配置(包括CPU核心数)的产品可选,包括Jetson AGX Orin 32GB会在7月发布,AGX Orin 64GB则于10月发布。9月、12月分别将发布Orin NX 16GB和8GB。除了英伟达第一方之外,Computex上也有超过30家OEM厂商发布了Jetson AGX Orin应用和服务器,在机器人、生产制造、零售、运输、智慧城市和医疗健康方面均有涉足。
第四是自动驾驶汽车生态相关的,宣布富士康工业互联网、广达电脑和德赛西威成为DRIVE Hyperion生态下的合作伙伴。DRIVE Hyperion是英伟达面向自动驾驶的计算与感知架构,平台上包含了传感器、网络、安全系统、AI计算芯片等组成部分。最新的Hyperion 9平台内包含有14个摄像头、9个雷达、9个激光雷达、20个超声波传感器。这是个开放的平台,行业参与者可以基于此来构建不同类型的汽车。
整车厂中已知要采用Hyperion 8的企业包括梅赛德斯奔驰、捷豹和路虎等。我们之前对于英伟达的报道较少涉及其汽车方向的业务,主要是因为在英伟达当前的版图里,汽车应用只占到其营收很少的一部分。黄仁勋这次答记者问时说:“这对今天的我们来说还只是一个很小的业务,不过我说过未来6年内,这项业务会产生110亿美元的营收。”可见英伟达对于自动驾驶汽车应用的看重。
如文首所述,今年Computex上宣布的一些英伟达新闻基本都属于生态扩张、现有生态的添砖加瓦。其中不乏一些初生生态的持续跟进,比如说DRIVE Hyperion加入新的合作伙伴、Omniverse引入新特性,以及面向HPC AI的CPU和GPU有了与OEM厂商合作的进一步动向;自然也有成熟生态的扩张,比如RTX GPU获得更多游戏的支持、被更多的硬件产品所采用,以及数据中心GPU增加液冷板卡方案。
最后用黄仁勋在答记者问时的一个理念宣导来做结。他在做总结时,第一想到的是英伟达的AI业务,毕竟这已经是英伟达赚钱的大头了。“我认为AI的下一个发展阶段,是从云里面走出来,走进现实世界。自动驾驶汽车就是个典型的例子。”“有件事情我们一直在做,我想下一个5年我们会有更好的进展,就是把我们喜欢的一切都全面的自动化(automate everything that we enjoy)。”
“不光是智能手机上呈现的那些信息,还有汽车和周围的一切。”“实现这一目标的最佳方法,就是AI。把AI从云上拿出来,放到现实世界里,是我们在努力期盼的。”这话似有将英伟达AI从数据中心,扩展到其他万事万物上的意思。这也让我们更能理解,现在英伟达的行为逻辑中,业务方向大概还在扩展。