这些年英伟达GTC的新发布大有眼花缭乱的感觉,因为发布产品涉及层面和领域太过广泛。黄仁勋说英伟达是全软件硬件堆栈的平台运算型公司,full computing platform company。
虽说今年GTC,Hopper GPU芯片赚足眼球,其余包括HPC、AI软件栈,上层应用等组成部分在内的更新也实在不逊于硬件。今年黄仁勋在keynote上梳理了英伟达现如今产品涉足的层级,和它们之间的关系:
这篇文章就来谈谈今年GTC上,Nvidia Omniverse的一些新发布——虽然叫它“元宇宙”其实并不准确,但Omniverse现阶段在做的事本身就是未来元宇宙成型的基础。针对更多人关注的Hopper GPU、Grace超级芯片,我们将另外撰文。
我们此前不止一次谈过Omniverse究竟是什么,它可能是现阶段最靠近元宇宙的一个东西,建议不理解这一概念的读者移步阅读。
总结起来,现阶段的Omniverse主要实现的是设计协作、模拟仿真。设计协作体现在,从不同位置、用不同的工具,在设计、建筑等领域内,就像用云共享文档一样进行实时的3D工作流程的协作。而模拟仿真的一个具体体现,是数字孪生(digital twin)。Omniverse模拟仿真的虚拟世界也符合物理定律,真正达成对现实世界的模拟,为机器人、汽车、建筑、生产制造等领域提供切实的参考并创造价值。
今年相关Omniverse与专业视觉的一些主要发布包括:
• 发布Nvidia Omniverse Cloud
• 发布Nvidia OVX与OVX SuperPOD
• 发布Spectrum-4交换机
• 发布面向AMR(自主移动机器人)平台的Nvidia Isaac
• 发布面向桌面PC的RTX A5500 GPU;发布面向图形移动工作站(RTX笔记本)的更多GPU
• Omniverse平台与生态的相关发展与更新
……
相关Omniverse与专业视觉的新硬件
今年GTC更新的硬件产品中包含了一款Nvidia OVX服务器。黄仁勋对其总结很到位:“就像AI需要DGX一样,现在Omniverse也有了OVX。”这是为Omniverse数字孪生打造的服务器产品。
不过OVX并没有采用英伟达最新发布的CPU和GPU,主要配置包括了8个A40 GPU(Ampere架构)、3个ConnectX-6 200Gbps NIC,以及两颗Intel Ice Lake处理器,1TB系统内存、16TB NVMe存储。这些配置着意于满足工业数字孪生的需求。
英伟达Omniverse开发平台副总裁Richard Kerris在采访中说:“OVX用于处理一些低延迟任务,以实时的方式工作,覆盖从汽车、工厂、城市,甚至地球等各种级别的数字孪生项目,是专为数字孪生设计、非常具有弹性的框架。”
英伟达中国区高级技术市场经理施澄秋提到:“为了完成高速存储网络、进行人工智能访问,非常低延迟的网络存储、精准的计时,创建逼真的数字孪生等一系列高性能需要的解决方案,称之为OVX。”
将32台OVX服务器,用Spectrum-3连起来,则构成了OVX SuperPOD集群。其中的网络与计算机同步采用PTP(精密时间协议),RDMA也是为实现延迟的最小化而做的,对应于英伟达强调这套系统的低延迟、实时响应的特性。
黄仁勋在主题演讲中表示,第一代OVX已经在英伟达内部,以及早期客户那里投入使用;目前包括浪潮、联想、超微在内的OEM厂商今年晚些时间将会为OVX提供产品和支持。而第二代OVX则在开发中。
虽然OVX SuperPOD还在用Spectrum-3,这次英伟达也宣布了即将在今年第四季度出样的Spectrum-4交换机。黄仁勋说这是全球首款400Gbps的端到端networking平台。这台设备事实上有ConnectX-7和BlueField-3作为硬件基础。
英伟达网络业务副总裁Kevin Deierling表示,这台设备中的交换ASIC芯片是同类芯片中有史以来最大的:1000亿晶体管,51.2T/s带宽,12.8T/s线速的数据加密(可应用confidential computing)——是现有交换机中加密性能最强的芯片……
这次的400Gbps是以每条通道100Gbps达成的,而以前是8通道的50Gbps。每条lane吞吐提升1倍,所以理论上应该可以QSFP-DD连接达成800Gbps的速率水平。
另外像Spectrum-4这样的交换机,与一般常见用于处理所谓mouse flow流量的交换机不同,会更偏向处理elephant flow,所以优化带宽、规模化扩展解决巨型流量问题就会显得很重要。所以英伟达称这样的网络为Nvidia-accelerated Ethernet,专为云、企业和AI负载优化。Deierling说Spectrum-4是为RocE(RDMA over Converged Ethernet)技术打造的,如此一来数据共享就会很快,比如说GPU direct storage——绕过CPU直接给GPU发数据;还有GPU与GPU之间收发数据等。
比较值得一提的是“相比一般数据中心毫秒级的抖动,Spectrum-4可实现纳秒级计时精度,有5-6个量级的提升”,这是其未来适配于Omniverse数字孪生很重要的一点。
除了OVX和Spectrum-4之外,本次相关Omniverse和专业视觉的硬件发布还包括面向桌面设备的RTX A5500专业图形卡,以及面向笔记本的RTX A5500、A4500、A3000 12GB、A2000 8GB、A1000和A500。具体的硬件配置,此处就不再列出了。上面这张图是定位在A5000与A6000之间的A5500的主要配置,市场定位与上代RTX6000相似。
上了云的Omniverse Cloud
有关Omniverse的另一个重磅发布是Omniverse Cloud:相当于把Omniverse的设计协作的一套东西搬到云上。可能有人会有疑惑,Omniverse本身不就需要依托云技术吗?
我们认为Omniverse Cloud可视作云游戏的某种变体。其实在云游戏出现以前,上世纪80年代就曾经出现过用远程服务器做3D图形绘制,将结果以图像形式传递给客户端的设计思路。在云技术愈发走向成熟的今天,云游戏、云图形计算发展起来本身也不奇怪。
黄仁勋在主题演讲中播放的一段demo视频,是由4名设计师(其中一个是现在挺红的Toy Jensen)远程协作。他们都连接到了Omniverse Cloud,共同搭建一个3D设计。即便没有带RTX GPU的计算机,也能藉由GeForce Now来做设计。Mac、平板、手机等等终端都可以。
这种云化方案在技术理想的情况下,是可以改变工作模式的:比如未来只需要给同事发个URL链接,他点击该链接就能直接进入共同协作的项目中——这是很多云化技术,包括云游戏、云设计协作的目标。有没有感觉离元宇宙又近了一步?
实际上在此之前英伟达已经发布了Nucleus Cloud,多个Omniverse用户可以通过跑在云上的Nucleus直接共享他们当前的工作,包括大型3D场景(不知道什么是Nulceus点这里)。这次的Omniverse Cloud,则加入了Omniverse Create和Omniverse View应用,前者是让设计师们同一时间实时构建3D虚拟世界的工具;后者则包含了藉由GeForce Now的视频流传输,让非技术工作者去查看Omniverse场景。
Omniverse Cloud理论上应当也适用于数字孪生,比如在自动驾驶汽车的数字孪生环境里测试新的软件,并进行迭代、共享、协作等。毕竟我们过去就一直在说,数字孪生实际上也就是设计协作的某个高级阶段。而数字孪生发展到高级阶段,就成了元宇宙。
目前Omniverse Cloud刚刚开始邀请早期用户使用,未知正式发布时间。看起来Omniverse Cloud出现,是英伟达期望尽快覆盖更多用户的一大举措。不过这类基于云的图形绘制、协同工作方案要步入成熟,实则存在着大量工程问题。就像如今的云游戏都还相当不成熟一样。更何况如果要部署全球,则基建部分又会是相当大的一笔开销。
其他相关Omniverse的更新
现有的Omniverse开发工具、扩展、应用、微服务及各类软件都已经进入了周期性更新。除了前文提到的Create、View都经过了更新,黄仁勋在主题演讲中谈到了DeepSearch(针对大型、未标记的3D资产库的AI搜索引擎)、Replicator(我们此前专门谈过Replicator,这是个合成数据生成引擎)、Showroom(展示工具)等。
其中比较值得一提的是Omniverse Avatar。去年GTC上的Toy Jensen(当时好像还叫Toy-Me)虚拟形象在推出时是比较令人惊艳的。对开发者来说,Avatar是打造虚拟形象、虚拟机器人的一个框架。而Toy Jensen就是基于Omniverse Avatar做的。不过Toy Jensen在技术上实则还涉及Maxine、Riva等构成部分。
还有包括Omniverse Kit、Nulceus(用户权限相关的更新)、Omniverse XR(类似于View的AR/VR交互加强版)等也都有对应更新。虽然我们这些非Omniverse用户其实无从了解究竟更新了什么。
在机器人领域,面向机器人的Isaac SDK新增了Nvidia Isaac for AWR——就是特别面向室内的自主移动机器人的SDK,比如工厂中负责物流的机器人。这些实体机器人与Omniverse也有很大的关联,比如对机器人的模拟训练过程都将基于Omniverse的虚拟世界。不过这个部分与Nvidia AI也不可分割。而且每次GTC,英伟达总是将机器人单独拿出来讲的,本文作为主要谈Omniverse的部分就不对Isaac for AWR多做介绍了。
另外还有Omniverse Enterprise现已加入英伟达Launchpad豪华套餐等更新——这和国内用户的关联应该就更小了。
英伟达照例还是分享了一些Omniverse的应用案例和新客户,比如DNEG用Omniverse进行设计工作协同,为电视、剧作创作内容;比如Siemens Gamesa用数字孪生来模拟风力发电的配置和部署工作;Amazon Robotics则用Omniverse Enterprise、Isaac Sim来训练仓储机器人…
从去年GTC至今,Omniverse生态下吸收的Connector从8个增加到了82个,包括Chaos Vray,Autodesk Arnold,Blender,Adobe的3D Substance Painter,Epic的虚幻5引擎,Maxon的Cinema 4D等。而且“CAD与工业应用中,已经有26个CAD能够转化到USD表达”…转化为USD表达,也就意味着assets进入到了Omniverse生态,可应用上述各种Omniverse资源。更多生态发展情况参见上图。
从接入的三方connection数量,以及下载、用户数量等数字来看,Omniverse生态当前是处在发展前期的充盈阶段的。接下来就是这个属于英伟达的元宇宙Omniverse帝国漫长的添砖加瓦过程了。不过无论Omniverse最终是否成长为元宇宙形态,其设计协作和数字孪生特性都是现阶段尚无敌手的存在。