“这可能是有史以来最忙的一届GTC,我们发布了太多的新产品。”英伟达创始人兼首席执行官黄仁勋在GTC Fall 2022上接受媒体采访时称,“这是一个应用AI的时代,未来10年、15年,我们需要创建新的工具和应用框架,发展新的合作伙伴关系,去帮助企业应用人工智能。”
英伟达创始人兼首席执行官黄仁勋
GPU的巨大飞跃
由全新“Ada”架构助力的新一代GeForce RTX 40系列GPU被黄仁勋称之为一次“巨大飞跃”,为致力于完整模拟世界的创造者铺平了道路。
之所以命名为“Ada”,据说是为了致敬19世纪英国数学家埃达·洛夫莱斯(Ada Lovelace),她是著名英国诗人拜伦之女,建立了循环和子程序概念,也被认为是地球上最早的计算机程序员。
新一代Ada架构
作为RTX 40系列显卡核心,Ada架构将其中的SM多单元处理器、RT Core(光追核心)以及Tensor Core(可理解为AI核心)都进行了换代升级,其中的RT Core拥有两倍的光线与三角形求交性能,并且通过全新的引擎来减少了开销,Tensor Core则是提升了性能。
Ada还引入了NVIDIA DLSS技术的最新版本——DLSS 3。该技术利用深度学习的AI在像素级帧到帧方向的运动、速度信息基础上进行预测并通过一系列的处理在不影响原有游戏处理管线的情况下进行中间帧的生成,大幅度提高了游戏的帧数表现。与传统渲染相比,它能将游戏性能提高多达4倍。难怪黄仁勋也由衷的表示:“DLSS 3是我们最伟大的发明之一。”
DLSS 3.0技术包含四项组件,新加入的AI帧生成器最为关键
在“Ada”架构加持下,GeForce RTX 40系列显卡最多可以包含760亿个晶体管和超过16384个CUDA核心,较上一代Ampere架构多70%。这得益于台积电的4N工艺和美光科技的GDDR6X显存,理论能效较上一代Ampere 8nm工艺提高一倍,意味着拥有更高的超频潜力。
雷神面世
单颗算力达到2000TFLOPS的全新车载芯片“DRIVE Thor”一经宣布便技惊四座,而且它还取代了此前发布的自动驾驶芯片DRIVE Atlan SoC,后者将不再上市,且立即生效。要知道,DRIVE Atlan在英伟达内部一度被称之为“技术的奇迹”,单颗算力为1000TFLOPS,原本预定2024年上市。
英伟达DRIVE Thor SoC
2000T是个什么概念呢?简单来说,是Mobileye EyeQ4的800倍,小鹏P5使用的英伟达Xavier(30T)的67倍,特斯拉FSD(144T)的14倍,当前主流的英伟达Orin(254T)的8倍。目前,蔚来搭载的由4颗Orin组成的车载NIO ADAM平台算力一共是1016T,一颗Thor就几乎等于两辆蔚来的总算力。
与Atlan一样,Thor的设计初衷也是用于处理自动驾驶汽车的所有计算需求。请记住,是所有——从信息娱乐系统和传感器融合到实际的自动驾驶算法本身,目标是用一台可以完成所有工作的计算机取代目前汽车内的独立计算机。套用黄仁勋的话,“这颗芯片就是为汽车的中央计算架构而生”。
中国吉利公司旗下的极氪品牌已宣布将在下一代智能电动汽车上搭载DRIVE Thor,并于2025年初开始生产。而眼下,英伟达生态系统中的中国用户还包括蔚来、威马、理想、小鹏、比亚迪、百度Apollo、上汽智己、元戎启行、云骥智行、悠跑科技、文远知行、小马智行、图森未来等一众企业。
不少参会者对于英伟达用Thor来替换Atlan感到困惑,黄仁勋在答记者问中说Atlan项目是多年前就开始做的,而现在Ada Lovelace、Hopper、Grace这些新架构出现了,“这些技术那么优秀,我不想再等两年把这些技术做集成。”黄仁勋说。
汽车领域另一个值得关注的方案,是DRIVE Sim仿真平台发布新功能神经重建引擎(NRE),借助AI技术重构真实世界。
当前,自动驾驶汽车仿真面临着两项挑战:一是生成细节丰富、高度逼真的仿真世界,来让AI 驾驶员“信以为真”;二是生成规模足够大的仿真,以涵盖AI驾驶员所需的充分训练和测试。
而NRE能够使用多个AI网络将现实世界中的2D视频数据转换成可以加载到DRIVE Sim中的动态3D数字孪生环境。DRIVE Sim则为开发者提供了调整动态和静态物体、车辆路径以及车辆传感器位置、方向和参数的工具,当中的相同场景也会被用于生成预标记的合成数据,以便训练感知系统。与此同时,随机化原则也被应用在重建的场景之上,从而增加训练数据的多样性。基于真实世界数据构建场景,大大缩小了仿真与真实世界的差距。
欢迎来到机器人时代
瑞银最新的报告显示,随着未来几年机器人逐渐从自动化向自主化(具备自我学习能力的AI)蜕变,人类对机器人的认知将被颠覆。该报告指出,1980年代/2010年代,自动化分别降低了汽车行业/智能手机行业的成本、扩大了市场规模。随着我们迈入21世纪的第三个十年,新一轮的自动化趋势在各种非传统市场、通用应用领域愈发明显,自动化的潜在市场规模到2025年可能增至约2万亿美元(2020年约为5000亿美元)。ABI Research的数据也显示,全球移动机器人市场预计将增长9倍,从2021年的130亿美元增长到2030年的超过1230亿美元。
这与黄仁勋的判断不谋而合。在GTC演讲中,他将机器人计算机描述为“一种最新的计算机类型”,能够将一切可移动的机器转移到虚拟世界。为此,他宣布推出Jetson Orin Nano,这款微型机器人计算机比上一代备受欢迎的Jetson Nano快80倍,成为入门级边缘AI和机器人技术的新基准;以及Nova Orin(一种自主移动机器人参考平台),包括:两种使用单个Jetson AGX Orin,另外一种基于两个Orin模组。
这样,NVIDIA Jetson系列首次涵盖了六个基于Orin的生产模组,可支持各种边缘AI和机器人应用。其中包括在最小的Jetson外形尺寸下提供每秒40万亿次(TOPS)AI性能的 Orin Nano,以及为高级自主机器提供每秒275万亿次(TOPS)AI性能的AGX Orin。
所有Jetson Orin模块和Jetson AGX Orin开发套件均基于单一SoC架构,配备 NVIDIA Ampere架构GPU、高性能CPU和最新加速器。这种共享架构意味着开发者可以为一个Jetson Orin模块开发软件,然后轻松将其部署到任何其他模块。
考虑到机器人开发者时常需要跨全球团队进行环境导航测试,便捷访问仿真软件对于快速输入和迭代非常重要,英伟达宣布已在云端提供Isaac Sim机器人仿真平台——这意味机器人开发人员将不再依赖于强大的工作站来运行仿真,任何设备都可以设置、管理和查看模拟结果。
AI和虚拟世界的新服务
黄仁勋表示,大型语言模型“是当今最重要的AI模型”。基于Transformer架构,这些大型模型可以在没有监督和标记数据集的情况下学习理解意义或语言,解锁无与伦比的新能力。
为了帮助研究人员更轻松地将该技术应用到其工作中,英伟达发布了Nemo LLM( Large Language Model)服务,这项NVIDIA管理的云服务可根据具体的任务调整预先训练的大型语言模型。同时发布的BioNeMo LLM则是专门面向药物和生物科学研究人员,旨在帮助他们更好的理解化学物质、蛋白质、DNA和RNA序列。
例如,NVIDIA正与全球最大的人类基因组信息公司——博德研究所合作,为博德的Terra云平台提供NVIDIA Clara库,包括NVIDIA Parabricks、基因组分析工具套件和BioNeMo。
GTC Fall大会上有关Omniverse的一个重要发布就是NVIDIA Omniverse Cloud,作为NVIDIA的第一款软件即服务(SaaS)产品,这项基础设施即服务(IaaS)可以连接在云端、本地或设备上运行的Omniverse应用。黄仁勋宣布,新的Omniverse容器现已可以部署到云端,该容器包括用于合成数据生成的Replicator、用于扩展渲染农场的Farm、用于构建和训练AI机器人的Isaac Sim等等。
Omniverse Cloud服务在 Omniverse Cloud Computer 上运行。该计算系统由用于图形和物理学模拟的NVIDIA OVX™、用于高级AI工作负载的NVIDIA HGX™以及 NVIDIA图形交付网络(GDN)组成。GDN 是一个全球规模的分布式数据中心网络,用于在边缘提供高性能、低延迟的元宇宙图形。
AI赋能的客服助理,可以随时受理客户订单的Violet也让人眼前一亮。
Violet是一款基于云的虚拟形象,其发布代表着利用NVIDIA Omniverse Avatar Cloud Engine(ACE)进行虚拟形象开发的最新进展。这套云原生AI微服务有助于更轻松地大规模构建和部署智能虚拟助理和数字人。
为了让Violet等交互式虚拟形象“动起来”,开发者需要确保3D人物能够“看到”、“听到”、“理解到”,以及能与人“交流”。但是,由于传统方法通常需要昂贵的设备、特定的专业知识和耗时的工作流,因此,构建栩栩如生的虚拟形象是一项极具挑战性的工作。
为此,NVIDIA的创意团队使用了该公司的统一计算框架(Unified Compute Framework,UCF),这是一个全面加速的框架,开发者能借助该框架将进行过优化和加速的微服务融入实时 AI 应用中。UCF帮助团队为Violet构建了微服务图,并将其部署在云中。
Omniverse ACE能为交互式虚拟形象后端提供支持,本质上是充当Violet的大脑。此外,NVIDIA还基于ACE构建了两个参考应用,即 NVIDIA Tokkio 和 NVIDIA Maxine。
当然,如果没有生态系统的支持,Omniverse这样庞大的应用根本没有用武之地。于是,英伟达在GTC上宣布和德勤(Deloitte)展开合作,通过此次合作扩展,德勤的专业人员将能够使用NVIDIA AI和NVIDIA Omniverse™ Enterprise平台帮助客户构建和部署各种AI应用,包括边缘AI、语音AI、推荐系统、聊天机器人、网络安全、数字孪生等。其他几家Omniverse的主要新客户还包括WPP、Lowe's、Heavy.AI和德国国家铁路运营商Deutsche Bahn,分属不同的领域。
英伟达公布的数据显示,目前该公司已拥有“超过150家软件合作伙伴和超过17万用户成为生态系统的组成部分”,Omniverse正在千万亿价值的跨通信、运输、零售、能源、娱乐、物流、奢侈品等行业和领域发挥作用。
“元宇宙真的会发生,我们需要给它一个引擎,让它成为可能。”黄仁勋表示,可能今天元宇宙还没有被很好地理解,这就像25年前的互联网,15年前的移动互联网一样,人们对其知之甚少。现在,下一个互联网——元宇宙,人们最终会理解它,计算机正在构建下一个世界。“你们即将看到一个时代,一个任何人都可以成为内容创造者的时代。”
但现在的技术瓶颈,是必须在软件中模拟物理世界,然后才能部署软件,因此各行各业都需要数字孪生,这样就可以在发布到现实世界之前,不断地测试软件,不断地测试AI与数字孪生的对比。
结语
一劳永逸并不是英伟达的风格,作为人工智能和全球数字转型的关键推动者,他更希望通过持续创新来实现关键技术的不断更迭,并进一步利用AI实现与物理实时交互所需具备的能力。