GTC22|将数据中心变成AI工厂:NVIDIACEO发布Hopper架构、H100GPU、全新超级计算机和软件

原创 英伟达NVIDIA中国 2022-03-23 17:34

NVIDIA GTC 大幕拉开:黄仁勋揭晓 AI 领域的卓越进展,并阐述 AI 和 Omniverse 如何将现实世界和虚拟世界相融合。



NVIDIA 创始人兼首席执行官黄仁勋分享了一个时代愿景,即以工业规模创造智能,并将其融入真实和虚拟世界。这将革新价值万亿美元的行业,并有望解决 “我们这个时代的重大挑战”。


在 NVIDIA GTC 大会主题演讲中,黄仁勋介绍了多款全新芯片,包括 Hopper GPU 架构和 H100GPU、AI 和加速计算软件以及强大的数据中心级系统。


“企业正在处理、完善他们的数据,构建 AI 软件,并逐渐成为智能制造商,” 身处一个 NVIDIA Omniverse 实时 3D 协作和模拟平台上打造的虚拟环境中,黄仁勋描述了 AI 如何在各个领域 “全面开花”。


Omniverse 将汇聚所有这些进步,加快人与 AI 之间的协作、更好地塑造和理解真实世界并成为新型机器人的试验场,推动“下一波 AI”的发展浪潮。


黄仁勋在这一全球最重要的 AI 大会上与领先的开发者、科学家和研究者们分享了他的愿景。


本届大会吸引了 1600 多名演讲者以及超过 20 万名注册参会者。演讲者来自美国运通、DoorDash、领英、Pinterest、Salesforce、ServiceNow、Snap 和 Visa 等公司。


黄仁勋的主题演讲以 NVIDIA 全新园区的壮观航拍拉开序幕。整个园区,包括热闹的先进机器人项目实验室,都是在 Omniverse 中渲染而成。


他分享了如何与广泛的生态系统合作来推进医疗和药物研发的进程,从而拯救生命,甚至帮助拯救我们的地球。

 

黄仁勋表示:“科学家们预测,要想有效地模拟区域气候变化,需要比现在强大十亿倍的超级计算机。”



“NVIDIA 将通过我们的 Earth-2 (全球第一台 AI 数字孪生超级计算机)来应对这一巨大挑战,并发明新的 AI 和计算技术,加速实现十亿倍的性能飞跃。”

全新芯片 NVIDIA H100:“全球 AI 基础架构的新引擎”


为了推动这些宏伟目标的实现,黄仁勋介绍了“全球 AI 基础架构的新引擎”,即基于 Hopper 架构的 NVIDIA H100。

 

他表示,语音、对话、客服和推荐系统等 AI 应用正在推动数据中心设计领域的巨大变革。

 

“AI 数据中心需要处理海量且持续的数据,以训练和完善 AI 模型,原始数据进来,经过提炼,然后智能输出——企业正在制造智能并运营大型 AI 工厂。”

 

黄仁勋解释说,这些工厂全天候密集运行,即便是质量上的小幅改进也能大幅增加客户参与和企业利润。

 

H100 将帮助这些工厂更快发展。这个“庞大”的 800 亿晶体管芯片采用了台积电的 4 纳米工艺制造而成。

 

“Hopper H100 是有史以来最大的一次性能飞跃——其大规模训练性能是 A100 的 9 倍,大型语言模型推理吞吐量是 A100 的 30 倍。”



Hopper 实现了许多技术突破,包括一个新的 Transformer Engine,可以在不损失准确性的前提下将这些网络的速度提高 6 倍。

 

 “Transformer 模型训练时间从数周缩短至数天。”

 

黄仁勋宣布 H100 已投入生产,并将在第三季度上市。

 

黄仁勋还发布了 Grace CPU 超级芯片,这是 NVIDIA 首款用于高性能计算的离散数据中心 CPU。


这款超级芯片由两个 CPU 芯片组成,并通过每秒 900 GB 的 NVLink 芯片互连技术连接成一个 144 核 CPU,具有每秒 1 太字节内存带宽。


“Grace 是全球 AI 基础架构的理想 CPU。”


黄仁勋还宣布推出基于 Hopper GPU 的全新 AI 超级计算机 — DGX H100、H100 DGX POD 和 DGX SuperPOD 。

 

NVIDIA 的全新 NVLink 高速互连技术将被应用于所有未来的 NVIDIA 芯片,包括 CPU、GPU、DPU 和系统级芯片。


他还宣布,NVIDIA 将向客户和合作伙伴提供 NVLink,帮助其构建配套芯片。


“NVLink 使客户能够通过新的方式构建利用 NVIDIA 平台和生态系统的半定制化芯片和系统。”

 

全新软件——AI 已“从根本上改变了”软件


黄仁勋称,得益于加速计算,AI 领域出现了“惊人的进展”。

 

“AI 已从根本上改变了软件功能以及创造软件的方式。”

 

黄仁勋解释说,Transformers 已经实现了自我监督学习,并且无需人类标记数据。因此,Transformers 正在越来越多的领域中发挥作用。

 

“Transformers 实现了自我监督学习,AI 的速度也得到了大幅提升。”

 

黄仁勋表示,Transformers 所带来的突破包括用于语言理解的 Google BERT、用于药物研发的 NVIDIA MegaMolBART 以及 DeepMind AlphaFold2。

 

他介绍了用于自然语言理解、物理、创意设计、角色动画甚至是 NVCell 芯片布局的全新深度学习模型。

 

“AI 正在各个领域‘全面开花’,包括新的架构、新的学习策略、规模更大、性能更强的模型、新的科学领域、新的应用、新的行业等,而且所有这些领域都在发展。”

 

黄仁勋表示,NVIDIA 全力投入于加速 AI 领域的新突破以及 AI 和机器学习在每个行业的应用。

 

NVIDIA AI 平台正在取得重大更新,包括 Triton 推理服务器、用于训练大型语言模型的 NeMoMegatron 0.9 框架以及用于音频和视频质量增强的 Maxine 框架。



该平台包含一套由 NVIDIA 优化和认证的端到端、云原生 AI 和数据分析工具与框架 NVIDIA AI Enterprise 2.0,并且现在支持所有主要的数据中心和云平台。

 

“我们在这次 GTC 上更新了 60 个 SDK。300 万名开发者、科学家和 AI 研究者以及数万家初创企业会发现,自己的 NVIDIA 系统变得更快了。”

 

现在,一些全球大型企业都在依赖 NVIDIA AI 软件和加速计算 SDK。

 

  • Microsoft Translator 使用 NVIDIA Triton 支持的实时翻译功能加速全球沟通。

  • AT&T 使用 NVIDIA RAPIDS 软件加速其数据科学团队的工作,这款软件可以让数万亿条记录的处理变得更加轻松。


“NVIDIA SDK 服务于医疗、能源、交通、零售、金融、媒体和娱乐等行业,总价值达到 100 万亿美元。”


“ 新一轮进化 ”:虚拟世界的Omniverse


半个世纪前,阿波罗 13 号登月任务遇到了麻烦。为了拯救船员,NASA 的工程师们在地球上创建了一个船员舱模型来“解决这个问题”。

 

黄仁勋表示:“在扩展到巨大的规模后,数字孪生就能成为一个与物理世界相连的虚拟世界。这代表着互联网的新一轮进化。”

 

用于构建数字孪生的 NVIDIA Omniverse 软件,以及全新数据中心级 NVIDIA OVX 系统,将成为“以行动为导向的 AI”的组成部分。


“Omniverse 是我们机器人平台的核心。像 NASA 和亚马逊一样,我们和机器人以及工业自动化领域的客户都意识到了数字孪生和 Omniverse 的重要性。”

 

黄仁勋解释说,OVX 将使用 Omniverse 数字孪生进行大规模模拟,使多个自主系统在同一时空运行。 


OVX 的骨干是其网络编织架构,为此他发布了 NVIDIA Spectrum-4 高性能数据基础架构平台。


全球首个 400Gbps 端到端网络平台 NVIDIA Spectrum-4 由 Spectrum-4 交换机系列、NVIDIA ConnectX-7SmartNIC、NVIDIA BlueField-3 DPU 和 NVIDIA DOCA 数据中心基础设施软件组成。

 

为了让更多的用户能够使用 Omniverse,黄仁勋发布了 Omniverse Cloud。现在只需简单的点击操作,协作者就可以通过云端 Omniverse 进行连接。



为了演示该功能,黄仁勋展示了四名设计师(其中一名是 AI)如何合作创建一个虚拟世界。


他还展示了亚马逊如何使用 Omniverse Enterprise “来设计和优化其无与伦比的订单履行中心。”


“现代化订单履行中心正在变成一座由人类和机器人共同运作的设施,堪称技术奇迹。”




“新一轮 AI 浪潮”:机器人和自动驾驶汽车


黄仁勋表示,新的芯片、软件和模拟功能将掀起“新一轮 AI 浪潮”,即能够“设计、计划和行动”的机器人。


黄仁勋解释说,NVIDIA Avatar、DRIVE、Metropolis、Isaac 和 Holoscan 是围绕“四大支柱”构建的端到端全栈机器人平台。“四大支柱”指的是真实数据生成、AI 模型训练、机器人堆栈和 Omniverse 数字孪生。

 

黄仁勋表示,NVIDIA DRIVE 自动驾驶汽车系统本质上是一个“AI 司机”。

 

Hyperion 8 可以通过 360 度摄像头、雷达、激光雷达和超声波传感器套件实现全自动驾驶。它是 NVIDIA 自动驾驶汽车的硬件架构,NVIDIA DRIVE 在此基础上打造而成。


Hyperion 8 将从 2024 年开始应用于梅赛德斯-奔驰汽车上,并于 2025 年应用于捷豹路虎汽车上。


黄仁勋宣布,作为新一代电动汽车、自动驾驶出租测、班车和卡车引擎的集中式自动驾驶和 AI 计算机,NVIDIA Orin 将在本月开始出货。


黄仁勋还宣布了 Hyperion 9,该架构内置即将推出的 DRIVE Atlan 系统级芯片,是当前基于 DRIVE Orin 架构性能的两倍。Hyperion 9 将于 2026 年开始出货。



全球第二大电动汽车制造商比亚迪将从 2023 年上半年起开始生产基于 DRIVE Orin 计算机的汽车。


Lucid Motors 透露,其 DreamDrive Pro 高级驾驶辅助系统基于 NVIDIA DRIVE 构建。


总体而言,NVIDIA 未来六年汽车业务的研发生产投入已增加至 110 亿美元以上。


ClaraHoloscan 将 DRIVE 中使用的大部分实时计算力用于支持医疗仪器和实时传感器,如射频超声波、4K 手术视频、高通量摄像头和激光器等。

 

黄仁勋演示了 Holoscan 如何加速来自光片显微镜的图像,并创造出一部关于细胞运动和分裂的“电影”。

 

一般情况下,需要一整天时间才能处理完这些仪器一小时内产生的 3TB 数据。

 

但在加州大学伯克利分校的高级生物影像中心,使用 Holoscan 的研究人员能够实时处理这些数据,实现了显微镜在实验进行过程中的自动对焦。


Holoscan 开发平台现已向客户开放早期使用权限,并将于 5 月全面上线,在 2023 年第一季度达到医疗级使用标准。

 

NVIDIA 正在与数千名客户和开发者合作,帮助他们建造用于制造、零售、医疗、农业、建筑、机场和整座城市的机器人。

 

黄仁勋解释说,NVIDIA 的机器人平台由 Metropolis 和 Isaac 组成。Metropolis 是一个能够追踪移动物体的固定机器人,而 Isaac 是一个专为移动物体开发的平台。


为了帮助机器人在工厂、仓库等室内空间中找到路线,NVIDIA 发布了 Isaac Nova Orin。这个先进的计算和传感器参考平台建立在 Jetson AGX Orin 上,能够加速自主式移动机器人的开发和部署。


在一段演示中,黄仁勋展示了百事可乐如何结合使用 Metropolis 和 Omniverse 数字孪生。




四个层面与五个趋势


所有技术、产品发布和演示,都将助力 NVIDIA 推动新一代计算的发展。

 

黄仁勋解释说,NVIDIA 发布了覆盖其所有四层堆栈的新产品,包括硬件,系统软件和库,软件平台 NVIDIA HPC、NVIDIA AI 和 NVIDIA Omniverse 以及 AI 和机器人应用框架。



黄仁勋还提出了影响行业发展的五个趋势:million-X 百万倍计算速度飞跃,大幅加快 AI 速度的 Transformers,成为 AI 工厂的数据中心,对机器人系统的需求呈指数级增长以及下一个 AI 时代的数字孪生。


黄仁勋在演讲的最后总结道:“我们将在未来十年以数据中心规模加速整个堆栈,再次实现 million-X 百万倍性能飞跃。我已经迫不及待地想看到下一次百万倍性能飞跃将带来什么。”


在主题演讲的结尾,黄仁勋表示“大家今天所看到的每一个渲染和模拟”均由 Omniverse 生成,随后他介绍了一段由 NVIDIA 创作团队制作的精彩视频,带着观众“最后再游览一次 Omniverse”,来到 NVIDIA 园区中央欣赏一段迷人的爵士乐,而以黄仁勋为原型制作的数字形象 Toy Jensen 也出现在这个虚拟世界中。


扫描下方海报二维码,即可观看 GTC22 黄仁勋重磅主题演讲,与你共同探索 AI、Omniverse 等前沿科技!




评论
  • 时源芯微——RE超标整机定位与解决详细流程一、 初步测量与问题确认使用专业的电磁辐射测量设备,对整机的辐射发射进行精确测量。确认是否存在RE超标问题,并记录超标频段和幅度。二、电缆检查与处理若存在信号电缆:步骤一:拔掉所有信号电缆,仅保留电源线,再次测量整机的辐射发射。若测量合格:判定问题出在信号电缆上,可能是电缆的共模电流导致。逐一连接信号电缆,每次连接后测量,定位具体哪根电缆或接口导致超标。对问题电缆进行处理,如加共模扼流圈、滤波器,或优化电缆布局和屏蔽。重新连接所有电缆,再次测量
    时源芯微 2024-12-11 17:11 80浏览
  • 概述 通过前面的研究学习,已经可以在CycloneVGX器件中成功实现完整的TDC(或者说完整的TDL,即延时线),测试结果也比较满足,解决了超大BIN尺寸以及大量0尺寸BIN的问题,但是还是存在一些之前系列器件还未遇到的问题,这些问题将在本文中进行详细描述介绍。 在五代Cyclone器件内部系统时钟受限的情况下,意味着大量逻辑资源将被浪费在于实现较大长度的TDL上面。是否可以找到方法可以对此前TDL的长度进行优化呢?本文还将探讨这个问题。TDC前段BIN颗粒堵塞问题分析 将延时链在逻辑中实现后
    coyoo 2024-12-10 13:28 102浏览
  •         霍尔传感器是根据霍尔效应制作的一种磁场传感器。霍尔效应是磁电效应的一种,这一现象是霍尔(A.H.Hall,1855—1938)于1879年在研究金属的导电机构时发现的。后来发现半导体、导电流体等也有这种效应,而半导体的霍尔效应比金属强得多,利用这现象制成的各种霍尔元件,广泛地应用于工业自动化技术、检测技术及信息处理等方面。霍尔效应是研究半导体材料性能的基本方法。通过霍尔效应实验测定的霍尔系数,能够判断半导体材料的导电类型、载流子浓度及载流子
    锦正茂科技 2024-12-10 11:07 64浏览
  • RK3506 是瑞芯微推出的MPU产品,芯片制程为22nm,定位于轻量级、低成本解决方案。该MPU具有低功耗、外设接口丰富、实时性高的特点,适合用多种工商业场景。本文将基于RK3506的设计特点,为大家分析其应用场景。RK3506核心板主要分为三个型号,各型号间的区别如下图:​图 1  RK3506核心板处理器型号场景1:显示HMIRK3506核心板显示接口支持RGB、MIPI、QSPI输出,且支持2D图形加速,轻松运行QT、LVGL等GUI,最快3S内开
    万象奥科 2024-12-11 15:42 71浏览
  • 智能汽车可替换LED前照灯控制运行的原理涉及多个方面,包括自适应前照灯系统(AFS)的工作原理、传感器的应用、步进电机的控制以及模糊控制策略等。当下时代的智能汽车灯光控制系统通过车载网关控制单元集中控制,表现特殊点的有特斯拉,仅通过前车身控制器,整个系统就包括了灯光旋转开关、车灯变光开关、左LED前照灯总成、右LED前照灯总成、转向柱电子控制单元、CAN数据总线接口、组合仪表控制单元、车载网关控制单元等器件。变光开关、转向开关和辅助操作系统一般连为一体,开关之间通过内部线束和转向柱装置连接为多,
    lauguo2013 2024-12-10 15:53 85浏览
  • 近日,搭载紫光展锐W517芯片平台的INMO GO2由影目科技正式推出。作为全球首款专为商务场景设计的智能翻译眼镜,INMO GO2 以“快、准、稳”三大核心优势,突破传统翻译产品局限,为全球商务人士带来高效、自然、稳定的跨语言交流体验。 INMO GO2内置的W517芯片,是紫光展锐4G旗舰级智能穿戴平台,采用四核处理器,具有高性能、低功耗的优势,内置超微高集成技术,采用先进工艺,计算能力相比同档位竞品提升4倍,强大的性能提供更加多样化的应用场景。【视频见P盘链接】 依托“
    紫光展锐 2024-12-11 11:50 51浏览
  •         在有电流流过的导线周围会感生出磁场,再用霍尔器件检测由电流感生的磁场,即可测出产生这个磁场的电流的量值。由此就可以构成霍尔电流、电压传感器。因为霍尔器件的输出电压与加在它上面的磁感应强度以及流过其中的工作电流的乘积成比例,是一个具有乘法器功能的器件,并且可与各种逻辑电路直接接口,还可以直接驱动各种性质的负载。因为霍尔器件的应用原理简单,信号处理方便,器件本身又具有一系列的du特优点,所以在变频器中也发挥了非常重要的作用。  &nb
    锦正茂科技 2024-12-10 12:57 76浏览
  • 【萤火工场CEM5826-M11测评】OLED显示雷达数据本文结合之前关于串口打印雷达监测数据的研究,进一步扩展至 OLED 屏幕显示。该项目整体分为两部分: 一、框架显示; 二、数据采集与填充显示。为了减小 MCU 负担,采用 局部刷新 的方案。1. 显示框架所需库函数 Wire.h 、Adafruit_GFX.h 、Adafruit_SSD1306.h . 代码#include #include #include #include "logo_128x64.h"#include "logo_
    无垠的广袤 2024-12-10 14:03 71浏览
  • 肖特基具有很多的应用场景, 可以做同步整流,防止电流倒灌和电源反接等,但是随着电源电流的增大,肖特基导通正向压降0.3~0.7v的劣势也越发明显,产生了很多的热,对于工程师的散热设计是个考验,增加了工程师的设计难度和产品成本,目前一种新的理想二极管及其控制器,目前正在得到越来越广泛的应用- BMS,无人机,PLC,安防,家电,电动工具,汽车等都在快速普及理想二极管有三种架构,内置电荷泵的类似无锡明芯微MX5050T这种,驱动能力会弱点,静态功耗200uA,外置电荷泵MX74700T的这种驱动能力
    王萌 2024-12-10 08:51 85浏览
  • 本文介绍Linux系统(Ubuntu/Debian通用)挂载exfat格式U盘的方法,触觉智能RK3562开发板演示,搭载4核A53处理器,主频高达2.0GHz;内置独立1Tops算力NPU,可应用于物联网网关、平板电脑、智能家居、教育电子、工业显示与控制等行业。修改对应的内核配置文件# 进入sdk目录cdrk3562_linux# 编辑内核配置文件vi./kernel-5.10/arch/arm64/configs/rockchip_linux_defconfig注:不清楚内核使用哪个defc
    Industio_触觉智能 2024-12-10 09:44 92浏览
  • 习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习笔记&记录学习习笔记&记学习学习笔记&记录学习学习笔记&记录学习习笔记&记录学习学习笔记&记录学习学习笔记记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记
    youyeye 2024-12-10 16:13 109浏览
  • 天问Block和Mixly是两个不同的编程工具,分别在单片机开发和教育编程领域有各自的应用。以下是对它们的详细比较: 基本定义 天问Block:天问Block是一个基于区块链技术的数字身份验证和数据交换平台。它的目标是为用户提供一个安全、去中心化、可信任的数字身份验证和数据交换解决方案。 Mixly:Mixly是一款由北京师范大学教育学部创客教育实验室开发的图形化编程软件,旨在为初学者提供一个易于学习和使用的Arduino编程环境。 主要功能 天问Block:支持STC全系列8位单片机,32位
    丙丁先生 2024-12-11 13:15 50浏览
  • 我的一台很多年前人家不要了的九十年代SONY台式组合音响,接手时只有CD功能不行了,因为不需要,也就没修,只使用收音机、磁带机和外接信号功能就够了。最近五年在外地,就断电闲置,没使用了。今年9月回到家里,就一个劲儿地忙着收拾家当,忙了一个多月,太多事啦!修了电气,清理了闲置不用了的电器和电子,就是一个劲儿地扔扔扔!几十年的“工匠式”收留收藏,只能断舍离,拆解不过来的了。一天,忽然感觉室内有股臭味,用鼻子的嗅觉功能朝着臭味重的方向寻找,觉得应该就是这台组合音响?怎么会呢?这无机物的东西不会腐臭吧?
    自做自受 2024-12-10 16:34 141浏览
  • 全球知名半导体制造商ROHM Co., Ltd.(以下简称“罗姆”)宣布与Taiwan Semiconductor Manufacturing Company Limited(以下简称“台积公司”)就车载氮化镓功率器件的开发和量产事宜建立战略合作伙伴关系。通过该合作关系,双方将致力于将罗姆的氮化镓器件开发技术与台积公司业界先进的GaN-on-Silicon工艺技术优势结合起来,满足市场对高耐压和高频特性优异的功率元器件日益增长的需求。氮化镓功率器件目前主要被用于AC适配器和服务器电源等消费电子和
    电子资讯报 2024-12-10 17:09 88浏览
  • 一、SAE J1939协议概述SAE J1939协议是由美国汽车工程师协会(SAE,Society of Automotive Engineers)定义的一种用于重型车辆和工业设备中的通信协议,主要应用于车辆和设备之间的实时数据交换。J1939基于CAN(Controller Area Network)总线技术,使用29bit的扩展标识符和扩展数据帧,CAN通信速率为250Kbps,用于车载电子控制单元(ECU)之间的通信和控制。小北同学在之前也对J1939协议做过扫盲科普【科普系列】SAE J
    北汇信息 2024-12-11 15:45 84浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦