GTC22|GTC主题演讲集锦:NVIDIA首席执行官发布新一代RTXGPU和云端AI工作流

原创 英伟达NVIDIA中国 2022-09-21 19:21

GTC揭开序幕,黄仁勋发布了自然语言理解、元宇宙、游戏和AI技术的最新进展,并介绍了这些成果如何影响交通、医疗、金融、娱乐等行业。



NVIDIA首席执行官黄仁勋在GTC主题演讲上介绍了支持AI工作流的新型云服务和新一代GeForce RTX GPU,以及各种新系统、芯片和软件。


黄仁勋在NVIDIA GTC线上演讲中表示:“在加速计算和AI的推动下,计算正在以惊人的速度发展。”


从利用AI和前所未有的图形能力让玩家收获快乐,到建立虚拟试验场以供全球大型企业完善其产品,黄仁勋再次将新技术和新产品与全新发展机遇联系在一起。


加速计算的非凡愿景开启了AI的进步,而AI反过来又将触及全球各个行业,新想法、新产品和新应用因此涌现。


游戏玩家和创作者将获得首批基于全新NVIDIA Ada Lovelace架构的GPU。


企业将通过基于Grace CPU和Grace Hopper超级芯片的系统获得新型、强大的工具,以实现高性能计算应用。构建3D互联网的企业将获得Ada Lovelace L40数据中心GPU驱动的新型OVX服务器。研究人员和计算机科学家将通过NVIDIA LLMs NeMo服务获得新的大型语言模型功能。汽车行业则将会获得一个具有每秒2000万亿次浮点计算性能的新“大脑”——Thor。


黄仁勋重点介绍了各行各业的主要合作伙伴以及客户如何使用NVIDIA技术。


在加快技术采用方面,他宣布全球最大的专业服务公司德勤正在向全球企业提供基于NVIDIA AI和NVIDIA Omniverse构建的新服务。


他还分享了诸多客户故事,包括电信巨头Charter、汽车行业的通用汽车公司、运输行业的德国铁路系统Deutsche Bahn、医学研究行业的博德研究所以及零售行业的Lowe's。


本周揭幕的NVIDIA GTC大会已经成为全球最重要的AI盛会之一,来自波音、德意志银行、Lowe’s、极星、强生、克罗格、梅赛德斯·奔驰、西门子、T-Mobile和美国银行等公司的200多名演讲者以及超过20万名注册参会者将在本届GTC上齐聚一堂。


巨大飞跃:GeForce RTX 40系列GPU


黄仁勋在主题演讲中首先介绍了由Ada助力的新一代GeForce RTX 40系列GPU,将这称之为一次“巨大飞跃”,为致力于完整模拟世界的创造者铺平了道路。


NVIDIA首席执行官黄仁勋推出了下一代GeForce RTX 40系列GPU。


通过展示Racer RTX,黄仁勋让观众体验了完整模拟的可能性,这一切全部都是由光线追踪、交互模拟以及物理建模动作实现的。


Ada的革新包括一个全新的流式多处理器,一个具有两倍光线-三角形相交吞吐量的全新RT Core,以及一个具有Hopper FP8 Transformer Engine可提供1.4PetaFLOP张量处理性能的全新Tensor Core。


Ada还引入了NVIDIA DLSS技术的最新版本——DLSS 3。该技术通过将新帧和上一帧进行比较来了解场景的变化,从而利用AI生成全新帧。与传统渲染相比,它能将游戏性能提高多达4倍。


DLSS 3已经得到了许多全球领先游戏开发者的支持,超过35款游戏和应用宣布即将支持该技术。黄仁勋表示:“DLSS 3是我们最伟大的发明之一。”


黄仁勋表示,这些创新将令全新GeForce RTX 4090的性能提升至上一代RTX 3090 Ti的4倍。全新重量级RTX 4090将于10月12日上市,建议零售价¥12,999元起。


此外,全新GeForce RTX 4080将于11月推出,采用两种配置版本:


GeForce RTX 4080 16GB 建议零售价为¥9,499元起,拥有 9,728 个 CUDA 核心和 16GB 高速美光 GDDR6X 显存。借助 DLSS 3,它在现代游戏中的性能是 GeForce RTX 3080 Ti 的两倍,性能比 GeForce RTX 3090 Ti 更强大且功耗更低。


GeForce RTX 4080 12GB 建议零售价为¥7,199元起,拥有 7,680 个 CUDA 核心和 12GB 美光 GDDR6X 显存,使用 DLSS 3 比上一代旗舰 GPU – RTX 3090 Ti 性能更强大。


黄仁勋还宣布,NVIDIA Lightspeed Studios使用Omniverse重制了历史上最佳游戏之一的《传送门》(Portal)。凭借NVIDIA RTX Remix这一AI辅助工具集,用户可以修改他们喜爱的游戏,提高纹理和素材的分辨率,并把材质转换为具有精确物理属性的材质。


NVIDIA Lightspeed Studios使用Omniverse重制了历史上最佳游戏之一的《传送门》(Portal)。


推动AI进步:H100 GPU全面投产


黄仁勋再次将系统和软件与广泛的技术趋势联系到一起,他表示大型语言模型(LLM)和推荐系统是当今最重要的两种AI模型。


他表示,推荐系统“掌管着数字经济”,推动着从电子商务到娱乐再到广告的一切发展。“它们是社交媒体、数字广告、电子商务和搜索背后的引擎。”


大型语言模型如今是AI研究最活跃的领域之一,它基于2017年首次推出的 Transformer 深度学习模型而建立,能够在没有监督或标记数据集的情况下学习理解人类语言。


黄仁勋表示:“一个预训练模型可以执行多种任务,如问题回答、文件摘要、文本生成、翻译,甚至软件编程。”


他表示NVIDIA H100 Tensor Core GPU以及Hopper的新一代Transformer Engine已经全面投产,将在未来几周陆续发货。它们正在为这些巨大模型提供所需的计算能力。


黄仁勋表示:“Hopper已全面投产,很快就会被用于助力全球的AI工厂。”


构建系统的合作伙伴包括源讯、思科、戴尔、富士通、技嘉、慧与、联想和超微。而亚马逊云科技、谷歌云服务、微软Azure和Oracle Cloud Infrastructure将从明年开始成为首批在云中部署基于H100的实例。


黄仁勋表示,Grace Hopper将基于Arm的NVIDIA Grace数据中心CPU与Hopper GPU相结合,其快速内存容量增加了7倍,这将为推荐系统带来“巨大的飞跃”。采用Grace Hopper的系统将于2023年上半年上市。


编织元宇宙愿景:L40数据中心GPU全面投产


黄仁勋解释说,互联网的下一次进化,即元宇宙将通过3D技术扩展。Omniverse是NVIDIA用于构建和运行元宇宙应用的平台。


连接和模拟这些世界需要强大且灵活的新型计算机,黄仁勋解释了其中的奥义。NVIDIA OVX服务器就是专为扩展元宇宙应用而打造的。


黄仁勋宣布NVIDIA第二代OVX系统将由Ada Lovelace L40数据中心GPU提供支持,该GPU现已全面投产。


用于自动驾驶汽车、机器人、医疗仪器等领域的Thor

目前,想要实现汽车中的主动安全、停车、驾驶员监测、摄像头后视镜、集群和车载信息娱乐系统等功能通常需要不同的计算机提供支持。而未来,它们将由在中央计算机上运行的软件统一提供支持,并随着时间的推移不断改进。


为了实现这一目标,黄仁勋推出了DRIVE Thor,该平台集Hopper的Transformer Engine、基于Ada的GPU和Grace CPU于一身。


全新Thor超级芯片可提供每秒2,000万亿次浮点运算性能,取代了DRIVE发展路线图中的Atlan,能够与目前被用于量产汽车、可提供每秒254万亿次浮点运算性能的DRIVE Orin无缝衔接。黄仁勋表示,Thor将成为机器人、医疗仪器、工业自动化和边缘AI系统的处理器。


350万开发者与3000个加速应用


黄仁勋宣布,NVIDIA软件生态系统正在将NVIDIA系统和芯片以及加速计算的优势带给每个行业,超过350万名开发者通过使用NVIDIA的550个软件开发工具包(SDK)和AI模型创建了超过3,000个加速应用。


这个数量还在快速增长。在过去的12个月里,NVIDIA已经更新了100多个SDK并推出了25个新的SDK。


黄仁勋表示:“新的SDK提高了我们客户现有系统的能力和性能,同时为加速计算开辟了新的市场。”


AI和虚拟世界的新服务


黄仁勋表示,大型语言模型“是当今最重要的AI模型”。基于 Transformer 架构,这些大型模型可以在没有监督和标记数据集的情况下学习理解意义或语言,解锁无与伦比的新能力。


为了帮助研究人员更轻松地将该技术应用到其工作中,黄仁勋发布了Nemo LLM服务。这项NVIDIA管理的云服务可根据具体的任务调整预先训练的大型语言模型。


为了加速药物和生物科学研究人员的工作,黄仁勋还发布了BioNeMo LLM。这项用于创建大型语言模型的服务可以理解化学物质、蛋白质、DNA和RNA序列。


黄仁勋宣布,NVIDIA正与全球最大的人类基因组信息公司——博德研究所合作,为博德的Terra云平台提供NVIDIA Clara库,包括NVIDIA Parabricks、基因组分析工具套件和BioNeMo。


NVIDIA正在与世界上最大的人类基因组信息生产者--博德研究所合作,在博德研究所的Terra云平台上提供NVIDIA Clara库。


黄仁勋还详细介绍了NVIDIA Omniverse Cloud。这项基础设施即服务(IaaS)可以连接在云端、本地或设备上运行的Omniverse应用。


黄仁勋宣布,新的Omniverse容器现已可以部署到云端,该容器包括用于合成数据生成的Replicator、用于扩展渲染农场的Farm以及用于构建和训练AI机器人的Isaac Sim。


Omniverse正在被广泛采用,黄仁勋分享了几个客户故事与演示:


  • 拥有近2,000家零售店的Lowe's正在使用Omniverse来设计、构建和运营门店的数字孪生;

  • 市值500亿美元的电信运营商Charter和互动数据分析商HEAVY.AI正在使用Omniverse创建Charter 4G和5G网络的数字孪生。

  • 通用汽车正在使用Omniverse来为他们的密歇根设计工作室创建数字孪生,设计师、工程师和营销人员可以在这个数字孪生中协同工作。


家装零售商Lowe's正在使用Omniverse来设计、构建和运营其商店的数字孪生。


用于机器人的全新Jetson Orin Nano 


机器人计算机“是一种最新的计算机类型”,能够将一切可移动的机器转移到虚拟世界。黄仁勋将NVIDIA第二代机器人处理器Orin描述为一次重要的成功。


为了将Orin带到更多的市场,他宣布推出Jetson Orin Nano。这款微型机器人计算机比上一代备受欢迎的Jetson Nano快80倍。


Jetson Orin Nano可运行NVIDIA Isaac机器人堆栈并采用ROS 2 GPU加速框架。NVIDIA Isaac Sim机器人模拟平台现已在云端可用。


对于使用AWS RoboMaker的机器人开发者,黄仁勋宣布,用于NVIDIA Isaac机器人开发平台的容器已在亚马逊云科技商店上架。


全新视频和图像服务工具


黄仁勋解释说,全球大部分互联网流量都由视频产生,而用户生成的视频流将越来越多地通过AI特效和计算机图形得到增强。


黄仁勋表示:“Avatars将能够实时运行计算机视觉、语音AI、语言理解和计算机图形任务,并在云端扩展。”


为了在实时图形、AI和通信交叉点上实现创新,黄仁勋宣布NVIDIA一直完善加速库。这些库包括:CV-CUDA,一种被称为UCF(统一计算框架)的云运行时引擎;Omniverse Avatar Cloud Engine;被称为Tokkio的客户服务虚拟化身示例应用等。


德勤将为企业提供AI和Omniverse服务


黄仁勋宣布,为了加快所有这些技术在全球企业中的应用,全球最大的专业服务公司德勤将带来建立在NVIDIA AI和NVIDIA Omniverse基础上的新服务。


他表示,德勤的专业人员将帮助全球企业使用NVIDIA应用框架,为客户服务、网络安全、工业自动化、仓库和零售自动化等领域构建现代化多云应用。


一切才刚刚开始


在主题演讲的最后,黄仁勋回顾了从介绍新技术到产品发布的整个演讲过程,将几十个不同的部分整合成一个非凡的愿景。


黄仁勋总结道:“我们发布了新的芯片,介绍了我们平台的新进展,并且首次发布了新的云服务。这些平台将推动AI领域新的突破、全新AI应用的发展以及科学和工业领域的下一波AI浪潮。”


GTC 主题演讲观看通道:https://www.nvidia.cn/gtc-global/keynote/?nvid=nv-int-cwmfg-859568



即刻扫描下方海报二维码
观看 GTC 主题演讲重播。


评论
  • 2024年是很平淡的一年,能保住饭碗就是万幸了,公司业绩不好,跳槽又不敢跳,还有一个原因就是老板对我们这些员工还是很好的,碍于人情也不能在公司困难时去雪上加霜。在工作其间遇到的大问题没有,小问题还是有不少,这里就举一两个来说一下。第一个就是,先看下下面的这个封装,你能猜出它的引脚间距是多少吗?这种排线座比较常规的是0.6mm间距(即排线是0.3mm间距)的,而这个规格也是我们用得最多的,所以我们按惯性思维来看的话,就会认为这个座子就是0.6mm间距的,这样往往就不会去细看规格书了,所以这次的运气
    wuliangu 2025-01-21 00:15 324浏览
  • 数字隔离芯片是一种实现电气隔离功能的集成电路,在工业自动化、汽车电子、光伏储能与电力通信等领域的电气系统中发挥着至关重要的作用。其不仅可令高、低压系统之间相互独立,提高低压系统的抗干扰能力,同时还可确保高、低压系统之间的安全交互,使系统稳定工作,并避免操作者遭受来自高压系统的电击伤害。典型数字隔离芯片的简化原理图值得一提的是,数字隔离芯片历经多年发展,其应用范围已十分广泛,凡涉及到在高、低压系统之间进行信号传输的场景中基本都需要应用到此种芯片。那么,电气工程师在进行电路设计时到底该如何评估选择一
    华普微HOPERF 2025-01-20 16:50 123浏览
  • 现在为止,我们已经完成了Purple Pi OH主板的串口调试和部分配件的连接,接下来,让我们趁热打铁,完成剩余配件的连接!注:配件连接前请断开主板所有供电,避免敏感电路损坏!1.1 耳机接口主板有一路OTMP 标准四节耳机座J6,具备进行音频输出及录音功能,接入耳机后声音将优先从耳机输出,如下图所示:1.21.2 相机接口MIPI CSI 接口如上图所示,支持OV5648 和OV8858 摄像头模组。接入摄像头模组后,使用系统相机软件打开相机拍照和录像,如下图所示:1.3 以太网接口主板有一路
    Industio_触觉智能 2025-01-20 11:04 194浏览
  •  万万没想到!科幻电影中的人形机器人,正在一步步走进我们人类的日常生活中来了。1月17日,乐聚将第100台全尺寸人形机器人交付北汽越野车,再次吹响了人形机器人疯狂进厂打工的号角。无独有尔,银河通用机器人作为一家成立不到两年时间的创业公司,在短短一年多时间内推出革命性的第一代产品Galbot G1,这是一款轮式、双臂、身体可折叠的人形机器人,得到了美团战投、经纬创投、IDG资本等众多投资方的认可。作为一家成立仅仅只有两年多时间的企业,智元机器人也把机器人从梦想带进了现实。2024年8月1
    刘旷 2025-01-21 11:15 666浏览
  • 临近春节,各方社交及应酬也变得多起来了,甚至一月份就排满了各式约见。有的是关系好的专业朋友的周末“恳谈会”,基本是关于2025年经济预判的话题,以及如何稳定工作等话题;但更多的预约是来自几个客户老板及副总裁们的见面,他们为今年的经济预判与企业发展焦虑而来。在聊天过程中,我发现今年的聊天有个很有意思的“点”,挺多人尤其关心我到底是怎么成长成现在的多领域风格的,还能掌握一些经济趋势的分析能力,到底学过哪些专业、在企业管过哪些具体事情?单单就这个一个月内,我就重复了数次“为什么”,再辅以我上次写的:《
    牛言喵语 2025-01-22 17:10 178浏览
  • 嘿,咱来聊聊RISC-V MCU技术哈。 这RISC-V MCU技术呢,简单来说就是基于一个叫RISC-V的指令集架构做出的微控制器技术。RISC-V这个啊,2010年的时候,是加州大学伯克利分校的研究团队弄出来的,目的就是想搞个新的、开放的指令集架构,能跟上现代计算的需要。到了2015年,专门成立了个RISC-V基金会,让这个架构更标准,也更好地推广开了。这几年啊,这个RISC-V的生态系统发展得可快了,好多公司和机构都加入了RISC-V International,还推出了不少RISC-V
    丙丁先生 2025-01-21 12:10 619浏览
  • 本文介绍瑞芯微开发板/主板Android配置APK默认开启性能模式方法,开启性能模式后,APK的CPU使用优先级会有所提高。触觉智能RK3562开发板演示,搭载4核A53处理器,主频高达2.0GHz;内置独立1Tops算力NPU,可应用于物联网网关、平板电脑、智能家居、教育电子、工业显示与控制等行业。源码修改修改源码根目录下文件device/rockchip/rk3562/package_performance.xml并添加以下内容,注意"+"号为添加内容,"com.tencent.mm"为AP
    Industio_触觉智能 2025-01-17 14:09 203浏览
  • 故障现象 一辆2007款日产天籁车,搭载VQ23发动机(气缸编号如图1所示,点火顺序为1-2-3-4-5-6),累计行驶里程约为21万km。车主反映,该车起步加速时偶尔抖动,且行驶中加速无力。 图1 VQ23发动机的气缸编号 故障诊断接车后试车,发动机怠速运转平稳,但只要换挡起步,稍微踩下一点加速踏板,就能感觉到车身明显抖动。用故障检测仪检测,发动机控制模块(ECM)无故障代码存储,且无失火数据流。用虹科Pico汽车示波器测量气缸1点火信号(COP点火信号)和曲轴位置传感器信
    虹科Pico汽车示波器 2025-01-23 10:46 74浏览
  • Ubuntu20.04默认情况下为root账号自动登录,本文介绍如何取消root账号自动登录,改为通过输入账号密码登录,使用触觉智能EVB3568鸿蒙开发板演示,搭载瑞芯微RK3568,四核A55处理器,主频2.0Ghz,1T算力NPU;支持OpenHarmony5.0及Linux、Android等操作系统,接口丰富,开发评估快人一步!添加新账号1、使用adduser命令来添加新用户,用户名以industio为例,系统会提示设置密码以及其他信息,您可以根据需要填写或跳过,命令如下:root@id
    Industio_触觉智能 2025-01-17 14:14 145浏览
  •  光伏及击穿,都可视之为 复合的逆过程,但是,复合、光伏与击穿,不单是进程的方向相反,偏置状态也不一样,复合的工况,是正偏,光伏是零偏,击穿与漂移则是反偏,光伏的能源是外来的,而击穿消耗的是结区自身和电源的能量,漂移的载流子是 客席载流子,须借外延层才能引入,客席载流子 不受反偏PN结的空乏区阻碍,能漂不能漂,只取决于反偏PN结是否处于外延层的「射程」范围,而穿通的成因,则是因耗尽层的过度扩张,致使跟 端子、外延层或其他空乏区 碰触,当耗尽层融通,耐压 (反向阻断能力) 即告彻底丧失,
    MrCU204 2025-01-17 11:30 210浏览
  • 高速先生成员--黄刚这不马上就要过年了嘛,高速先生就不打算给大家上难度了,整一篇简单但很实用的文章给大伙瞧瞧好了。相信这个标题一出来,尤其对于PCB设计工程师来说,心就立马凉了半截。他们辛辛苦苦进行PCB的过孔设计,高速先生居然说设计多大的过孔他们不关心!另外估计这时候就跳出很多“挑刺”的粉丝了哈,因为翻看很多以往的文章,高速先生都表达了过孔孔径对高速性能的影响是很大的哦!咋滴,今天居然说孔径不关心了?别,别急哈,听高速先生在这篇文章中娓娓道来。首先还是要对各位设计工程师的设计表示肯定,毕竟像我
    一博科技 2025-01-21 16:17 159浏览
  • 飞凌嵌入式基于瑞芯微RK3562系列处理器打造的FET3562J-C全国产核心板,是一款专为工业自动化及消费类电子设备设计的产品,凭借其强大的功能和灵活性,自上市以来得到了各行业客户的广泛关注。本文将详细介绍如何启动并测试RK3562J处理器的MCU,通过实际操作步骤,帮助各位工程师朋友更好地了解这款芯片。1、RK3562J处理器概述RK3562J处理器采用了4*Cortex-A53@1.8GHz+Cortex-M0@200MHz架构。其中,4个Cortex-A53核心作为主要核心,负责处理复杂
    飞凌嵌入式 2025-01-24 11:21 24浏览
  •     IPC-2581是基于ODB++标准、结合PCB行业特点而指定的PCB加工文件规范。    IPC-2581旨在替代CAM350格式,成为PCB加工行业的新的工业规范。    有一些免费软件,可以查看(不可修改)IPC-2581数据文件。这些软件典型用途是工艺校核。    1. Vu2581        出品:Downstream     
    电子知识打边炉 2025-01-22 11:12 134浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦