GTC25|影响深远的创新:NVIDIAResearch如何推动AI、图形及其他领域的变革性工作

原创 英伟达NVIDIA中国 2025-03-26 18:20

近二十年来,NVIDIA Research 的研究成果催生了包括 NVIDIA DLSS、NVLink 和 Cosmos 在内的标志性产品。



NVIDIA 众多具有里程碑意义的创新(驱动 AI、加速计算、实时光线追踪以及无缝连接数据中心提供支持的基础性技术),其根源都可以追溯其研究机构——NVIDIA Research。这个团队由全球约 400 名专家组成,其研究领域包括计算机架构、生成式 AI、图形和机器人等。


NVIDIA Research 成立于 2006 年,自 2009 年起由斯坦福大学计算机科学系前系主任 Bill Dally 领导。在企业设立的研究机构中,NVIDIA Research 独树一帜,其使命是攻克复杂的技术难题的同时对公司和世界产生深远影响。


NVIDIA Research 首席科学家兼高级副总裁 Bill Dally 表示:“在开展卓越研究的同时我们努力确保研究工作与公司业务紧密相关。只做到其中一点很容易,两者兼顾则颇具挑战。”


在 NVIDIA GTC 大会上,Dally 和 NVIDIA Research 的团队领导们分享了该团队的创新成果。NVIDIA GTC 是 AI 领域的顶尖开发者大会,上周在美国加州圣何塞举行。


在描述使命时,许多研究机构会表示其研究项目的时间跨度比产品团队的项目更长,但 NVIDIA 研究人员寻求的是具有更大“风险跨度”的项目。一旦成功,这些项目便有可能获得巨大回报。


图形研究副总裁、NVIDIA 首位研究员 David Luebke 表示:“我们的使命是做对公司有益的事。这不是为了打造一个陈列最佳论文奖的荣誉室或为了建立研究人员名人堂。我们是一小群人,有幸能够研究可能失败的想法。因此,我们有责任不浪费机会,在那些一旦成功就能产生重大影响的项目上全力以赴。”


点击视频,速览 NVIDIA Research 如何推动

人工智能、图形及其他领域的变革性工作


作为一个团队进行创新


NVIDIA 的核心价值观之一是“one team”,这体现了对协作的高度重视,有助于研究人员与产品团队和业内相关人士紧密合作,将他们的想法转化为对现实世界的影响。


NVIDIA 应用深度学习研究副总裁 Bryan Catanzaro 表示:“NVIDIA 的每个人都积极寻求合作,因为 NVIDIA 所做的加速计算工作需要进行全栈优化。如果每项技术都孤立存在,每个人都各自为政,就无法实现这一目标。大家必须作为一个团队齐心协力,才能实现加速。”


在评估潜在项目时,NVIDIA 的研究人员会考虑其更适合研究团队还是产品团队、相关工作是否值得在顶级会议上发表,以及对整个公司是否有明显的潜在益处。如果决定推进该项目,就会与关键利益相关者进行合作。


Catanzaro 表示:“我们与他人合作,将想法变为现实。我们在这个过程中常常发现,在实验室里看似很棒的想法在现实世界中并非一定有效。在这种紧密的合作中,研究团队需要保持谦逊,向公司其它部门学习,了解如何才能让自己的想法变成现实。”


通过论文、技术会议以及 GitHub 和 Hugging Face 等开源平台,该团队分享了大量成果。但他们的重点始终放在对行业的影响上。


Luebke 表示:“我们认为,发表论文是我们工作的一个重要附带成果,但这并非我们的核心目的。”


NVIDIA Research 的首个工作重点是光线追踪,经过十年的持续努力,最终直接催生了 NVIDIA RTX,这一发布重新定义了实时计算机图形。如今,NVIDIA Research 包含多个专业团队,涉及芯片设计、网络、编程系统、LLM、基于物理学的模拟、气候科学、人形机器人和自动驾驶汽车等领域,并且还在不断拓展研究领域并吸纳全球专业人才。


改变 NVIDIA 与整个行业


NVIDIA Research 不仅为公司一些最知名的产品奠定了基础,其创新成果还推动并开启了如今的 AI 和加速计算时代。


这一切始于 2006 年推出的 CUDA,它是一个并行计算软件平台和编程模型,使研究人员能够利用 GPU 加速多种应用。通过 CUDA,开发者可以轻松地利用 GPU 的并行处理能力,从而加快科学模拟、游戏软件以及 AI 模型创建的速度。


Luebke 表示:“对于 NVIDIA 而言,开发 CUDA 是最具变革性的一件事。这发生在我们成立正式研究团队之前,最终大获成功是因为我们聘请了顶尖的研究人员,并让他们与顶尖架构师合作。”


让光线追踪成为现实


NVIDIA Research 成立后,其研究人员便开始致力于研究 GPU 加速的光线追踪技术,花费数年时间开发了相关算法和硬件,最终实现了这项技术。2009 年,该项目由已故的实时光线追踪先驱、NVIDIA 专业图形副总裁 Steven Parker 领导,随着 NVIDIA OptiX 应用框架进入产品阶段,并在 2010 年的 SIGGRAPH 论文中进行了详细介绍。


研究人员的工作不断拓展,通过与 NVIDIA 架构团队合作,最终成功地开发了 NVIDIA RTX 光线追踪技术,其中包括为游戏玩家和专业创作者实现实时光线追踪的 RT Core。


2018 年推出的 NVIDIA RTX 还标志着 NVIDIA Research 另一项创新成果的诞生:NVIDIA DLSS(深度学习超级采样)。借助 DLSS 技术,图形渲染工作流不再需要绘制视频中的所有像素。相反,只需绘制一小部分像素,然后由 AI 工作流根据这些信息生成清晰的高分辨率图像。


点击视频,观看 DLSS 技术演示


为几乎所有应用加速 AI


在 AI 软件领域,NVIDIA 研究人员的贡献始于面向 GPU 加速神经网络的 NVIDIA cuDNN 库。它是在深度学习尚处于起步阶段时作为研究项目开发出来的,于 2014 年作为产品发布。


随着深度学习迅速普及并发展出生成式 AI,NVIDIA Research 始终站在最前沿。NVIDIA StyleGAN 便是一个典型例子,这是一个开创性的视觉生成式 AI 模型,展示了神经网络如何快速地生成逼真的图像。


虽然生成对抗网络(GAN)已于 2014 年首次提出,但“StyleGAN 是第一个生成的图像能够符合照片视觉效果完全以假乱真的模型。这是一个具有分水岭意义的重大时刻,”Luebke 说道。


NVIDIA StyleGAN


NVIDIA 的研究人员推出了一系列广受欢迎的 GAN 模型,例如 AI 绘画工具 GauGAN,它后来发展成为 NVIDIA Canvas 应用程序。随着扩散模型、神经辐射场和高斯溅射技术的兴起,他们仍在推进视觉生成式 AI 的发展,包括最近推出的 3D 模型 Edify 3D 和 3DGUT。


NVIDIA GauGAN


在 LLM 领域,Megatron-LM 是一项应用研究计划,它能够高效地训练和推理大规模语言模型,用于内容生成、翻译和对话式 AI 等语言类任务。它已经被集成到用于开发定制生成式 AI 的 NVIDIA NeMo 平台中,该平台还包含起源于 NVIDIA Research 的语音识别和语音合成模型。


在芯片设计、网络、量子等领域不断取得突破


AI 和图形只是 NVIDIA Research 涉足的部分领域,其多个团队在芯片架构、电子设计自动化、编程系统、量子计算等领域也取得了诸多突破。


2012 年,Dally 提交了一份研究提案,该项目后来发展出了 NVIDIA NVLink 和 NVSwitch。这是一种高速互连技术,能够在加速计算系统中实现 GPU 和 CPU 处理器之间的快速通信。


NVLink Switch 托盘


2013 年,电路研究团队发表了关于芯片间链路的研究成果,其中引入了一种与该互连技术联合设计的信令系统,实现了裸片之间的高速、小面积、低功耗连接。该项目最终成为了 NVIDIA Grace CPU 和 NVIDIA Hopper GPU 之间的连接技术。


2021 年,ASIC 和 VLSI 研究小组开发了一种名为 VS-Quant 的 AI 加速器软硬件协同设计技术,使许多机器学习模型能够以 4 位权重和 4 位激活精度高效地运行。他们的工作影响了 NVIDIA Blackwell 架构中 FP4 精度支持的开发。


今年 CES 上发布的 NVIDIA Cosmos 平台也是 NVIDIA Research 开发的,旨在加速开发面向新一代机器人和自动驾驶汽车的物理 AI。详细信息,请阅读相关研究论文并收听关于Cosmos 的 AI 播客节目。


欢迎在 GTC 大会上了解关于 NVIDIA Research 的更多信息。



点击“阅读原文”扫描下方海报二维码,观看 NVIDIA CEO 黄仁勋主题演讲,中文字幕版已上线,了解代理式 AI、机器人、加速计算等领域的发展趋势,与我们一起探索 AI 的未来!



评论 (0)
  • 在当今竞争激烈的工业环境中,效率和响应速度已成为企业制胜的关键。为了满足这一需求,我们隆重推出宏集Panorama COOX,这是Panorama Suite中首款集成的制造执行系统(MES)产品。这一创新产品将Panorama平台升级为全面的工业4.0解决方案,融合了工业SCADA和MES技术的双重优势,帮助企业实现生产效率和运营能力的全面提升。深度融合SCADA与MES,开启工业新纪元宏集Panorama COOX的诞生,源于我们对创新和卓越运营的不懈追求。通过战略性收购法国知名MES领域专
    宏集科技 2025-03-27 13:22 218浏览
  • 六西格玛首先是作为一个量度质量水平的指标,它代表了近乎完美的质量的水平。如果你每天都吃一个苹果,有一间水果店的老板跟你说,他们所卖的苹果,质量达到六西格玛水平,换言之,他们每卖一百万个苹果,只会有3.4个是坏的。你算了一下,发现你如果要从这个店里买到一个坏苹果,需要805年。你会还会选择其他店吗?首先发明六西格玛这个词的人——比尔·史密斯(Bill Smith)他是摩托罗拉(Motorloa)的工程师,在追求这个近乎完美的质量水平的时候,发明了一套方法模型,开始时是MAIC,后来慢慢演变成DMA
    优思学院 2025-03-27 11:47 169浏览
  • 家电,在人们的日常生活中扮演着不可或缺的角色,也是提升人们幸福感的重要组成部分,那你了解家电的发展史吗?#70年代结婚流行“四大件”:手表、自行车、缝纫机,收音机,合成“三转一响”。#80年代随着改革开放的深化,中国经济开始飞速发展,黑白电视机、冰箱、洗衣机这“新三件”,成为了人们对生活的新诉求。#90年代彩电、冰箱、全自动洗衣机开始大量进入普通家庭,快速全面普及,90年代末,家电产品实现了从奢侈品到必需品的转变。#00年代至今00年代,随着人们追求高品质生活的愿望,常用的电视机、洗衣机等已经远
    启英AI平台 2025-03-25 14:12 92浏览
  • 案例概况在丹麦哥本哈根,西门子工程师们成功完成了一项高安全设施的数据集成项目。他们利用宏集Cogent DataHub软件,将高安全设施内的设备和仪器与远程监控位置连接起来,让技术人员能够在不违反安全规定、不引入未经授权人员的情况下,远程操作所需设备。突破OPC 服务器的远程连接难题该项目最初看似是一个常规的 OPC 应用:目标是将高安全性设施中的冷水机(chiller)设备及其 OPC DA 服务器,与远程监控站的两套 SCADA 系统(作为 OPC DA 客户端)连接起来。然而,在实际实施过
    宏集科技 2025-03-27 13:20 120浏览
  • 在嵌入式语音系统的开发过程中,广州唯创电子推出的WT588系列语音芯片凭借其优异的音质表现和灵活的编程特性,广泛应用于智能终端、工业控制、消费电子等领域。作为该系列芯片的关键状态指示信号,BUSY引脚的设计处理直接影响着系统交互的可靠性和功能拓展性。本文将从电路原理、应用场景、设计策略三个维度,深入解析BUSY引脚的技术特性及其工程实践要点。一、BUSY引脚工作原理与信号特性1.1 电气参数电平标准:输出3.3V TTL电平(与VDD同源)驱动能力:典型值±8mA(可直接驱动LED)响应延迟:语
    广州唯创电子 2025-03-26 09:26 218浏览
  • 在电子设计中,电磁兼容性(EMC)是确保设备既能抵御外部电磁干扰(EMI),又不会对自身或周围环境产生过量电磁辐射的关键。电容器、电感和磁珠作为三大核心元件,通过不同的机制协同作用,有效抑制电磁干扰。以下是其原理和应用场景的详细解析:1. 电容器:高频噪声的“吸尘器”作用原理:电容器通过“通高频、阻低频”的特性,为高频噪声提供低阻抗路径到地,形成滤波效果。例如,在电源和地之间并联电容,可吸收电源中的高频纹波和瞬态干扰。关键应用场景:电源去耦:在IC电源引脚附近放置0.1μF陶瓷电容,滤除数字电路
    时源芯微 2025-03-27 11:19 186浏览
  • ​2025年3月27日​,贞光科技授权代理品牌紫光同芯正式发布新一代汽车安全芯片T97-415E。作为T97-315E的迭代升级产品,该芯片以大容量存储、全球化合规认证、双SPI接口协同为核心突破,直击智能网联汽车"多场景安全并行"与"出口合规"两大行业痛点,助力车企抢占智能驾驶与全球化市场双赛道。行业趋势锚定:三大升级回应智能化浪潮1. 大容量存储:破解车联网多任务瓶颈随着​车机功能泛在化​(数字钥匙、OTA、T-BOX等安全服务集成),传统安全芯片面临存储资源挤占难题。T97-415E创新性
    贞光科技 2025-03-27 13:50 170浏览
  • 汽车导航系统市场及应用环境参照调研机构GII的研究报告中的市场预测,全球汽车导航系统市场预计将于 2030年达到472亿美元的市场规模,而2024年至2030年的年复合成长率则为可观的6.7%。汽车导航系统无疑已成为智能汽车不可或缺的重要功能之一。随着人们在日常生活中对汽车导航功能的日渐依赖,一旦出现定位不准确或地图错误等问题,就可能导致车主开错路线,平白浪费更多行车时间,不仅造成行车不便,甚或可能引发交通事故的发生。有鉴于此,如果想要提供消费者完善的使用者体验,在车辆开发阶段便针对汽车导航功能
    百佳泰测试实验室 2025-03-27 14:51 221浏览
  • 文/陈昊编辑/cc孙聪颖‍2025 年,作为中国实施制造强国战略第一个十年计划的关键里程碑,被赋予了极为重大的意义。两会政府工作报告清晰且坚定地指出,要全力加速新质生产力的发展进程,推动传统产业全方位向高端化、智能化与绿色化转型。基于此,有代表敏锐提议,中国制造应从前沿技术的应用切入,逐步拓展至产业生态的构建,最终延伸到提升用户体验的维度,打出独树一帜、具有鲜明特色的发展牌。正是在这样至关重要的时代背景之下,于 AWE 2025(中国家电及消费电子博览会)这一备受瞩目的舞台上,高端厨房的中国方案
    华尔街科技眼 2025-03-25 16:10 90浏览
  • 在智能语音产品的开发过程中,麦克风阵列的选型直接决定了用户体验的优劣。广州唯创电子提供的单麦克风与双麦克风解决方案,为不同场景下的语音交互需求提供了灵活选择。本文将深入解析两种方案的性能差异、适用场景及工程实现要点,为开发者提供系统化的设计决策依据。一、基础参数对比分析维度单麦克风方案双麦克风方案BOM成本¥1.2-2.5元¥4.8-6.5元信噪比(1m)58-62dB65-68dB拾音角度全向360°波束成形±30°功耗8mW@3.3V15mW@3.3V典型响应延迟120ms80ms二、技术原
    广州唯创电子 2025-03-27 09:23 180浏览
  • WT588F02B是广州唯创电子推出的一款高性能语音芯片,广泛应用于智能家电、安防设备、玩具等领域。然而,在实际开发中,用户可能会遇到烧录失败的问题,导致项目进度受阻。本文将从下载连线、文件容量、线路长度三大核心因素出发,深入分析烧录失败的原因并提供系统化的解决方案。一、检查下载器与芯片的物理连接问题表现烧录时提示"连接超时"或"设备未响应",或烧录进度条卡顿后报错。原因解析接口错位:WT588F02B采用SPI/UART双模通信,若下载器引脚定义与芯片引脚未严格对应(如TXD/RXD交叉错误)
    广州唯创电子 2025-03-26 09:05 150浏览
  • 长期以来,智能家居对于大众家庭而言就像空中楼阁一般,华而不实,更有甚者,还将智能家居认定为资本家的营销游戏。商家们举着“智慧家居、智慧办公”的口号,将原本价格亲民、能用几十年的家电器具包装成为了高档商品,而消费者们最终得到的却是家居设备之间缺乏互操作性、不同品牌生态之间互不兼容的碎片化体验。这种早期的生态割裂现象致使消费者们对智能家居兴趣缺失,也造就了“智能家居无用论”的刻板印象。然而,自Matter协议发布之后,“命运的齿轮”开始转动,智能家居中的生态割裂现象与品牌生态之间的隔阂正被基于IP架
    华普微HOPERF 2025-03-27 09:46 133浏览
我要评论
0
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦