GTC25|NVIDIA推出开源物理AI数据集,助力机器人及自动驾驶汽车技术发展

原创 英伟达NVIDIA中国 2025-03-21 17:40

标准化合成数据的初始版本预计将成为世界上最大的此类数据集,目前已作为开源版本提供给机器人开发人员。



训练自主机器人和车辆与物理世界有效互动需要海量高质量的数据,为了让研究人员和开发者赢得先机,NVIDIA 现发布大型开源数据集,助力构建下一代物理 AI。


这个商业级、预先验证的数据集在加利福尼亚州圣何塞举办的全球 AI 大会 NVIDIA GTC 上正式发布,将帮助研究人员和开发者克服从零开始的挑战,顺利启动物理 AI 项目。开发者可以利用数据集开展模型预训练、测试和验证,或用于后训练以调优世界基础模型,加快部署进程。


初始数据集现可通过 Hugging Face 平台下载,为开发者提供 15 TB 数据,包含超过 320,000 条机器人训练轨迹,以及包含 SimReady 资源集合在内的高达 1,000 个通用场景描述(OpenUSD)资源。此外,还即将发布支持端到端自动驾驶汽车开发的专用数据,其中包括时长为 20 秒的剪辑片段,覆盖美国和二十多个欧洲国家/地区 1,000 多个城市的各种交通场景。


NVIDIA 物理 AI 数据集包含数百个 SimReady 资产,

可用于构建丰富的场景。


未来,该数据集有望发展为世界上最大的统一、开源的物理 AI 开发数据集。可以为多种 AI 开发模型提供支持,包括能安全穿越仓库环境的自主导航机器人、外科手术辅助机器人,以及在施工区等复杂交通场景下穿梭自如的自动驾驶汽车。


NVIDIA 物理 AI 数据集计划一系列真实数据和合成数据子集,并将使用这些数据通过多个平台来训练、测试和验证物理 AI,平台将包括 NVIDIA Cosmos 世界模型开发平台、NVIDIA DRIVE AV 软件栈、NVIDIA Isaac AI 机器人开发平台,以及 NVIDIA Metropolis 智慧城市应用框架。


加州大学伯克利分校 Berkeley DeepDrive 研究中心、卡内基梅隆安全 AI 实验室和加州大学圣地亚哥分校 Contextual 机器人研究所已经开始率先使用该数据集。


加州大学圣地亚哥分校多个机器人和自动驾驶汽车实验室的负责人 Henrik Christensen 表示:“利用这个数据集,我们能做很多工作,比如训练预测性 AI 模型,这些模型可以帮助自动驾驶汽车更好地追踪行人等易受伤害的道路使用者的动向,从而提高安全性。与现有的开源资源相比,这个数据集能提供多样化的场景和更长的视频片段,这将显著推动机器人技术和自动驾驶汽车的研究进展。”


满足物理 AI 数据需求


NVIDIA 物理 AI 数据集可以帮助开发者在预训练期间扩展 AI 性能,海量数据能够支持构建更强大的 AI 模型,在预训练阶段利用更丰富的数据对 AI 模型进行训练,以提高其在特定用例中的性能表现。


想要构建一个能准确反映真实世界物理特性及其动态变化的多样化场景数据集,需要投入大量时间开展数据采集、整理和标注工作,这成为了大多数开发者推进项目的一个瓶颈。对于学术研究人员和小型企业来说,部署车队进行长达数月的自动驾驶汽车 AI 数据收集既不现实且成本高昂,并且由于采集的视频大多为常规道路场景,仅有 10% 的数据可被用于训练。


但这种规模的数据采集对于构建安全、准确的商业级模型十分重要。NVIDIA Isaac GR00T 机器人模型需要数千小时的视频剪辑片段进行后训练,比如 GR00T N1,这一模型是在一个包含大量真实数据和合成数据的人形机器人数据集上进行训练的。NVIDIA DRIVE AV 自动驾驶汽车端到端 AI 模型需要数万小时的驾驶数据来开发。



该开源数据集收录了数千小时的多视角视频,其场景多样性、数据规模和覆盖地域范围都达到了前所未有的水平。这将为安全研究领域带来突破,特别是在识别异常行为和评估模型泛化等新兴研究方向。这项技术有助于 NVIDIA Halos 的全栈自动驾驶汽车安全系统。


除利用 NVIDIA 物理 AI 数据集来帮助满足数据需求外,开发者还可以通过 NVIDIA NeMo Curator 等工具进一步推动 AI 开发,这些工具可高效地处理用于训练和定制模型的庞大数据集。使用 NeMo Curator,只需两周就可以在 NVIDIA Blackwell GPU 上处理 2,000 万小时的视频,而使用未优化的 CPU 工作流则需要 3.4 年。


机器人开发者还可以利用新的 NVIDIA Isaac GR00T blueprint 来生成合成运动轨迹,这是一个基于 NVIDIA Omniverse 和 NVIDIA Cosmos 构建的参考工作流,利用少量的人类示范数据,即可大规模生成机器人合成运动轨迹。


大学实验室采用数据集进行 AI 开发


加州大学圣地亚哥分校机器人实验室包括专注于医疗应用、人形机器人和家庭辅助技术的团队。Christensen 预计,物理 AI 数据集中的机器人数据可以帮助开发语义 AI 模型,理解家庭、酒店房间或医院等空间的环境。


他说:“我们的核心目标之一是实现深度场景理解能力,如果机器人被要求整理杂货,它会确切地知道哪些物品需冰箱冷藏,哪些适合放在储藏室里。”


在自动驾驶汽车领域,Christensen 的实验室可以利用数据集来训练 AI 模型,以了解不同道路使用者的意图,并预测最佳的响应行动。他的研究团队还可以利用该数据集支持数字孪生开发,仿真极端情况和具有挑战性的天气条件。这些仿真场景可用于在真实世界环境中罕见的情况下,对自动驾驶模型进行训练和测试。


领先的自动驾驶系统 AI 研究中心 Berkeley DeepDrive 将该数据集用于开发自动驾驶汽车策略模型和世界基础模型。


Berkeley DeepDrive 联合主任 Wei Zhan 表示:“数据多样性对于训练基础模型非常重要。这个数据集能够为公共和私营部门团队开展前沿研究提供支持,帮助他们开发自动驾驶汽车和机器人 AI 模型。”


卡内基梅隆大学安全 AI 实验室的研究人员计划利用该数据集推进其评估和认证自动驾驶汽车安全性的工作。该团队计划对基于此数据集训练的物理 AI 基础模型在罕见场景仿真环境中的表现进行测试,并与基于现有数据集训练的自动驾驶模型作性能对比。


卡内基梅隆大学副教授兼安全 AI 实验室负责人 Ding Zhao 表示:“这个数据集涵盖不同类型的道路和地理位置、基础设施和天气环境,其多样性为训练具备物理世界因果推理能力的模型提供了重要的支持,特别是理解和处理极端案例和长尾问题方面有重要意义。”


请通过 Hugging Face 访问 NVIDIA 物理 AI 数据集。加入学习 OpenUSD 学习路径和机器人基础学习路径课程,掌握基础知识。


查看相关软件产品信息说明:

https://www.nvidia.cn/about-nvidia/terms-of-service/


点击“阅读原文”扫描下方海报二维码,观看 NVIDIA CEO 黄仁勋主题演讲回放,了解代理式 AI、机器人、加速计算等领域的发展趋势,与我们一起探索 AI 的未来!


评论 (0)
  • 如同任何对我们工作方式的改变,新的工作方式必然会遇到许多必须面对的挑战。如果不解决组织在实施精益六西格玛过程中面临的障碍以及如何克服它们的问题,那么关于精益六西格玛的讨论就不算完整。以下列举了组织在成功实施精益六西格玛时常见的几个障碍,以及克服它们的方法:1)对精益六西格玛方法论缺乏理解。抵触情绪通常源于对精益六西格玛方法论的不了解,以及不相信它能真正发挥作用。这种情况在所有层级的人员中都会出现,包括管理层。虽然教育培训可以帮助改善这一问题,但成功的项目往往是打消疑虑的最佳方式。归根结底,这是一
    优思学院 2025-03-20 12:35 104浏览
  • 故障现象 一辆2024款路虎发现运动版车,搭载2.0 L发动机,累计行驶里程约为5 000 km。车主反映,使用遥控器无法解锁车门,随后使用机械钥匙打开车门,踩下制动踏板,按压起动按钮,仪表盘提示“将智能钥匙放在图示位置,然后按下起动按钮”(图1)。 图1 故障车的仪表盘提示采用上述应急起动方法,发动机能够起动着机。上述故障现象已出现过多次,过一段时间又会恢复正常,这次故障出现要求将车辆拖入店内进行彻底检修。 故障诊断 车辆进店后进行试车,车辆一切功能又恢复正常。经过反复测试
    虹科Pico汽车示波器 2025-03-20 10:17 83浏览
  • 全球领先的光学解决方案供应商艾迈斯欧司朗(SIX:AMS)近日宣布,凭借AS1163独立智能驱动器(SAID)成为中国领先的智能集成系统产品汽车制造商宁波福尔达智能科技股份有限公司(“福尔达”)环境动态照明应用的关键供应商。此次合作标志着汽车技术发展的一个重要时刻,充分展现了AS1163在优化动态照明应用系统成本方面的多功能性和先进性能。该产品支持传感器集成,拥有专为车顶照明设计的超薄外形,并能提升车内照明系统的性能。AS1163是一款先进的智能LED驱动器,能够与开放系统协议(OSP)网络无缝
    艾迈斯欧司朗 2025-03-20 14:26 99浏览
  • 4月8-11日,第91届中国国际医疗器械博览会(CMEF)将在国家会展中心(上海)举办。这场全球瞩目的医疗科技盛宴以“创新科技,智领未来”为主题,旨在全方位展示医疗科技的最新成果,与来自全球的行业同仁一道,为全球医疗健康领域带来一场科技与商贸交融的产业“盛宴”。飞凌嵌入式作为专业的嵌入式技术解决方案提供商,一直致力于为医疗器械行业提供丰富的、高可靠性的嵌入式硬件主控解决方案。届时,飞凌嵌入式将为来自全球的观众带来适用于IVD、医疗影像、生命体征监测等医疗设备的嵌入式板卡、显控一体屏产品以及多款动
    飞凌嵌入式 2025-03-20 11:46 38浏览
  • PCIe 5.0应用环境逐步成形,潜在风险却蠢蠢欲动?随着人工智能、云端运算蓬勃发展,系统对于高速数据传输的需求不断上升,PCI Express(PCIe)成为服务器应用最广的传输技术,尤其在高效能运算HPC(High Performance Computing)及AI服务器几乎皆导入了最新的PCIe 5.0规格,使得数据传输的双向吞吐量达到了128GB/s,让这两类的服务器能够发挥最大的效能。不过随着PCIe 5.0的频率达到16GHz,PCB板因为高频而导致讯号衰减加剧的特性,使得厂商面临很
    百佳泰测试实验室 2025-03-20 13:47 99浏览
  • 近日,保定飞凌嵌入式技术有限公司(以下简称“飞凌嵌入式”)携手瑞芯微电子股份有限公司(以下简称“瑞芯微”)正式加入2025年全国大学生嵌入式芯片与系统设计竞赛(以下简称“嵌入式大赛”),并在应用赛道中设立专属赛题。本次嵌入式大赛,双方选用基于瑞芯微RK3588芯片设计的ELF 2开发板作为参赛平台,旨在通过此次合作,促进产教融合,共同推动嵌入式系统创新人才的培养。全国大学生嵌入式芯片与系统设计竞赛是一项A类电子设计竞赛,同时也是被教育部列入白名单的赛事,由中国电子学会主办,是学生保研、求职的公认
    飞凌嵌入式 2025-03-20 11:53 85浏览
  • 为有效降低人为疏失导致交通事故发生的发生率,各大汽车制造厂及系统厂近年来持续开发「先进驾驶辅助系统」ADAS, Advanced Driver Assistance Systems。在众多车辆安全辅助系统之中,「紧急刹车辅助系统」功能(AEB, Autonomous Emergency Braking)对于行车安全性的提升便有着相当大的帮助。AEB透过镜头影像模块与毫米波雷达感测前方目标,可在发生碰撞前警示或自动刹车以降低车辆损伤以及乘员伤害。面临的挑战以本次分享的客户个案为例,该车厂客户预计在
    百佳泰测试实验室 2025-03-20 15:07 103浏览
  •         在当今电子设备高度集成的时代,电路保护显得尤为重要。TVS管(瞬态电压抑制二极管)和压敏电阻作为一种高效的电路保护器件,被广泛应用于各种电子设备中,用以吸收突波,抑制瞬态过电压,从而保护后续电路免受损坏。而箝位电压,作为TVS管和压敏电阻的核心参数之一,直接关系到其保护性能的优劣。箝位电压的定义        箝位电压指瞬态保护器件(如TVS二极管、压敏电阻)在遭遇过压时,将电路电压限制在安全范围内的
    广电计量 2025-03-20 14:05 94浏览
  • 这是一个很有意思的话题,在职场人士之间争论不休。证书到底有没有用?有人支持,也有人反对。不过,在正式聊这个话题之前,我想先分享一个我亲身经历的真实故事。那时,我和同学们正在读管理学的研究生课程。有一次,我们的教授要求大家穿正装上课。这时,有个同学问了个很有趣的问题:“教授,某某的董事长可以穿得五颜六色,我们这些职场新人为什么非得穿正装?”教授听后,停顿了一下,然后淡定地回了句:“你当然也可以穿得五颜六色,但前提是——先成为某某的董事长那样的人。”这句话点出了一个事实:同一套规则,并不适用于所有人
    优思学院 2025-03-19 12:02 111浏览
  • 在电子制造领域,PCB(印刷电路板)的使用寿命直接决定了产品的长期稳定性和可靠性。捷多邦作为全球领先的PCB制造商,始终将质量放在首位,致力于为客户提供高可靠性、高性能的PCB解决方案。以下是捷多邦如何确保PCB使用寿命超过20年的核心技术与优势。 1. ​高品质原材料:从源头保障耐用性捷多邦采用国际认证的优质基材,如FR4、高频材料和高TG板材,确保PCB在高温、高湿等极端环境下的稳定性。通过严格的原材料筛选和入库检验,捷多邦从源头控制质量,避免因材料缺陷导致的失效问题。 
    捷多邦 2025-03-20 11:22 98浏览
  • 本文内容来自微信公众号【工程师进阶笔记】,以工程师的第一视角分析了飞凌嵌入式OK3506J-S开发板的产品优势,感谢原作者温老师的专业分享。前两周,有一位老朋友联系我,他想找人开发一款数据采集器,用来采集工业现场的设备数据,并且可以根据不同的业务场景,通过不同的接口把这些数据分发出去。我把他提的需求总结了一下,这款产品方案大概有以下功能接口,妥妥地一款工业网关,在网上也能找到很多类似的产品方案,为啥他不直接买来用?再跟朋友深入地聊了一下,他之所以联系我,是因为看到我在公众号介绍过一款由飞凌嵌入式
    飞凌嵌入式 2025-03-20 11:51 121浏览
  • 家电“以旧换新”政策的覆盖范围已从传统的八大类家电(冰箱、洗衣机、电视、空调、电脑、热水器、家用灶具、吸油烟机)扩展至各地根据本地特色和需求定制的“8+N”新品类。这一政策的补贴再叠加各大电商平台的优惠,家电销售规模显著增长,消费潜力得到进一步释放。晶尊微方案为升级换代的智能家电提供了高效且稳定的触摸感应和水位检测功能,使得操作更加便捷和可靠!主要体现在:水位检测1健康家电:养生壶、温奶器、加湿器的缺水保护安全2清洁电器:洗地机、扫地机器人的低液位和溢液提醒3宠物家电:宠物饮水机的缺水提醒/满水
    ICMAN 2025-03-20 15:23 146浏览
  • 贞光科技代理的品牌-光颉科技高精密薄膜电阻凭借0.01%的超高精度,在AI服务器电源模块中实现了精确电压分配、优化功率因数和减少热损耗,显著提升系统能效和可靠性。在当今的数字时代,人工智能(AI)服务器已成为数据中心的核心。随着AI应用的激增,服务器的性能和能效需求也在不断提高。电源模块作为服务器的关键组件,其性能直接影响整个系统的效率和可靠性。本文将探讨光颉科技高精密薄膜电阻,特别是其0.01%的精度,如何在AI服务器电源模块中提升能效。电源模块在AI服务器中的重要性电源模块负责将输入电源转换
    贞光科技 2025-03-20 16:55 156浏览
  • 流感季急诊室外彻夜排起的长队,手机屏幕里不断闪烁的重症数据,深夜此起彼伏的剧烈咳嗽声——当病毒以更狡猾的姿态席卷全球,守护健康的战争早已从医院前移到每个人的身上。在医学界公认的「72小时黄金预警期」里,可穿戴设备闪烁的光芒正穿透皮肤组织,持续捕捉血氧浓度、心率变异性和体温波动数据。这不是科幻电影的末日警报,而是光电传感器发出的生命预警,当体温监测精度精确到±0.0℃,当动态血氧检测突破运动伪影干扰……科技正在重新定义健康监护的时空边界。从智能手表到耳机,再到智能戒指和智能衣物,这些小巧的设备通过
    艾迈斯欧司朗 2025-03-20 15:45 169浏览
  • 在人工智能与物联网技术深度融合的今天,离线语音识别技术凭借其隐私安全、即时响应等优势,正在智能家居、工业控制等领域快速普及。广州唯创电子推出的WTK6900系列语音识别芯片,凭借其创新的离线命令词自学习功能,为用户提供了灵活高效的语音交互解决方案。本文将深入解析这一核心技术的工作原理及操作流程。一、智能自学习功能概述WTK6900系列芯片支持多模态学习方式,用户可通过物理按键、串口指令、语音命令或专用APP启动学习流程。其核心技术突破在于:全离线运行:所有学习过程均在本地完成,无需网络传输动态模
    广州唯创电子 2025-03-20 08:54 174浏览
我要评论
0
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦