GTC25|NVIDIA推出开源物理AI数据集,助力机器人及自动驾驶汽车技术发展

原创 英伟达NVIDIA中国 2025-03-21 17:40

标准化合成数据的初始版本预计将成为世界上最大的此类数据集,目前已作为开源版本提供给机器人开发人员。



训练自主机器人和车辆与物理世界有效互动需要海量高质量的数据,为了让研究人员和开发者赢得先机,NVIDIA 现发布大型开源数据集,助力构建下一代物理 AI。


这个商业级、预先验证的数据集在加利福尼亚州圣何塞举办的全球 AI 大会 NVIDIA GTC 上正式发布,将帮助研究人员和开发者克服从零开始的挑战,顺利启动物理 AI 项目。开发者可以利用数据集开展模型预训练、测试和验证,或用于后训练以调优世界基础模型,加快部署进程。


初始数据集现可通过 Hugging Face 平台下载,为开发者提供 15 TB 数据,包含超过 320,000 条机器人训练轨迹,以及包含 SimReady 资源集合在内的高达 1,000 个通用场景描述(OpenUSD)资源。此外,还即将发布支持端到端自动驾驶汽车开发的专用数据,其中包括时长为 20 秒的剪辑片段,覆盖美国和二十多个欧洲国家/地区 1,000 多个城市的各种交通场景。


NVIDIA 物理 AI 数据集包含数百个 SimReady 资产,

可用于构建丰富的场景。


未来,该数据集有望发展为世界上最大的统一、开源的物理 AI 开发数据集。可以为多种 AI 开发模型提供支持,包括能安全穿越仓库环境的自主导航机器人、外科手术辅助机器人,以及在施工区等复杂交通场景下穿梭自如的自动驾驶汽车。


NVIDIA 物理 AI 数据集计划一系列真实数据和合成数据子集,并将使用这些数据通过多个平台来训练、测试和验证物理 AI,平台将包括 NVIDIA Cosmos 世界模型开发平台、NVIDIA DRIVE AV 软件栈、NVIDIA Isaac AI 机器人开发平台,以及 NVIDIA Metropolis 智慧城市应用框架。


加州大学伯克利分校 Berkeley DeepDrive 研究中心、卡内基梅隆安全 AI 实验室和加州大学圣地亚哥分校 Contextual 机器人研究所已经开始率先使用该数据集。


加州大学圣地亚哥分校多个机器人和自动驾驶汽车实验室的负责人 Henrik Christensen 表示:“利用这个数据集,我们能做很多工作,比如训练预测性 AI 模型,这些模型可以帮助自动驾驶汽车更好地追踪行人等易受伤害的道路使用者的动向,从而提高安全性。与现有的开源资源相比,这个数据集能提供多样化的场景和更长的视频片段,这将显著推动机器人技术和自动驾驶汽车的研究进展。”


满足物理 AI 数据需求


NVIDIA 物理 AI 数据集可以帮助开发者在预训练期间扩展 AI 性能,海量数据能够支持构建更强大的 AI 模型,在预训练阶段利用更丰富的数据对 AI 模型进行训练,以提高其在特定用例中的性能表现。


想要构建一个能准确反映真实世界物理特性及其动态变化的多样化场景数据集,需要投入大量时间开展数据采集、整理和标注工作,这成为了大多数开发者推进项目的一个瓶颈。对于学术研究人员和小型企业来说,部署车队进行长达数月的自动驾驶汽车 AI 数据收集既不现实且成本高昂,并且由于采集的视频大多为常规道路场景,仅有 10% 的数据可被用于训练。


但这种规模的数据采集对于构建安全、准确的商业级模型十分重要。NVIDIA Isaac GR00T 机器人模型需要数千小时的视频剪辑片段进行后训练,比如 GR00T N1,这一模型是在一个包含大量真实数据和合成数据的人形机器人数据集上进行训练的。NVIDIA DRIVE AV 自动驾驶汽车端到端 AI 模型需要数万小时的驾驶数据来开发。



该开源数据集收录了数千小时的多视角视频,其场景多样性、数据规模和覆盖地域范围都达到了前所未有的水平。这将为安全研究领域带来突破,特别是在识别异常行为和评估模型泛化等新兴研究方向。这项技术有助于 NVIDIA Halos 的全栈自动驾驶汽车安全系统。


除利用 NVIDIA 物理 AI 数据集来帮助满足数据需求外,开发者还可以通过 NVIDIA NeMo Curator 等工具进一步推动 AI 开发,这些工具可高效地处理用于训练和定制模型的庞大数据集。使用 NeMo Curator,只需两周就可以在 NVIDIA Blackwell GPU 上处理 2,000 万小时的视频,而使用未优化的 CPU 工作流则需要 3.4 年。


机器人开发者还可以利用新的 NVIDIA Isaac GR00T blueprint 来生成合成运动轨迹,这是一个基于 NVIDIA Omniverse 和 NVIDIA Cosmos 构建的参考工作流,利用少量的人类示范数据,即可大规模生成机器人合成运动轨迹。


大学实验室采用数据集进行 AI 开发


加州大学圣地亚哥分校机器人实验室包括专注于医疗应用、人形机器人和家庭辅助技术的团队。Christensen 预计,物理 AI 数据集中的机器人数据可以帮助开发语义 AI 模型,理解家庭、酒店房间或医院等空间的环境。


他说:“我们的核心目标之一是实现深度场景理解能力,如果机器人被要求整理杂货,它会确切地知道哪些物品需冰箱冷藏,哪些适合放在储藏室里。”


在自动驾驶汽车领域,Christensen 的实验室可以利用数据集来训练 AI 模型,以了解不同道路使用者的意图,并预测最佳的响应行动。他的研究团队还可以利用该数据集支持数字孪生开发,仿真极端情况和具有挑战性的天气条件。这些仿真场景可用于在真实世界环境中罕见的情况下,对自动驾驶模型进行训练和测试。


领先的自动驾驶系统 AI 研究中心 Berkeley DeepDrive 将该数据集用于开发自动驾驶汽车策略模型和世界基础模型。


Berkeley DeepDrive 联合主任 Wei Zhan 表示:“数据多样性对于训练基础模型非常重要。这个数据集能够为公共和私营部门团队开展前沿研究提供支持,帮助他们开发自动驾驶汽车和机器人 AI 模型。”


卡内基梅隆大学安全 AI 实验室的研究人员计划利用该数据集推进其评估和认证自动驾驶汽车安全性的工作。该团队计划对基于此数据集训练的物理 AI 基础模型在罕见场景仿真环境中的表现进行测试,并与基于现有数据集训练的自动驾驶模型作性能对比。


卡内基梅隆大学副教授兼安全 AI 实验室负责人 Ding Zhao 表示:“这个数据集涵盖不同类型的道路和地理位置、基础设施和天气环境,其多样性为训练具备物理世界因果推理能力的模型提供了重要的支持,特别是理解和处理极端案例和长尾问题方面有重要意义。”


请通过 Hugging Face 访问 NVIDIA 物理 AI 数据集。加入学习 OpenUSD 学习路径和机器人基础学习路径课程,掌握基础知识。


查看相关软件产品信息说明:

https://www.nvidia.cn/about-nvidia/terms-of-service/


点击“阅读原文”扫描下方海报二维码,观看 NVIDIA CEO 黄仁勋主题演讲回放,了解代理式 AI、机器人、加速计算等领域的发展趋势,与我们一起探索 AI 的未来!


评论 (0)
  • 导读在当今快速发展的智能通讯领域,时间敏感网络(TSN)已成为确保网络通信高可靠性和低延迟的关键技术。IEEE 802.1 Qci作为TSN的一个重要组成部分,提供了一套强大的机制来管理网络流量,确保关键数据流的优先级和带宽得到保障。本文将深入探讨IEEE 802.1 Qci协议的基本概念、工作原理以及虹科提供的Qci解决方案,帮您理解如何通过精确的流量控制来提升网络的稳定性和效率。虹科TSN解决方案01# 技术简介时间敏感网络(TSN)通过IEEE 802.1 Qci标准定义了一种关
    虹科工业智能互联 2025-04-21 16:17 77浏览
  • 导读在智能汽车技术发展浪潮中,车辆控制系统的智能化、网络化已成为行业发展的必然趋势。虹科PEAK智行定位车控系统,集成了尖端科技,能够实现车辆全方位监控与控制。从实时GPS定位到CAN/CAN FD信号处理,虹科方案不仅提升了车辆的智能化水平,更在安全性和效率上迈出了革命性的一步。虹科PEAK智行定位车控系统,通过CAN/CAN FD信号实现车辆的精准控制,包括加减速、转弯、倒退等动作,模拟真实车辆平台的动态表现。该系统搭载了虹科各型号设备,通过紧密协作,实时反映车辆位置、总线报文等信息,实现车
    虹科汽车智能互联 2025-04-21 16:04 75浏览
  •   海上安全事件应急处置系统平台深度解析   一、平台概述   北京华盛恒辉海上安全事件应急处置系统平台融合现代信息技术、通信技术、GIS、大数据分析及 AI 等技术,旨在快速响应船舶碰撞、火灾、溢油等海上突发事件,实现科学决策与高效资源调配,保障海上生命财产安全、减少环境污染。   应用案例   目前,已有多个海上安全事件应急处置系统在实际应用中取得了显著成效。例如,北京华盛恒辉和北京五木恒润海上安全事件应急处置系统。这些成功案例为海上安全事件应急处置系统的推广和应用提供了有力支持
    华盛恒辉l58ll334744 2025-04-21 15:21 87浏览
  •   海上安全事件应急处置系统解析   北京华盛恒辉海上安全事件应急处置系统是为应对船舶碰撞、火灾等海上突发事件打造的综合管理体系,通过技术与协同机制,实现快速响应救援、优化资源配置,守护海上生命、财产与环境安全。以下从系统构成、功能、技术、应用及趋势展开阐述。   应用案例   目前,已有多个海上安全事件应急处置系统在实际应用中取得了显著成效。例如,北京华盛恒辉和北京五木恒润海上安全事件应急处置系统。这些成功案例为海上安全事件应急处置系统的推广和应用提供了有力支持。   一、系统构成
    华盛恒辉l58ll334744 2025-04-21 15:50 68浏览
  • 导读Linux驱动程序领域再添新成员,PLIN驱动程序现已正式发布。这一新驱动程序为使用LIN接口的用户提供了一个便捷、高效的解决方案。本文将展示如何安装PLIN驱动程序,以及如何在Linux环境下进行基本的PLIN通信操作,确保您能够快速掌握并应用这一新工具。继我们在Linux环境下成功推出CAN/CAN FD接口驱动程序后,现在我们为LIN接口带来了同样兼容Linux的驱动程序。免费软件包中不仅包含了驱动程序本身,还提供实用工具和一份易于理解的快速入门指南。用户下载后,需要根据当前使用的Li
    虹科汽车智能互联 2025-04-21 14:56 60浏览
  •   有效数据智能分拣系统平台深度解析   一、系统概述   北京华盛恒辉有效数据智能分拣系统平台融合人工智能、机器视觉、物联网及大数据分析技术,为物流包裹、数据信息等提供高效精准的智能化分拣处理方案。通过自动化设备与智能算法协同运作,取代传统人工分拣模式,显著提升分拣效率、降低错误率,满足电商、快递及供应链不断增长的业务需求。   应用案例   目前,已有多个有效数据智能分拣系统在实际应用中取得了显著成效。例如,北京华盛恒辉和北京五木恒润有效数据智能分拣系统。这些成功案例为有效数据智能分
    华盛恒辉l58ll334744 2025-04-21 16:22 120浏览
  •   电磁信号模拟平台解析   北京华盛恒辉电磁信号模拟平台作为模拟复杂电磁环境的系统,在无线通信、电子对抗等多领域广泛应用。以下从功能、技术特性、应用场景及发展趋势展开详细解读。   应用案例   目前,已有多个电磁信号模拟平台在实际应用中取得了显著成效。例如,北京华盛恒辉和北京五木恒润电磁信号模拟平台。这些成功案例为电磁信号模拟平台的推广和应用提供了有力支持。   一、核心功能   复杂电磁环境建模:构建贴近真实的电磁环境,涵盖各类干扰因素。   多通道信号模拟:模拟多通道电磁信号
    华盛恒辉l58ll334744 2025-04-21 15:10 98浏览
  •   有效数据智能分拣系统详解   北京华盛恒辉有效数据智能分拣系统融合人工智能、大数据分析与机器学习等前沿技术,实现海量数据自动化分类、筛选、整理及分配。凭借强大的数据处理效能,助力企业精准提取关键信息,优化决策流程,提升运营效率。以下从系统架构、核心功能、技术特性、应用场景及发展趋势展开解读。   应用案例   目前,已有多个有效数据智能分拣系统在实际应用中取得了显著成效。例如,北京华盛恒辉和北京五木恒润有效数据智能分拣系统。这些成功案例为有效数据智能分拣系统的推广和应用提供了有力支持。
    华盛恒辉l58ll334744 2025-04-21 16:46 105浏览
  • 导读在汽车测试和现代工业领域,功耗控制与效率优化是工程师们不断追求的目标。虹科PCAN Router系列设备以其卓越的性能和灵活性,为CAN/CAN FD网络中的报文转换提供了高效解决方案。本文将探讨虹科PCAN Router系列设备如何在保持高效工作的同时,通过低功耗模式和高效唤醒功能,满足对能耗有严格要求的应用场景。虹科PCAN Router系列网关1 低功耗模式的优势与实现在实际的工作场景中,可能会出现一些对功耗要求存在限制的情况。鉴于此,可以灵活设置虹科PCAN Router系
    虹科汽车智能互联 2025-04-21 15:45 65浏览
  • 职场烂摊子,每个人都难免遇上如果你在职场待久了,总会碰到一些让人无奈的情况:比如刚接手的项目混乱不堪、前任同事留下的任务一团乱麻,甚至有时因为自己的疏忽造成麻烦。面对这种烂摊子,烦躁、焦虑、甚至怀疑人生的情绪都会扑面而来。但如果你冷静想想,会发现真正消耗你的,往往不是工作本身,而是持续不断的心理内耗。那么问题来了,如何摆脱内耗,快速有效地“自救”?摆脱内耗,从情绪中抽离我曾经历过一个典型的职场烂摊子:前任项目负责人突然辞职,项目资料缺失严重,进度远远落后,客户抱怨不断。当时接手后的第一反应就是慌
    优思学院 2025-04-21 18:21 8浏览
  • 引言:老龄化社会的健康守护需求随着全球老龄化进程加速,老年人的健康管理与生活质量成为社会焦点。记忆衰退、用药混乱、日程遗漏等问题频发,催生了智能健康设备的市场需求。WTR096录音语音芯片,凭借其高度集成的录放音、计时时钟与计划管理功能,为老年人量身打造了一站式健康管理方案,重新定义智能语音时钟的价值。功能亮点:1. 用药安全守护:多维度提醒,拒绝遗忘多时段精准提醒:支持一天内设置多个用药时间(如早、中、晚),适配复杂用药需求。个性化语音定制:家属可录制专属提醒语音(如“上午9点,请服用降压药”
    广州唯创电子 2025-04-22 08:41 12浏览
  • 精益生产咨询师证/精益管理专业人员证/精益生产工程师证虽然在名称上有一些差异,但其实实际区别并不大,目前类似的证书以ILSSI-CLMP较为得到国际上的认可,当然,你不会因为有一张精益生产咨询师证,而会有人马上请你做咨询师,因为除了知识之外,你还要有充足经验、热诚、沟通能力等等,这些也是我们招聘咨询师的基本要求。那么,有没有必要取得CLMP证书呢?这主要取决于你自己对职业发展的规划和自我提升的意志。CLMP是什么?CLMP的全称是Certified Lean Management Profess
    优思学院 2025-04-21 14:29 45浏览
  • 在汽车行业的变革浪潮中,智界汽车的诞生备受瞩目。作为华为与奇瑞两大巨头携手合作的结晶,智界汽车自孕育之初便承载着众人的期待,被视为融合前沿科技与卓越制造的典范,有望在竞争激烈的新能源汽车市场中开辟出一片新天地。2024年,智界品牌首款车型智界S7正式上市,凭借华为的技术赋能,如先进的鸿蒙智能座舱、强大的HUAWEI ADS高阶智能驾驶辅助系统,以及奇瑞多年积累的深厚造车底蕴,在上市前赚足了眼球。智界S7的亮相,犹如一颗投入平静湖面的石子,激起了层层涟漪,消费者对其充满了好奇与期待,行业内也纷纷将
    用户1742991715177 2025-04-21 20:28 5浏览
  • 北京贞光科技有限公司作为紫光同芯授权代理商,深耕电子元器件领域数十载,专为汽车与工业客户提供车规级安全芯片及配套服务。公司整合硬件供应、软件SDK与技术支持为一体,配备专业团队提供选型咨询与现场指导,助力客户实现完整的芯片应用解决方案。在全球芯片供应链重构的大背景下,我国车规级芯片产业正迎来前所未有的发展机遇。北京贞光科技有限公司作为紫光同芯授权代理商,深耕电子元器件领域数十载,专为汽车与工业客户提供车规级安全芯片及配套服务。公司整合硬件供应、软件SDK与技术支持为一体,配备专业团队提供选型咨询
    贞光科技 2025-04-21 16:10 82浏览
  • 在消费金融的赛道上,马上消费曾是备受瞩目的明星企业。自2015年成立以来,它以年均 30% 的净利润增速一路狂奔,成为持牌消费金融公司的标杆,2023年更是斩获19.82亿元净利润,风光无限。然而,2024年却成了马上消费的一道分水岭。2024年上半年,其营收为77.38亿元,同比下降2.11%;净利润更是同比骤降20.66%,仅为10.68亿元,创下历史最大跌幅 。与此同时,不良贷款率攀升至2.5%,不良余额高达16.54亿元,核心资本充足率降至12.72%,融资
    用户1742991715177 2025-04-21 21:29 15浏览
我要评论
0
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦