如何训练自主移动机器人使用合成数据检测仓库托盘千斤顶

原创 英伟达NVIDIA中国 2023-11-08 19:58

在训练那些部署在自主移动机器人(AMR)上的感知 AI 模型时,合成数据可以发挥关键作用。这一过程在制造业中变得越来越重要。有关使用合成数据生成预训练模型,用于检测仓库中托盘的示例,可参见使用《OpenUSD 和合成数据开发托盘检测模型》一文:https://developer.nvidia.com/blog/developing-a-pallet-detection-model-using-openusd-and-synthetic-data/


本文将探讨如何训练 AMR 使用合成数据来检测仓库中的托盘千斤顶。托盘千斤顶通常用于抬起和运输重型托盘。在拥挤的仓库中,AMR 进行检测并避免与托盘千斤顶相撞是很重要的。


为了实现这一目标,有必要在不同的光照条件和遮挡下使用大量不同的数据集来训练 AI 模型。真实的数据很少能捕捉到潜在环境的全部范围,而合成数据生成(SDG)是由 3D 仿真生成的注释数据,使开发人员能够克服数据差距并引导模型训练过程。


视频 1:使用 NVIDIA Omniverse Replicator

为 NVIDIA Isaac Sim 生成合成数据


本次用例将通过处理数据来践行以数据为中心的方法,而不是通过更改模型参数去适应数据。这一过程首先使用 NVIDIA Isaac Sim 中的 NVIDIA Omniverse Replicator 生成合成数据,随后使用 NVIDIA TAO Toolkit 中的合成数据对模型进行训练,最后,将模型在真实数据上的性能可视化,并修改参数以生成更好的合成数据,达到期望的性能水平。


Omniverse Replicator 是 NVIDIA Omniverse 的核心扩展,是一个使个人和团队能够基于通用场景描述(OpenUSD)开发工作流的计算平台。Replicator 使开发者能够构建定制的合成数据生成管线,以生成数据来引导计算机视觉模型的训练。


迭代合成数据以提高模型性能


以下解释了本团队如何迭代合成数据,来提高目标检测模型的实际性能,并通过兼容 Omniverse Replicator API 的 Python 脚本详细介绍了这些步骤。


在每次迭代时,我们增量改变模型中的各种参数,并生成新的训练数据集,然后用实际数据验证模型的性能。我们持续这一过程,直到能够缩小仿真与现实之间的差距。


对象或场景参数变化的过程被称为域随机化。您可以随机化许多参数来快速生成新数据用于模型训练,这些参数包括位置、颜色、纹理、背景、物体和场景的光照。


OpenUSD 是一个可扩展的框架,一种 3D 场景描述技术,也是 NVIDIA Omniverse 的基础,让试验一个场景中的不同参数变得很容易。参数可以在单独的层中修改和测试,用户可以在这些层之上创建非破坏性编辑。


准备


在起步阶段,我们需要一个安装有 NVIDIA RTX GPU 和最新版本的 NVIDIA Isaac Sim 的系统。Isaac Sim 是一个可扩展的机器人仿真应用程序,其利用 Omniverse Replicator 的核心功能生成合成数据。有关安装和配置的详细信息,请参见文档:https://docs.omniverse.nvidia.com/isaacsim/latest/installation/requirements.html


当 Isaac Sim 启动并运行时,我们可以从 GitHub 上的 NVIDIA-AI-IOT/synthetic_data_generation_training_workflow 下载所有资产。


第一次迭代:改变颜色和摄像头位置


在第一次迭代中,我们改变了托盘千斤顶的颜色和姿势,以及摄像头的姿势。可以按照以下步骤在自己的会话中复制此场景。


首先加载舞台(Stage):


ENV_URL = "/Isaac/Environments/Simple_Warehouse/warehouse.usd"open_stage(prefix_with_isaac_asset_server(ENV_URL))


然后添加托盘千斤顶和摄像头到场景中。托盘千斤顶可以从 SimReady 资产库中加载。


PALLETJACKS = ["http://omniverse-content-production.s3-us-west-2.amazonaws.com/Assets/DigitalTwin/Assets/Warehouse/Equipment/Pallet_Trucks/Scale_A/PalletTruckScale_A01_PR_NVD_01.usd",            "http://omniverse-content-production.s3-us-west-2.amazonaws.com/Assets/DigitalTwin/Assets/Warehouse/Equipment/Pallet_Trucks/Heavy_Duty_A/HeavyDutyPalletTruck_A01_PR_NVD_01.usd",            "http://omniverse-content-production.s3-us-west-2.amazonaws.com/Assets/DigitalTwin/Assets/Warehouse/Equipment/Pallet_Trucks/Low_Profile_A/LowProfilePalletTruck_A01_PR_NVD_01.usd"] cam = rep.create.camera(clipping_range=(0.1, 1000000))


SimReady 或仿真就绪资产是包含精确物理属性和行为的物理精确 3D 对象。它们预装有模型训练所需的元数据和注释。


接下来,为托盘千斤顶和摄像头添加域随机化:


with cam:                rep.modify.pose(position=rep.distribution.uniform((-9.2, -11.8,     0.4), (7.2, 15.8, 4)),look_at=(0, 0, 0))      # Get the Palletjack body mesh and modify its color     with rep.get.prims(path_pattern="SteerAxles"):            rep.randomizer.color(colors=rep.distribution.uniform((0, 0, 0), (1, 1, 1)))    # Randomize the pose of all the added palletjacks   with rep_palletjack_group:      rep.modify.pose(   position=rep.distribution.uniform((-6, -6, 0), (6, 12, 0)),   rotation=rep.distribution.uniform((0, 0, 0), (0, 0, 360)),   scale=rep.distribution.uniform((0.01, 0.01, 0.01), (0.01, 0.01, 0.01)))


图 1. 显示托盘千斤顶随机颜色和位置与

随机摄像机的位置的合成图像


最后,配置用于注释数据的编写器:


writer = rep.WriterRegistry.get("KittiWriter") writer.initialize(output_dir=output_directory,                    omit_semantic_type=True,)


本例使用 Replicator 提供的 KittiWriter,以 KITTI 格式存储对象检测标签的注释,这将确保更容易与训练管线兼容。


结果


对于第一批合成数据,团队使用了 LOCO 数据集,这是一个用于物流的场景理解数据集,涵盖了检测物流特定对象的问题,以可视化现实世界的模型性能。


生成的图像显示,该模型仍然试图在拥挤的仓库中检测托盘千斤顶(图 2),在托盘千斤顶附近的物体周围创建了许多边界框。考虑到这是第一次训练迭代,这个结果在一定程度上是意料之中的,减少域差距将是后续迭代的重点。


图 2:在根据现实数据来验证模型后,

现实世界的图像显示了许多报错

第二次迭代:添加纹理和改变环境照明


在这次迭代中,除了第一次迭代中的托盘颜色和摄像头位置外,团队还随机化了纹理和环境照明。


激活纹理和光照的随机化:


# Randomize the lighting of the scene    with rep.get.prims(path_pattern="RectLight"):     rep.modify.attribute("color", rep.distribution.uniform((0, 0, 0), (1, 1, 1)))     rep.modify.attribute("intensity", rep.distribution.normal(100000.0, 600000.0))     rep.modify.visibility(rep.distribution.choice([True, False, False, False, False, False, False])) # select floor materialrandom_mat_floor = rep.create.material_omnipbr(diffuse_texture=rep.distribution.choice(textures),                                                    roughness=rep.distribution.uniform(0, 1),                                               metallic=rep.distribution.choice([0, 1]),                                                    emissive_texture=rep.distribution.choice(textures),           emissive_intensity=rep.distribution.uniform(0, 1000),)                       with rep.get.prims(path_pattern="SM_Floor"):          rep.randomizer.materials(random_mat_floor)


图 3 显示了生成的合成图像。可以看到已经添加到背景中的各种纹理和入射到物体上的不同类型的环境光。


图 3:不同纹理背景的托盘千斤顶的合成图像


结果


本次迭代的报错数量减少,增加了纹理和光照随机化。生成合成数据时的一个关键因素是确保结果数据集中数据的多样性。来自合成域的类似或重复数据可能无助于改善现实世界中的模型性能。


为了提高数据集的多样性,可以在场景中添加更多的随机化对象。这将在第三次迭代中解决,并且应该有助于改善模型的稳健性。


图 4. 现实世界的图像表明,经过随机纹理和光照图像的训练,该模型检测托盘千斤顶的精度更高


第三次迭代:添加干扰


本次迭代将额外的对象(称为干扰物)引入到场景中,这些干扰物增加了数据集的多样性。此次迭代还包括前两次迭代中的所有更改。


在场景中添加干扰物:


DISTRACTORS_WAREHOUSE = ["/Isaac/Environments/Simple_Warehouse/Props/S_TrafficCone.usd",                            "/Isaac/Environments/Simple_Warehouse/Props/S_WetFloorSign.usd",                            "/Isaac/Environments/Simple_Warehouse/Props/SM_BarelPlastic_A_01.usd",                            "/Isaac/Environments/Simple_Warehouse/Props/SM_BarelPlastic_A_02.usd",                            "/Isaac/Environments/Simple_Warehouse/Props/SM_BarelPlastic_A_03.usd"] # Modify the pose of all the distractors in the scenewith rep_distractor_group:        rep.modify.pose(position=rep.distribution.uniform((-6, -6, 0), (6, 12, 0)),            rotation=rep.distribution.uniform((0, 0, 0), (0, 0, 360)),            scale=rep.distribution.uniform(1, 1.5))


这个项目使用的所有资源都可以通过默认的 Isaac Sim 安装获得,并通过指定它们在核心服务器上的路径来加载它们。


图 5. 被常见仓库物体(干扰物)包围的

托盘千斤顶的合成图像


结果


图 6 显示了第三次迭代的结果。该模型能够准确地检测到托盘千斤顶,并且边界框较少。与第一次迭代相比,模型性能得到了显著改善。


图 6. 现实世界的图像显示,

该模型能够准确检测到托盘千斤顶


持续迭代


该团队在每次迭代中使用 5000 张图像来训练模型。您可以通过生成更多的变量和增加合成数据来继续迭代此工作流,以达到所需的精度。


我们使用 NVIDIA TAO Toolkit 来训练带有 resnet18 主干的 DetectNet_v2 模型进行这些实验。使用这个模型并不是工作流的要求,您可以利用使用注释生成的数据来训练您所选择的体系架构和框架的模型。


我们在实验中使用了 KITTI 编写器。也可以使用 Omniverse Replicator 编写自己的自定义编写器,以正确的注释格式生成数据,这将使您的训练工作流无缝兼容。


您还可以在训练过程中混合现实数据和合成数据来进行实验。在获得满意的评价指标后,最终模型可以在 NVIDIA Jetson 上进行优化和部署。


使用 Omniverse Replicator 

开发合成数据管线


通过使用 Omniverse Replicator,您可以构建自己的自定义合成数据生成管线或工具,以编程方式生成大量不同的合成数据集,以引导模型并快速迭代。引入各种类型的随机化为数据集增加了必要的多样性,使模型能够在各种条件下识别对象或是感兴趣的对象。


使用本文中的工作流,请访问 GitHub 上的 NVIDIA-AI-IOT/synthetic_data_generation_training_workflow。要查看完整的工作流,NVIDIA 的团队成员展示了如何使用 Omniverse Replicator 和合成数据来训练制造流程的对象检测模型(视频 2)。


视频 2:学习如何用合成数据训练计算机视觉模型


要构建自己的自定义合成数据生成管线,请免费下载 Omniverse,并按照说明开始使用 Omniverse 代码中的 Replicator。您也可以参加自定进度的在线课程“合成数据生成训练计算机视觉模型”,并观看最新的 Omniverse Replicator 教程。


  • 免费下载 Omniverse:

    https://www.nvidia.com/en-us/omniverse/download/

  • 开始使用 Omniverse 代码中的 Replicator:

    https://docs.omniverse.nvidia.com/extensions/latest/ext_replicator/getting_started.html

  • 通过合成数据生成训练计算机视觉模型:

    https://courses.nvidia.com/courses/course-v1:DLI+S-OV-10+V1/

  • 最新的 Omniverse Replicator 教程:

    https://www.nvidia.com/en-us/on-demand/playlist/playList-35d98b97-8abf-4f92-883a-c898801f28b4/


NVIDIA 最近发布了 Omniverse Replicator 1.10,为开发者构建低代码 SDG 工作流提供了新的支持。相关详细信息,请参见“在 NVIDIA Omniverse Replicator 1.10 中使用低代码工作流促进合成数据生成”:https://developer.nvidia.com/blog/boost-synthetic-data-generation-with-low-code-workflows-in-nvidia-omniverse-replicator-1-10/


NVIDIA Isaac ROS 2.0 和 NVIDIA Isaac Sim 2023.1 现已可用,其对性能感知和高保真仿真进行了重要更新。如需了解更多信息,请参阅《NVIDIA Isaac 平台先进的仿真和感知工具助力 AI 机器人技术加速发展》。



GTC 2024 将于 2024 年 3 月 18 至 21 日在美国加州圣何塞会议中心举行,线上大会也将同期开放。扫描下方海报二维码,立即注册 GTC 大会


评论
  • 这篇内容主要讨论三个基本问题,硅电容是什么,为什么要使用硅电容,如何正确使用硅电容?1.  硅电容是什么首先我们需要了解电容是什么?物理学上电容的概念指的是给定电位差下自由电荷的储藏量,记为C,单位是F,指的是容纳电荷的能力,C=εS/d=ε0εrS/4πkd(真空)=Q/U。百度百科上电容器的概念指的是两个相互靠近的导体,中间夹一层不导电的绝缘介质。通过观察电容本身的定义公式中可以看到,在各个变量中比较能够改变的就是εr,S和d,也就是介质的介电常数,金属板有效相对面积以及距离。当前
    知白 2025-01-06 12:04 223浏览
  • 根据环洋市场咨询(Global Info Research)项目团队最新调研,预计2030年全球无人机锂电池产值达到2457百万美元,2024-2030年期间年复合增长率CAGR为9.6%。 无人机锂电池是无人机动力系统中存储并释放能量的部分。无人机使用的动力电池,大多数是锂聚合物电池,相较其他电池,锂聚合物电池具有较高的能量密度,较长寿命,同时也具有良好的放电特性和安全性。 全球无人机锂电池核心厂商有宁德新能源科技、欣旺达、鹏辉能源、深圳格瑞普和EaglePicher等,前五大厂商占有全球
    GIRtina 2025-01-07 11:02 124浏览
  • 村田是目前全球量产硅电容的领先企业,其在2016年收购了法国IPDiA头部硅电容器公司,并于2023年6月宣布投资约100亿日元将硅电容产能提升两倍。以下内容主要来自村田官网信息整理,村田高密度硅电容器采用半导体MOS工艺开发,并使用3D结构来大幅增加电极表面,因此在给定的占位面积内增加了静电容量。村田的硅技术以嵌入非结晶基板的单片结构为基础(单层MIM和多层MIM—MIM是指金属 / 绝缘体/ 金属) 村田硅电容采用先进3D拓扑结构在100um内,使开发的有效静电容量面积相当于80个
    知白 2025-01-07 15:02 144浏览
  • By Toradex 秦海1). 简介嵌入式平台设备基于Yocto Linux 在开发后期量产前期,为了安全以及提高启动速度等考虑,希望将 ARM 处理器平台的 Debug Console 输出关闭,本文就基于 NXP i.MX8MP ARM 处理器平台来演示相关流程。 本文所示例的平台来自于 Toradex Verdin i.MX8MP 嵌入式平台。  2. 准备a). Verdin i.MX8MP ARM核心版配合Dahlia载板并
    hai.qin_651820742 2025-01-07 14:52 108浏览
  •  在全球能源结构加速向清洁、可再生方向转型的今天,风力发电作为一种绿色能源,已成为各国新能源发展的重要组成部分。然而,风力发电系统在复杂的环境中长时间运行,对系统的安全性、稳定性和抗干扰能力提出了极高要求。光耦(光电耦合器)作为一种电气隔离与信号传输器件,凭借其优秀的隔离保护性能和信号传输能力,已成为风力发电系统中不可或缺的关键组件。 风力发电系统对隔离与控制的需求风力发电系统中,包括发电机、变流器、变压器和控制系统等多个部分,通常工作在高压、大功率的环境中。光耦在这里扮演了
    晶台光耦 2025-01-08 16:03 61浏览
  • 在智能家居领域中,Wi-Fi、蓝牙、Zigbee、Thread与Z-Wave等无线通信协议是构建短距物联局域网的关键手段,它们常在实际应用中交叉运用,以满足智能家居生态系统多样化的功能需求。然而,这些协议之间并未遵循统一的互通标准,缺乏直接的互操作性,在进行组网时需要引入额外的网关作为“翻译桥梁”,极大地增加了系统的复杂性。 同时,Apple HomeKit、SamSung SmartThings、Amazon Alexa、Google Home等主流智能家居平台为了提升市占率与消费者
    华普微HOPERF 2025-01-06 17:23 204浏览
  • 本文介绍编译Android13 ROOT权限固件的方法,触觉智能RK3562开发板演示,搭载4核A53处理器,主频高达2.0GHz;内置独立1Tops算力NPU,可应用于物联网网关、平板电脑、智能家居、教育电子、工业显示与控制等行业。关闭selinux修改此文件("+"号为修改内容)device/rockchip/common/BoardConfig.mkBOARD_BOOT_HEADER_VERSION ?= 2BOARD_MKBOOTIMG_ARGS :=BOARD_PREBUILT_DTB
    Industio_触觉智能 2025-01-08 00:06 92浏览
  • 大模型的赋能是指利用大型机器学习模型(如深度学习模型)来增强或改进各种应用和服务。这种技术在许多领域都显示出了巨大的潜力,包括但不限于以下几个方面: 1. 企业服务:大模型可以用于构建智能客服系统、知识库问答系统等,提升企业的服务质量和运营效率。 2. 教育服务:在教育领域,大模型被应用于个性化学习、智能辅导、作业批改等,帮助教师减轻工作负担,提高教学质量。 3. 工业智能化:大模型有助于解决工业领域的复杂性和不确定性问题,尽管在认知能力方面尚未完全具备专家级的复杂决策能力。 4. 消费
    丙丁先生 2025-01-07 09:25 117浏览
  • 故障现象一辆2017款东风风神AX7车,搭载DFMA14T发动机,累计行驶里程约为13.7万km。该车冷起动后怠速运转正常,热机后怠速运转不稳,组合仪表上的发动机转速表指针上下轻微抖动。 故障诊断 用故障检测仪检测,发动机控制单元中无故障代码存储;读取发动机数据流,发现进气歧管绝对压力波动明显,有时能达到69 kPa,明显偏高,推断可能的原因有:进气系统漏气;进气歧管绝对压力传感器信号失真;发动机机械故障。首先从节气门处打烟雾,没有发现进气管周围有漏气的地方;接着拔下进气管上的两个真空
    虹科Pico汽车示波器 2025-01-08 16:51 70浏览
  • 每日可见的315MHz和433MHz遥控模块,你能分清楚吗?众所周知,一套遥控设备主要由发射部分和接收部分组成,发射器可以将控制者的控制按键经过编码,调制到射频信号上面,然后经天线发射出无线信号。而接收器是将天线接收到的无线信号进行解码,从而得到与控制按键相对应的信号,然后再去控制相应的设备工作。当前,常见的遥控设备主要分为红外遥控与无线电遥控两大类,其主要区别为所采用的载波频率及其应用场景不一致。红外遥控设备所采用的射频信号频率一般为38kHz,通常应用在电视、投影仪等设备中;而无线电遥控设备
    华普微HOPERF 2025-01-06 15:29 164浏览
  • 彼得·德鲁克被誉为“现代管理学之父”,他的管理思想影响了无数企业和管理者。然而,关于他的书籍分类,一种流行的说法令人感到困惑:德鲁克一生写了39本书,其中15本是关于管理的,而其中“专门写工商企业或为企业管理者写的”只有两本——《为成果而管理》和《创新与企业家精神》。这样的表述广为流传,但深入探讨后却发现并不完全准确。让我们一起重新审视这一说法,解析其中的矛盾与根源,进而重新认识德鲁克的管理思想及其著作的真正价值。从《创新与企业家精神》看德鲁克的视角《创新与企业家精神》通常被认为是一本专为企业管
    优思学院 2025-01-06 12:03 158浏览
  • 「他明明跟我同梯进来,为什么就是升得比我快?」许多人都有这样的疑问:明明就战绩也不比隔壁同事差,升迁之路却比别人苦。其实,之间的差异就在于「领导力」。並非必须当管理者才需要「领导力」,而是散发领导力特质的人,才更容易被晓明。许多领导力和特质,都可以通过努力和学习获得,因此就算不是天生的领导者,也能成为一个具备领导魅力的人,进而被老板看见,向你伸出升迁的橘子枝。领导力是什么?领导力是一种能力或特质,甚至可以说是一种「影响力」。好的领导者通常具备影响和鼓励他人的能力,并导引他们朝着共同的目标和愿景前
    优思学院 2025-01-08 14:54 66浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦