将工业机器人装配任务从仿真转为现实

原创 英伟达NVIDIA中国 2023-06-06 18:45


仿真是帮助机器人学习感知(从摄像机图像中了解世界)、规划(制定解决问题的行动序列)和控制(产生改变机器人位置和方向的电机指令)等新技能的一个必要工具。


机器人装配在汽车、航空航天、电子和医疗设备行业中无处不在。设置机器人执行装配任务是一个耗时且昂贵的过程,需要一整支团队来设计机器人的轨迹并仔细划定边界。


在其他机器人技术领域,仿真已经成为不可或缺的工具,尤其是在发展 AI 的过程中。但机器人装配涉及几何复杂的紧密公差零件之间的高精度接触。长期以来,仿真此类接触紧密的活动在计算上的难度极高。


NVIDIA 近期在机器人装配方面取得了进展,这使得超实时仿真成为可能。这种高速仿真能够使用强大、先进的强化学习(RL)技术。借助 RL,虚拟机器人能够探索仿真环境、获得丰富的经验,并通过智能试错来学习有用的技能。将 RL 用于机器人装配,可以最大限度地减少对操作者专业知识的需求、增加对变化的鲁棒性并减少硬件磨损。sim-to-real 一词指的就是将仿真环境中的技能转移到现实世界。


将 RL 用于机器人装配的最大挑战之一,是机器人在仿真中学习的技能通常不能有效地转移到现实世界的机器人上。出现这个问题是因为仿真器与现实世界之间存在物理学、电机信号和传感器信号等方面的微妙差异。此外,现实世界的机器人可能会遇到在仿真器中从未见过的情况。这些问题被统称为 reality gap(现实差距)。


什么是 IndustReal?


为了将 RL 用于具有挑战性的装配任务并解决现实差距问题,我们开发了 IndustReal。IndustReal 是一套用于帮助机器人解决仿真中的装配任务,并将这些能力转移到现实世界的算法、系统和工具。


IndustReal 主要提供:

  • 一套使仿真机器人通过 RL 解决复杂装配任务的算法。


  • 一种解决现实差距,并在现实世界中部署时稳定机器人所学技能的方法。


  • 一个现实世界机器人系统,将在仿真中训练的装配技能端到端地转移到现实。


  • 使研究人员和工程师能够复制该系统的软硬件工具套件。

  1. IndustRealKit 是一套受 NIST Task Board 1(既定的机器人装配基准)启发的 3D 可打印资产 CAD 模型。

  2. IndustRealLib 是一个轻量级的 Python 库,可将在 NVIDIA Isaac Gym 仿真器中学到的技能部署到现实世界的 Franka Emika Panda 机器人臂上。



图 1. 机器人在仿真中执行插入钉子

和装配齿轮的策略(上一行),

然后将这些策略部署到现实世界中(下一行)。


训练算法和部署方法


在这项工作中,我们提出了三种算法帮助机器人在仿真中使用 RL 学习装配技能。我们还提出了一种使现实世界的机器人能够执行这些技能的部署方法。


仿真感知策略更新

像 NVIDIA Isaac Gym 和 NVIDIA Isaac Sim 这样的机器人仿真器在满足现实世界的物理学同时,还要满足许多物理限制,其中最重要的一项是物体不能相互重叠,或者说“互穿”。在大多数仿真器中,物体之间的小规模互通不可避免,尤其是在实时执行时。


我们引入了仿真感知策略更新(SAPU),为仿真机器人提供关于仿真预测何时可靠或不可靠的认知。具体而言,在 SAPU 中,我们在 NVIDIA Warp 中实现了一个基于 GPU 的模块,从而在机器人学习如何使用 RL 装配零件时检查是否存在互穿。


当互穿规模小时,我们对机器人的仿真体验进行加权,而当互穿规模大时,我们就减少加权。该策略可以防止仿真机器人利用不准确的物理规则解决任务,进而导致无法将它学习的技能转移到现实世界中。


有向距离场奖励


为了使用 RL 解决任务,必须定义一个奖励信号(例如衡量机器人在解决任务方面取得了多少进展)。然而,在装配过程中,很难根据形状复杂零件的对齐情况来定义一个奖励信号。


于是我们引入了有向距离场(SDF)奖励,以便衡量仿真零件在装配过程中的对齐程度。SDF 是一个数学函数,它可以从一个物体上的点计算出到另一个物体表面的最短距离。这种自然、通用的方法可以描述零件之间的对齐情况,高度对称或不对称都不例外。


在 SDF 奖励中,我们将奖励信号定义为装配过程中一个零件的当前位置和目标位置之间的 SDF 距离。



图 2. 一个圆形钉子的 SDF 2D 切片可视化图。

颜色代表从指定的点到钉子表面的最短距离


基于样本的课程


课程学习是一种成熟的 RL 方法,可解决涉及到许多单独步骤或动作的问题。毕竟,机器人在学习过程中所面对的任务难度会逐渐增加。


在我们的装配任务中,机器人首先解决简单的装配问题(即零件已完成部分装配),然后再升级到更难的问题(即零件已被拆解)。


随着零件之间的初始接触逐渐减少,零件会在某个时刻不再有初始接触点。由于机器人的知识已过度偏向于部分装配的情况,这种难度上的陡增会导致性能崩溃。


我们为仿真机器人引入了一个基于样本的课程(SBC)来逐步学习复杂的装配任务。在课程的所有阶段都要求机器人解决各种难度范围内的抽样装配问题,但会逐渐删除问题分布中最简单的问题。在课程的最后阶段,各个零件在一开始就完全不接触。请看下面的可视化图。


图 3. 基于样本的课程的不同阶段。

任务难度从左到右随插头(黄色球体)

初始位置的分布远离插座(米色)而增加。


策略级行动整合器


在最常见的机器人 RL 应用中,通过对机器人的姿势(即其位置和方向)进行增量调整来产生机器人的动作。这些增量被应用于机器人的当前姿态,以产生一个瞬时的目标姿势。如果应用于现实世界中的机器人,由于实际机器人的复杂性,这种策略可能会导致机器人的最终姿势与其最终目标姿势之间产生差异。


我们还提出了一个策略级行动整合器(PLAI)。这是一种简单的算法,在现实世界的机器人上部署学习到的技能时,可以减少稳态(即长期的)错误。我们将增量调整应用于先前的瞬时目标姿势,以产生新的瞬时目标姿势。


在数学上(类似于经典 PID 控制器的积分项),这种策略产生的瞬时目标姿势是初始姿势和机器人随时间产生的动作之和。该技术即便在复杂的实际情况下,也可以使机器人的最终姿势与最终目标姿势之间的误差最小化。


机器人正试图移动到一个目标位置,期间我们比较了标准(标称)策略、PLAI 算法和经典的 PID 控制器在抵达任务上的表现。请看下面的可视化图。


图 4. 机器人使用标准策略、PLAI 算法和 PID 策略将其指尖移动到粉色球体目标的比较(上一行:在重力补偿不完全的情况下进行比较。下一行:在未建立关节处摩擦力模型的情况下进行比较)


系统和工具


通过 IndustReal 进行现实世界实验所使用的装置,包括一个 Franka Emika Panda 机器人臂、安装在机器人手上的英特尔 RealSense D435 摄像头,以及一个带有零件的装配平台。


图 5. 物理机器人实验设置:一个 Franka Emika Panda 机器人臂,机器人手上装有一个英特尔 RealSense D435 摄像头,底部是一个带有零件的装配平台。


IndustReal 提供用于复制本文中介绍的系统所需要的硬件(IndustRealKit)和软件(IndustRealLib)。


IndustRealKit 包含可 3D 打印的 20 个零件的 CAD 模型,涵盖了这项工作中使用到的所有零件。这些模型带有 6 个钉子支架、6 个钉子插座、3 个齿轮、1 个齿轮底座(带 3 个齿轮轴)以及 4 个 NEMA 连接器和插座支架,均使用美标插头和电源插座。


采购清单包括 17 个零件:6 个金属钉子(NIST 基准)、4 个 NEMA 连接器和插座、1 个光学平台以及紧固件。


图 6.  IndustRealKit


IndustRealLib 是一个轻量级库,包含了将在仿真中通过 RL 学到的技能部署到现实世界机器臂上所需要的代码。具体而言,我们为用户提供脚本,以便他们把在 NVIDIA Isaac Gym 仿真器中训练的控制策略(即将传感器信号映射到机器人行动的神经网络)迅速部署到 Franka Emika Panda 机器人上。


未来发展方向


IndustReal 展示了一条在机器人装配任务中充分发挥仿真潜力的路径。随着仿真变得更加精准和高效,以及更多仿真转现实的转移技术被源源不断地开发出来,我们已经预见到了将这项工作扩展到制造业其他任务(如螺丝紧固、电缆布线和焊接等)的众多可能性。我们有理由相信,有朝一日,每一个先进的工业制造机器人都将使用这种技术进行仿真训练,以便可以无缝、灵活地转移到现实世界。


我们的下一步是将该系统扩展到包括更多的对象、装配任务和复杂的环境。我们还打算开发更多的仿真转现实技术,以便更加经济、可靠、安全而顺利地转移学到的技能。


如何使用 IndustReal


  • 请访问 IndustReal project pagehttps://sites.google.com/nvidia.com/industreal,查看论文和摘要视频的链接。敬请关注即将推出的 IndustralKit 和 IndustralLib。


  • 下载独立运行的 NVIDIA Isaac Gym Preview Release https://developer.nvidia.cn/isaac-gymNVIDIA Isaac Gym Environmentshttps://github.com/NVIDIA-Omniverse/IsaacGymEnvs其中包含了在 IndustReal 中训练装配技能的基础 —— NVIDIA Omniverse factory environments https://github.com/NVIDIA-Omniverse/IsaacGymEnvs/blob/main/docs/factory.md)。


  • 下载 Omniverse 驱动的新一代 NVIDIA Isaac Simhttps://developer.nvidia.cn/zh-cn/isaac-sim)。



点击 “阅读原文”,或扫描下方海报二维码观看 NVIDIA 创始人兼 CEO 黄仁勋在 COMPUTEX 2023 的主题演讲直播回放,主题演讲中文字幕版已上线,了解 AI、图形及其他领域的最新进展!


评论
  • 请移步 gitee 仓库 https://gitee.com/Newcapec_cn/LiteOS-M_V5.0.2-Release_STM32F103_CubeMX/blob/main/Docs/%E5%9F%BA%E4%BA%8ESTM32F103RCT6%E7%A7%BB%E6%A4%8DLiteOS-M-V5.0.2-Release.md基于STM32F103RCT6移植LiteOS-M-V5.0.2-Release下载源码kernel_liteos_m: OpenHarmon
    逮到一只程序猿 2025-02-27 08:56 195浏览
  • 构建巨量的驾驶场景时,测试ADAS和AD系统面临着巨大挑战,如传统的实验设计(Design of Experiments, DoE)方法难以有效覆盖识别驾驶边缘场景案例,但这些边缘案例恰恰是进一步提升自动驾驶系统性能的关键。一、传统解决方案:静态DoE标准的DoE方案旨在系统性地探索场景的参数空间,从而确保能够实现完全的测试覆盖范围。但在边缘案例,比如暴露在潜在安全风险的场景或是ADAS系统性能极限场景时,DoE方案通常会失效,让我们看一些常见的DoE方案:1、网格搜索法(Grid)实现原理:将
    康谋 2025-02-27 10:00 252浏览
  • 在2024年的科技征程中,具身智能的发展已成为全球关注的焦点。从实验室到现实应用,这一领域正以前所未有的速度推进,改写着人类与机器的互动边界。这一年,我们见证了具身智能技术的突破与变革,它不仅落地各行各业,带来新的机遇,更在深刻影响着我们的生活方式和思维方式。随着相关技术的飞速发展,具身智能不再仅仅是一个技术概念,更像是一把神奇的钥匙。身后的众多行业,无论愿意与否,都像是被卷入一场伟大变革浪潮中的船只,注定要被这股汹涌的力量重塑航向。01为什么是具身智能?为什么在中国?最近,中国具身智能行业的进
    艾迈斯欧司朗 2025-02-28 15:45 221浏览
  • Matter 协议,原名 CHIP(Connected Home over IP),是由苹果、谷歌、亚马逊和三星等科技巨头联合ZigBee联盟(现连接标准联盟CSA)共同推出的一套基于IP协议的智能家居连接标准,旨在打破智能家居设备之间的 “语言障碍”,实现真正的互联互通。然而,目标与现实之间总有落差,前期阶段的Matter 协议由于设备支持类型有限、设备生态协同滞后以及设备通信协议割裂等原因,并未能彻底消除智能家居中的“设备孤岛”现象,但随着2025年的到来,这些现象都将得到完美的解决。近期,
    华普微HOPERF 2025-02-27 10:32 212浏览
  • 应用趋势与客户需求,AI PC的未来展望随着人工智能(AI)技术的日益成熟,AI PC(人工智能个人电脑)逐渐成为消费者和企业工作中的重要工具。这类产品集成了最新的AI处理器,如NPU、CPU和GPU,并具备许多智能化功能,为用户带来更高效且直观的操作体验。AI PC的目标是提升工作和日常生活的效率,通过深度学习与自然语言处理等技术,实现更流畅的多任务处理、实时翻译、语音助手、图像生成等功能,满足现代用户对生产力和娱乐的双重需求。随着各行各业对数字转型需求的增长,AI PC也开始在各个领域中显示
    百佳泰测试实验室 2025-02-27 14:08 252浏览
  • 振动样品磁强计是一种用于测量材料磁性的精密仪器,广泛应用于科研、工业检测等领域。然而,其测量准确度会受到多种因素的影响,下面我们将逐一分析这些因素。一、温度因素温度是影响振动样品磁强计测量准确度的重要因素之一。随着温度的变化,材料的磁性也会发生变化,从而影响测量结果的准确性。因此,在进行磁性测量时,应确保恒温环境,以减少温度波动对测量结果的影响。二、样品制备样品的制备过程同样会影响振动样品磁强计的测量准确度。样品的形状、尺寸和表面处理等因素都会对测量结果产生影响。为了确保测量准确度,应严格按照规
    锦正茂科技 2025-02-28 14:05 134浏览
  • 在物联网领域中,无线射频技术作为设备间通信的核心手段,已深度渗透工业自动化、智慧城市及智能家居等多元场景。然而,随着物联网设备接入规模的不断扩大,如何降低运维成本,提升通信数据的传输速度和响应时间,实现更广泛、更稳定的覆盖已成为当前亟待解决的系统性难题。SoC无线收发模块-RFM25A12在此背景下,华普微创新推出了一款高性能、远距离与高性价比的Sub-GHz无线SoC收发模块RFM25A12,旨在提升射频性能以满足行业中日益增长与复杂的设备互联需求。值得一提的是,RFM25A12还支持Wi-S
    华普微HOPERF 2025-02-28 09:06 143浏览
  • 更多生命体征指标风靡的背后都只有一个原因:更多人将健康排在人生第一顺位!“AGEs,也就是晚期糖基化终末产物,英文名Advanced Glycation End-products,是存在于我们体内的一种代谢产物” 艾迈斯欧司朗亚太区健康监测高级市场经理王亚琴说道,“相信业内的朋友都会有关注,最近该指标的热度很高,它可以用来评估人的生活方式是否健康。”据悉,AGEs是可穿戴健康监测领域的一个“萌新”指标,近来备受关注。如果站在学术角度来理解它,那么AGEs是在非酶促条件下,蛋白质、氨基酸
    艾迈斯欧司朗 2025-02-27 14:50 400浏览
  •           近日受某专业机构邀请,参加了官方举办的《广东省科技创新条例》宣讲会。在与会之前,作为一名技术工作者一直认为技术的法例都是保密和侵权方面的,而潜意识中感觉法律有束缚创新工作的进行可能。通过一个上午学习新法,对广东省的科技创新有了新的认识。广东是改革的前沿阵地,是科技创新的沃土,企业是创新的主要个体。《广东省科技创新条例》是广东省为促进科技创新、推动高质量发展而制定的地方性法规,主要内容包括: 总则:明确立法目
    广州铁金刚 2025-02-28 10:14 103浏览
  • 1,微软下载免费Visual Studio Code2,安装C/C++插件,如果无法直接点击下载, 可以选择手动install from VSIX:ms-vscode.cpptools-1.23.6@win32-x64.vsix3,安装C/C++编译器MniGW (MinGW在 Windows 环境下提供类似于 Unix/Linux 环境下的开发工具,使开发者能够轻松地在 Windows 上编写和编译 C、C++ 等程序.)4,C/C++插件扩展设置中添加Include Path 5,
    黎查 2025-02-28 14:39 140浏览
  • 美国加州CEC能效跟DOE能效有什么区别?CEC/DOE是什么关系?美国加州CEC能效跟DOE能效有什么区别?CEC/DOE是什么关系?‌美国加州CEC能效认证与美国DOE能效认证在多个方面存在显著差异‌。认证范围和适用地区‌CEC能效认证‌:仅适用于在加利福尼亚州销售的电器产品。CEC认证的范围包括制冷设备、房间空调、中央空调、便携式空调、加热器、热水器、游泳池加热器、卫浴配件、光源、应急灯具、交通信号模块、灯具、洗碗机、洗衣机、干衣机、烹饪器具、电机和压缩机、变压器、外置电源、消费类电子设备
    张工nx808593 2025-02-27 18:04 120浏览
  • 一、VSM的基本原理震动样品磁强计(Vibrating Sample Magnetometer,简称VSM)是一种灵敏且高效的磁性测量仪器。其基本工作原理是利用震动样品在探测线圈中引起的变化磁场来产生感应电压,这个感应电压与样品的磁矩成正比。因此,通过测量这个感应电压,我们就能够精确地确定样品的磁矩。在VSM中,被测量的样品通常被固定在一个震动头上,并以一定的频率和振幅震动。这种震动在探测线圈中引起了变化的磁通量,从而产生了一个交流电信号。这个信号的幅度和样品的磁矩有着直接的关系。因此,通过仔细
    锦正茂科技 2025-02-28 13:30 100浏览
  •         近日,广电计量在聚焦离子束(FIB)领域编写的专业著作《聚焦离子束:失效分析》正式出版,填补了国内聚焦离子束领域实践性专业书籍的空白,为该领域的技术发展与知识传播提供了重要助力。         随着芯片技术不断发展,芯片的集成度越来越高,结构也日益复杂。这使得传统的失效分析方法面临巨大挑战。FIB技术的出现,为芯片失效分析带来了新的解决方案。它能够在纳米尺度上对芯片进行精确加工和分析。当芯
    广电计量 2025-02-28 09:15 116浏览
  • RGB灯光无法同步?细致的动态光效设定反而成为产品客诉来源!随着科技的进步和消费者需求变化,电脑接口设备单一功能性已无法满足市场需求,因此在产品上增加「动态光效」的形式便应运而生,藉此吸引消费者目光。这种RGB灯光效果,不仅能增强电脑周边产品的视觉吸引力,还能为用户提供个性化的体验,展现独特自我风格。如今,笔记本电脑、键盘、鼠标、鼠标垫、耳机、显示器等多种电脑接口设备多数已配备动态光效。这些设备的灯光效果会随着音乐节奏、游戏情节或使用者的设置而变化。想象一个画面,当一名游戏玩家,按下电源开关,整
    百佳泰测试实验室 2025-02-27 14:15 137浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦