将工业机器人装配任务从仿真转为现实

原创 英伟达NVIDIA中国 2023-06-06 18:45


仿真是帮助机器人学习感知(从摄像机图像中了解世界)、规划(制定解决问题的行动序列)和控制(产生改变机器人位置和方向的电机指令)等新技能的一个必要工具。


机器人装配在汽车、航空航天、电子和医疗设备行业中无处不在。设置机器人执行装配任务是一个耗时且昂贵的过程,需要一整支团队来设计机器人的轨迹并仔细划定边界。


在其他机器人技术领域,仿真已经成为不可或缺的工具,尤其是在发展 AI 的过程中。但机器人装配涉及几何复杂的紧密公差零件之间的高精度接触。长期以来,仿真此类接触紧密的活动在计算上的难度极高。


NVIDIA 近期在机器人装配方面取得了进展,这使得超实时仿真成为可能。这种高速仿真能够使用强大、先进的强化学习(RL)技术。借助 RL,虚拟机器人能够探索仿真环境、获得丰富的经验,并通过智能试错来学习有用的技能。将 RL 用于机器人装配,可以最大限度地减少对操作者专业知识的需求、增加对变化的鲁棒性并减少硬件磨损。sim-to-real 一词指的就是将仿真环境中的技能转移到现实世界。


将 RL 用于机器人装配的最大挑战之一,是机器人在仿真中学习的技能通常不能有效地转移到现实世界的机器人上。出现这个问题是因为仿真器与现实世界之间存在物理学、电机信号和传感器信号等方面的微妙差异。此外,现实世界的机器人可能会遇到在仿真器中从未见过的情况。这些问题被统称为 reality gap(现实差距)。


什么是 IndustReal?


为了将 RL 用于具有挑战性的装配任务并解决现实差距问题,我们开发了 IndustReal。IndustReal 是一套用于帮助机器人解决仿真中的装配任务,并将这些能力转移到现实世界的算法、系统和工具。


IndustReal 主要提供:

  • 一套使仿真机器人通过 RL 解决复杂装配任务的算法。


  • 一种解决现实差距,并在现实世界中部署时稳定机器人所学技能的方法。


  • 一个现实世界机器人系统,将在仿真中训练的装配技能端到端地转移到现实。


  • 使研究人员和工程师能够复制该系统的软硬件工具套件。

  1. IndustRealKit 是一套受 NIST Task Board 1(既定的机器人装配基准)启发的 3D 可打印资产 CAD 模型。

  2. IndustRealLib 是一个轻量级的 Python 库,可将在 NVIDIA Isaac Gym 仿真器中学到的技能部署到现实世界的 Franka Emika Panda 机器人臂上。



图 1. 机器人在仿真中执行插入钉子

和装配齿轮的策略(上一行),

然后将这些策略部署到现实世界中(下一行)。


训练算法和部署方法


在这项工作中,我们提出了三种算法帮助机器人在仿真中使用 RL 学习装配技能。我们还提出了一种使现实世界的机器人能够执行这些技能的部署方法。


仿真感知策略更新

像 NVIDIA Isaac Gym 和 NVIDIA Isaac Sim 这样的机器人仿真器在满足现实世界的物理学同时,还要满足许多物理限制,其中最重要的一项是物体不能相互重叠,或者说“互穿”。在大多数仿真器中,物体之间的小规模互通不可避免,尤其是在实时执行时。


我们引入了仿真感知策略更新(SAPU),为仿真机器人提供关于仿真预测何时可靠或不可靠的认知。具体而言,在 SAPU 中,我们在 NVIDIA Warp 中实现了一个基于 GPU 的模块,从而在机器人学习如何使用 RL 装配零件时检查是否存在互穿。


当互穿规模小时,我们对机器人的仿真体验进行加权,而当互穿规模大时,我们就减少加权。该策略可以防止仿真机器人利用不准确的物理规则解决任务,进而导致无法将它学习的技能转移到现实世界中。


有向距离场奖励


为了使用 RL 解决任务,必须定义一个奖励信号(例如衡量机器人在解决任务方面取得了多少进展)。然而,在装配过程中,很难根据形状复杂零件的对齐情况来定义一个奖励信号。


于是我们引入了有向距离场(SDF)奖励,以便衡量仿真零件在装配过程中的对齐程度。SDF 是一个数学函数,它可以从一个物体上的点计算出到另一个物体表面的最短距离。这种自然、通用的方法可以描述零件之间的对齐情况,高度对称或不对称都不例外。


在 SDF 奖励中,我们将奖励信号定义为装配过程中一个零件的当前位置和目标位置之间的 SDF 距离。



图 2. 一个圆形钉子的 SDF 2D 切片可视化图。

颜色代表从指定的点到钉子表面的最短距离


基于样本的课程


课程学习是一种成熟的 RL 方法,可解决涉及到许多单独步骤或动作的问题。毕竟,机器人在学习过程中所面对的任务难度会逐渐增加。


在我们的装配任务中,机器人首先解决简单的装配问题(即零件已完成部分装配),然后再升级到更难的问题(即零件已被拆解)。


随着零件之间的初始接触逐渐减少,零件会在某个时刻不再有初始接触点。由于机器人的知识已过度偏向于部分装配的情况,这种难度上的陡增会导致性能崩溃。


我们为仿真机器人引入了一个基于样本的课程(SBC)来逐步学习复杂的装配任务。在课程的所有阶段都要求机器人解决各种难度范围内的抽样装配问题,但会逐渐删除问题分布中最简单的问题。在课程的最后阶段,各个零件在一开始就完全不接触。请看下面的可视化图。


图 3. 基于样本的课程的不同阶段。

任务难度从左到右随插头(黄色球体)

初始位置的分布远离插座(米色)而增加。


策略级行动整合器


在最常见的机器人 RL 应用中,通过对机器人的姿势(即其位置和方向)进行增量调整来产生机器人的动作。这些增量被应用于机器人的当前姿态,以产生一个瞬时的目标姿势。如果应用于现实世界中的机器人,由于实际机器人的复杂性,这种策略可能会导致机器人的最终姿势与其最终目标姿势之间产生差异。


我们还提出了一个策略级行动整合器(PLAI)。这是一种简单的算法,在现实世界的机器人上部署学习到的技能时,可以减少稳态(即长期的)错误。我们将增量调整应用于先前的瞬时目标姿势,以产生新的瞬时目标姿势。


在数学上(类似于经典 PID 控制器的积分项),这种策略产生的瞬时目标姿势是初始姿势和机器人随时间产生的动作之和。该技术即便在复杂的实际情况下,也可以使机器人的最终姿势与最终目标姿势之间的误差最小化。


机器人正试图移动到一个目标位置,期间我们比较了标准(标称)策略、PLAI 算法和经典的 PID 控制器在抵达任务上的表现。请看下面的可视化图。


图 4. 机器人使用标准策略、PLAI 算法和 PID 策略将其指尖移动到粉色球体目标的比较(上一行:在重力补偿不完全的情况下进行比较。下一行:在未建立关节处摩擦力模型的情况下进行比较)


系统和工具


通过 IndustReal 进行现实世界实验所使用的装置,包括一个 Franka Emika Panda 机器人臂、安装在机器人手上的英特尔 RealSense D435 摄像头,以及一个带有零件的装配平台。


图 5. 物理机器人实验设置:一个 Franka Emika Panda 机器人臂,机器人手上装有一个英特尔 RealSense D435 摄像头,底部是一个带有零件的装配平台。


IndustReal 提供用于复制本文中介绍的系统所需要的硬件(IndustRealKit)和软件(IndustRealLib)。


IndustRealKit 包含可 3D 打印的 20 个零件的 CAD 模型,涵盖了这项工作中使用到的所有零件。这些模型带有 6 个钉子支架、6 个钉子插座、3 个齿轮、1 个齿轮底座(带 3 个齿轮轴)以及 4 个 NEMA 连接器和插座支架,均使用美标插头和电源插座。


采购清单包括 17 个零件:6 个金属钉子(NIST 基准)、4 个 NEMA 连接器和插座、1 个光学平台以及紧固件。


图 6.  IndustRealKit


IndustRealLib 是一个轻量级库,包含了将在仿真中通过 RL 学到的技能部署到现实世界机器臂上所需要的代码。具体而言,我们为用户提供脚本,以便他们把在 NVIDIA Isaac Gym 仿真器中训练的控制策略(即将传感器信号映射到机器人行动的神经网络)迅速部署到 Franka Emika Panda 机器人上。


未来发展方向


IndustReal 展示了一条在机器人装配任务中充分发挥仿真潜力的路径。随着仿真变得更加精准和高效,以及更多仿真转现实的转移技术被源源不断地开发出来,我们已经预见到了将这项工作扩展到制造业其他任务(如螺丝紧固、电缆布线和焊接等)的众多可能性。我们有理由相信,有朝一日,每一个先进的工业制造机器人都将使用这种技术进行仿真训练,以便可以无缝、灵活地转移到现实世界。


我们的下一步是将该系统扩展到包括更多的对象、装配任务和复杂的环境。我们还打算开发更多的仿真转现实技术,以便更加经济、可靠、安全而顺利地转移学到的技能。


如何使用 IndustReal


  • 请访问 IndustReal project pagehttps://sites.google.com/nvidia.com/industreal,查看论文和摘要视频的链接。敬请关注即将推出的 IndustralKit 和 IndustralLib。


  • 下载独立运行的 NVIDIA Isaac Gym Preview Release https://developer.nvidia.cn/isaac-gymNVIDIA Isaac Gym Environmentshttps://github.com/NVIDIA-Omniverse/IsaacGymEnvs其中包含了在 IndustReal 中训练装配技能的基础 —— NVIDIA Omniverse factory environments https://github.com/NVIDIA-Omniverse/IsaacGymEnvs/blob/main/docs/factory.md)。


  • 下载 Omniverse 驱动的新一代 NVIDIA Isaac Simhttps://developer.nvidia.cn/zh-cn/isaac-sim)。



点击 “阅读原文”,或扫描下方海报二维码观看 NVIDIA 创始人兼 CEO 黄仁勋在 COMPUTEX 2023 的主题演讲直播回放,主题演讲中文字幕版已上线,了解 AI、图形及其他领域的最新进展!


评论
  • 根据Global Info Research项目团队最新调研,预计2030年全球封闭式电机产值达到1425百万美元,2024-2030年期间年复合增长率CAGR为3.4%。 封闭式电机是一种电动机,其外壳设计为密闭结构,通常用于要求较高的防护等级的应用场合。封闭式电机可以有效防止外部灰尘、水分和其他污染物进入内部,从而保护电机的内部组件,延长其使用寿命。 环洋市场咨询机构出版的调研分析报告【全球封闭式电机行业总体规模、主要厂商及IPO上市调研报告,2025-2031】研究全球封闭式电机总体规
    GIRtina 2025-01-06 11:10 104浏览
  • 根据环洋市场咨询(Global Info Research)项目团队最新调研,预计2030年全球无人机锂电池产值达到2457百万美元,2024-2030年期间年复合增长率CAGR为9.6%。 无人机锂电池是无人机动力系统中存储并释放能量的部分。无人机使用的动力电池,大多数是锂聚合物电池,相较其他电池,锂聚合物电池具有较高的能量密度,较长寿命,同时也具有良好的放电特性和安全性。 全球无人机锂电池核心厂商有宁德新能源科技、欣旺达、鹏辉能源、深圳格瑞普和EaglePicher等,前五大厂商占有全球
    GIRtina 2025-01-07 11:02 71浏览
  • 大模型的赋能是指利用大型机器学习模型(如深度学习模型)来增强或改进各种应用和服务。这种技术在许多领域都显示出了巨大的潜力,包括但不限于以下几个方面: 1. 企业服务:大模型可以用于构建智能客服系统、知识库问答系统等,提升企业的服务质量和运营效率。 2. 教育服务:在教育领域,大模型被应用于个性化学习、智能辅导、作业批改等,帮助教师减轻工作负担,提高教学质量。 3. 工业智能化:大模型有助于解决工业领域的复杂性和不确定性问题,尽管在认知能力方面尚未完全具备专家级的复杂决策能力。 4. 消费
    丙丁先生 2025-01-07 09:25 80浏览
  • 本文介绍Linux系统更换开机logo方法教程,通用RK3566、RK3568、RK3588、RK3576等开发板,触觉智能RK3562开发板演示,搭载4核A53处理器,主频高达2.0GHz;内置独立1Tops算力NPU,可应用于物联网网关、平板电脑、智能家居、教育电子、工业显示与控制等行业。制作图片开机logo图片制作注意事项(1)图片必须为bmp格式;(2)图片大小不能大于4MB;(3)BMP位深最大是32,建议设置为8;(4)图片名称为logo.bmp和logo_kernel.bmp;开机
    Industio_触觉智能 2025-01-06 10:43 87浏览
  • 这篇内容主要讨论三个基本问题,硅电容是什么,为什么要使用硅电容,如何正确使用硅电容?1.  硅电容是什么首先我们需要了解电容是什么?物理学上电容的概念指的是给定电位差下自由电荷的储藏量,记为C,单位是F,指的是容纳电荷的能力,C=εS/d=ε0εrS/4πkd(真空)=Q/U。百度百科上电容器的概念指的是两个相互靠近的导体,中间夹一层不导电的绝缘介质。通过观察电容本身的定义公式中可以看到,在各个变量中比较能够改变的就是εr,S和d,也就是介质的介电常数,金属板有效相对面积以及距离。当前
    知白 2025-01-06 12:04 173浏览
  • 在智能家居领域中,Wi-Fi、蓝牙、Zigbee、Thread与Z-Wave等无线通信协议是构建短距物联局域网的关键手段,它们常在实际应用中交叉运用,以满足智能家居生态系统多样化的功能需求。然而,这些协议之间并未遵循统一的互通标准,缺乏直接的互操作性,在进行组网时需要引入额外的网关作为“翻译桥梁”,极大地增加了系统的复杂性。 同时,Apple HomeKit、SamSung SmartThings、Amazon Alexa、Google Home等主流智能家居平台为了提升市占率与消费者
    华普微HOPERF 2025-01-06 17:23 145浏览
  • PLC组态方式主要有三种,每种都有其独特的特点和适用场景。下面来简单说说: 1. 硬件组态   定义:硬件组态指的是选择适合的PLC型号、I/O模块、通信模块等硬件组件,并按照实际需求进行连接和配置。    灵活性:这种方式允许用户根据项目需求自由搭配硬件组件,具有较高的灵活性。    成本:可能需要额外的硬件购买成本,适用于对系统性能和扩展性有较高要求的场合。 2. 软件组态   定义:软件组态主要是通过PLC
    丙丁先生 2025-01-06 09:23 85浏览
  • 村田是目前全球量产硅电容的领先企业,其在2016年收购了法国IPDiA头部硅电容器公司,并于2023年6月宣布投资约100亿日元将硅电容产能提升两倍。以下内容主要来自村田官网信息整理,村田高密度硅电容器采用半导体MOS工艺开发,并使用3D结构来大幅增加电极表面,因此在给定的占位面积内增加了静电容量。村田的硅技术以嵌入非结晶基板的单片结构为基础(单层MIM和多层MIM—MIM是指金属 / 绝缘体/ 金属) 村田硅电容采用先进3D拓扑结构在100um内,使开发的有效静电容量面积相当于80个
    知白 2025-01-07 15:02 75浏览
  • 彼得·德鲁克被誉为“现代管理学之父”,他的管理思想影响了无数企业和管理者。然而,关于他的书籍分类,一种流行的说法令人感到困惑:德鲁克一生写了39本书,其中15本是关于管理的,而其中“专门写工商企业或为企业管理者写的”只有两本——《为成果而管理》和《创新与企业家精神》。这样的表述广为流传,但深入探讨后却发现并不完全准确。让我们一起重新审视这一说法,解析其中的矛盾与根源,进而重新认识德鲁克的管理思想及其著作的真正价值。从《创新与企业家精神》看德鲁克的视角《创新与企业家精神》通常被认为是一本专为企业管
    优思学院 2025-01-06 12:03 119浏览
  • 每日可见的315MHz和433MHz遥控模块,你能分清楚吗?众所周知,一套遥控设备主要由发射部分和接收部分组成,发射器可以将控制者的控制按键经过编码,调制到射频信号上面,然后经天线发射出无线信号。而接收器是将天线接收到的无线信号进行解码,从而得到与控制按键相对应的信号,然后再去控制相应的设备工作。当前,常见的遥控设备主要分为红外遥控与无线电遥控两大类,其主要区别为所采用的载波频率及其应用场景不一致。红外遥控设备所采用的射频信号频率一般为38kHz,通常应用在电视、投影仪等设备中;而无线电遥控设备
    华普微HOPERF 2025-01-06 15:29 127浏览
  •     为控制片内设备并且查询其工作状态,MCU内部总是有一组特殊功能寄存器(SFR,Special Function Register)。    使用Eclipse环境调试MCU程序时,可以利用 Peripheral Registers Viewer来查看SFR。这个小工具是怎样知道某个型号的MCU有怎样的寄存器定义呢?它使用一种描述性的文本文件——SVD文件。这个文件存储在下面红色字体的路径下。    例:南京沁恒  &n
    电子知识打边炉 2025-01-04 20:04 100浏览
  • 随着市场需求不断的变化,各行各业对CPU的要求越来越高,特别是近几年流行的 AIOT,为了有更好的用户体验,CPU的算力就要求更高了。今天为大家推荐由米尔基于瑞芯微RK3576处理器推出的MYC-LR3576核心板及开发板。关于RK3576处理器国产CPU,是这些年的骄傲,华为手机全国产化,国人一片呼声,再也不用卡脖子了。RK3576处理器,就是一款由国产是厂商瑞芯微,今年第二季推出的全新通用型的高性能SOC芯片,这款CPU到底有多么的高性能,下面看看它的几个特性:8核心6 TOPS超强算力双千
    米尔电子嵌入式 2025-01-03 17:04 55浏览
  • By Toradex 秦海1). 简介嵌入式平台设备基于Yocto Linux 在开发后期量产前期,为了安全以及提高启动速度等考虑,希望将 ARM 处理器平台的 Debug Console 输出关闭,本文就基于 NXP i.MX8MP ARM 处理器平台来演示相关流程。 本文所示例的平台来自于 Toradex Verdin i.MX8MP 嵌入式平台。  2. 准备a). Verdin i.MX8MP ARM核心版配合Dahlia载板并
    hai.qin_651820742 2025-01-07 14:52 45浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦