将工业机器人装配任务从仿真转为现实

原创 英伟达NVIDIA中国 2023-06-06 18:45


仿真是帮助机器人学习感知(从摄像机图像中了解世界)、规划(制定解决问题的行动序列)和控制(产生改变机器人位置和方向的电机指令)等新技能的一个必要工具。


机器人装配在汽车、航空航天、电子和医疗设备行业中无处不在。设置机器人执行装配任务是一个耗时且昂贵的过程,需要一整支团队来设计机器人的轨迹并仔细划定边界。


在其他机器人技术领域,仿真已经成为不可或缺的工具,尤其是在发展 AI 的过程中。但机器人装配涉及几何复杂的紧密公差零件之间的高精度接触。长期以来,仿真此类接触紧密的活动在计算上的难度极高。


NVIDIA 近期在机器人装配方面取得了进展,这使得超实时仿真成为可能。这种高速仿真能够使用强大、先进的强化学习(RL)技术。借助 RL,虚拟机器人能够探索仿真环境、获得丰富的经验,并通过智能试错来学习有用的技能。将 RL 用于机器人装配,可以最大限度地减少对操作者专业知识的需求、增加对变化的鲁棒性并减少硬件磨损。sim-to-real 一词指的就是将仿真环境中的技能转移到现实世界。


将 RL 用于机器人装配的最大挑战之一,是机器人在仿真中学习的技能通常不能有效地转移到现实世界的机器人上。出现这个问题是因为仿真器与现实世界之间存在物理学、电机信号和传感器信号等方面的微妙差异。此外,现实世界的机器人可能会遇到在仿真器中从未见过的情况。这些问题被统称为 reality gap(现实差距)。


什么是 IndustReal?


为了将 RL 用于具有挑战性的装配任务并解决现实差距问题,我们开发了 IndustReal。IndustReal 是一套用于帮助机器人解决仿真中的装配任务,并将这些能力转移到现实世界的算法、系统和工具。


IndustReal 主要提供:

  • 一套使仿真机器人通过 RL 解决复杂装配任务的算法。


  • 一种解决现实差距,并在现实世界中部署时稳定机器人所学技能的方法。


  • 一个现实世界机器人系统,将在仿真中训练的装配技能端到端地转移到现实。


  • 使研究人员和工程师能够复制该系统的软硬件工具套件。

  1. IndustRealKit 是一套受 NIST Task Board 1(既定的机器人装配基准)启发的 3D 可打印资产 CAD 模型。

  2. IndustRealLib 是一个轻量级的 Python 库,可将在 NVIDIA Isaac Gym 仿真器中学到的技能部署到现实世界的 Franka Emika Panda 机器人臂上。



图 1. 机器人在仿真中执行插入钉子

和装配齿轮的策略(上一行),

然后将这些策略部署到现实世界中(下一行)。


训练算法和部署方法


在这项工作中,我们提出了三种算法帮助机器人在仿真中使用 RL 学习装配技能。我们还提出了一种使现实世界的机器人能够执行这些技能的部署方法。


仿真感知策略更新

像 NVIDIA Isaac Gym 和 NVIDIA Isaac Sim 这样的机器人仿真器在满足现实世界的物理学同时,还要满足许多物理限制,其中最重要的一项是物体不能相互重叠,或者说“互穿”。在大多数仿真器中,物体之间的小规模互通不可避免,尤其是在实时执行时。


我们引入了仿真感知策略更新(SAPU),为仿真机器人提供关于仿真预测何时可靠或不可靠的认知。具体而言,在 SAPU 中,我们在 NVIDIA Warp 中实现了一个基于 GPU 的模块,从而在机器人学习如何使用 RL 装配零件时检查是否存在互穿。


当互穿规模小时,我们对机器人的仿真体验进行加权,而当互穿规模大时,我们就减少加权。该策略可以防止仿真机器人利用不准确的物理规则解决任务,进而导致无法将它学习的技能转移到现实世界中。


有向距离场奖励


为了使用 RL 解决任务,必须定义一个奖励信号(例如衡量机器人在解决任务方面取得了多少进展)。然而,在装配过程中,很难根据形状复杂零件的对齐情况来定义一个奖励信号。


于是我们引入了有向距离场(SDF)奖励,以便衡量仿真零件在装配过程中的对齐程度。SDF 是一个数学函数,它可以从一个物体上的点计算出到另一个物体表面的最短距离。这种自然、通用的方法可以描述零件之间的对齐情况,高度对称或不对称都不例外。


在 SDF 奖励中,我们将奖励信号定义为装配过程中一个零件的当前位置和目标位置之间的 SDF 距离。



图 2. 一个圆形钉子的 SDF 2D 切片可视化图。

颜色代表从指定的点到钉子表面的最短距离


基于样本的课程


课程学习是一种成熟的 RL 方法,可解决涉及到许多单独步骤或动作的问题。毕竟,机器人在学习过程中所面对的任务难度会逐渐增加。


在我们的装配任务中,机器人首先解决简单的装配问题(即零件已完成部分装配),然后再升级到更难的问题(即零件已被拆解)。


随着零件之间的初始接触逐渐减少,零件会在某个时刻不再有初始接触点。由于机器人的知识已过度偏向于部分装配的情况,这种难度上的陡增会导致性能崩溃。


我们为仿真机器人引入了一个基于样本的课程(SBC)来逐步学习复杂的装配任务。在课程的所有阶段都要求机器人解决各种难度范围内的抽样装配问题,但会逐渐删除问题分布中最简单的问题。在课程的最后阶段,各个零件在一开始就完全不接触。请看下面的可视化图。


图 3. 基于样本的课程的不同阶段。

任务难度从左到右随插头(黄色球体)

初始位置的分布远离插座(米色)而增加。


策略级行动整合器


在最常见的机器人 RL 应用中,通过对机器人的姿势(即其位置和方向)进行增量调整来产生机器人的动作。这些增量被应用于机器人的当前姿态,以产生一个瞬时的目标姿势。如果应用于现实世界中的机器人,由于实际机器人的复杂性,这种策略可能会导致机器人的最终姿势与其最终目标姿势之间产生差异。


我们还提出了一个策略级行动整合器(PLAI)。这是一种简单的算法,在现实世界的机器人上部署学习到的技能时,可以减少稳态(即长期的)错误。我们将增量调整应用于先前的瞬时目标姿势,以产生新的瞬时目标姿势。


在数学上(类似于经典 PID 控制器的积分项),这种策略产生的瞬时目标姿势是初始姿势和机器人随时间产生的动作之和。该技术即便在复杂的实际情况下,也可以使机器人的最终姿势与最终目标姿势之间的误差最小化。


机器人正试图移动到一个目标位置,期间我们比较了标准(标称)策略、PLAI 算法和经典的 PID 控制器在抵达任务上的表现。请看下面的可视化图。


图 4. 机器人使用标准策略、PLAI 算法和 PID 策略将其指尖移动到粉色球体目标的比较(上一行:在重力补偿不完全的情况下进行比较。下一行:在未建立关节处摩擦力模型的情况下进行比较)


系统和工具


通过 IndustReal 进行现实世界实验所使用的装置,包括一个 Franka Emika Panda 机器人臂、安装在机器人手上的英特尔 RealSense D435 摄像头,以及一个带有零件的装配平台。


图 5. 物理机器人实验设置:一个 Franka Emika Panda 机器人臂,机器人手上装有一个英特尔 RealSense D435 摄像头,底部是一个带有零件的装配平台。


IndustReal 提供用于复制本文中介绍的系统所需要的硬件(IndustRealKit)和软件(IndustRealLib)。


IndustRealKit 包含可 3D 打印的 20 个零件的 CAD 模型,涵盖了这项工作中使用到的所有零件。这些模型带有 6 个钉子支架、6 个钉子插座、3 个齿轮、1 个齿轮底座(带 3 个齿轮轴)以及 4 个 NEMA 连接器和插座支架,均使用美标插头和电源插座。


采购清单包括 17 个零件:6 个金属钉子(NIST 基准)、4 个 NEMA 连接器和插座、1 个光学平台以及紧固件。


图 6.  IndustRealKit


IndustRealLib 是一个轻量级库,包含了将在仿真中通过 RL 学到的技能部署到现实世界机器臂上所需要的代码。具体而言,我们为用户提供脚本,以便他们把在 NVIDIA Isaac Gym 仿真器中训练的控制策略(即将传感器信号映射到机器人行动的神经网络)迅速部署到 Franka Emika Panda 机器人上。


未来发展方向


IndustReal 展示了一条在机器人装配任务中充分发挥仿真潜力的路径。随着仿真变得更加精准和高效,以及更多仿真转现实的转移技术被源源不断地开发出来,我们已经预见到了将这项工作扩展到制造业其他任务(如螺丝紧固、电缆布线和焊接等)的众多可能性。我们有理由相信,有朝一日,每一个先进的工业制造机器人都将使用这种技术进行仿真训练,以便可以无缝、灵活地转移到现实世界。


我们的下一步是将该系统扩展到包括更多的对象、装配任务和复杂的环境。我们还打算开发更多的仿真转现实技术,以便更加经济、可靠、安全而顺利地转移学到的技能。


如何使用 IndustReal


  • 请访问 IndustReal project pagehttps://sites.google.com/nvidia.com/industreal,查看论文和摘要视频的链接。敬请关注即将推出的 IndustralKit 和 IndustralLib。


  • 下载独立运行的 NVIDIA Isaac Gym Preview Release https://developer.nvidia.cn/isaac-gymNVIDIA Isaac Gym Environmentshttps://github.com/NVIDIA-Omniverse/IsaacGymEnvs其中包含了在 IndustReal 中训练装配技能的基础 —— NVIDIA Omniverse factory environments https://github.com/NVIDIA-Omniverse/IsaacGymEnvs/blob/main/docs/factory.md)。


  • 下载 Omniverse 驱动的新一代 NVIDIA Isaac Simhttps://developer.nvidia.cn/zh-cn/isaac-sim)。



点击 “阅读原文”,或扫描下方海报二维码观看 NVIDIA 创始人兼 CEO 黄仁勋在 COMPUTEX 2023 的主题演讲直播回放,主题演讲中文字幕版已上线,了解 AI、图形及其他领域的最新进展!


评论 (0)
  •   定制软件开发公司推荐清单   在企业数字化转型加速的2025年,定制软件开发需求愈发多元复杂。不同行业、技术偏好与服务模式的企业,对开发公司的要求大相径庭。以下从技术赛道、服务模式及行业场景出发,为您提供适配的定制软件开发公司推荐及选择建议。   华盛恒辉科技有限公司:是一家专注于高端软件定制开发服务和高端建设的服务机构,致力于为企业提供全面、系统的开发制作方案。在部队政企开发、建设到运营推广领域拥有丰富经验,在教育,工业,医疗,APP,管理,商城,人工智能,部队软件、工业软件、数字化转
    华盛恒辉l58ll334744 2025-05-12 15:55 262浏览
  • 在全球供应链紧张和国产替代需求推动下,国产存储芯片产业快速发展,形成设计到封测一体化的完整生态。北京君正、兆易创新、紫光国芯、东芯股份、普冉股份和佰维存储等六大上市公司在NOR/NAND Flash、DRAM、嵌入式存储等领域布局各具特色,推动国产替代提速。贞光科技代理的品牌紫光国芯,专注DRAM技术,覆盖嵌入式存储与模组解决方案,为多领域客户提供高可靠性产品。随着AI、5G等新兴应用兴起,国产存储厂商有望迎来新一轮增长。存储芯片分类与应用易失性与非易失性存储芯片易失性存储芯片(Volatile
    贞光科技 2025-05-12 16:05 116浏览
  • ‌磁光克尔效应(Magneto-Optic Kerr Effect, MOKE)‌ 是指当线偏振光入射到磁性材料表面并反射后,其偏振状态(偏振面旋转角度和椭偏率)因材料的磁化强度或方向发生改变的现象。具体表现为:1、‌偏振面旋转‌:反射光的偏振方向相对于入射光发生偏转(克尔旋转角 θK)。2、‌椭偏率变化‌:反射光由线偏振变为椭圆偏振(克尔椭偏率 εK)。这一效应直接关联材料的磁化状态,是表征磁性材料(如铁磁体、反铁磁体)磁学性质的重要非接触式光学探测手段,广泛用于
    锦正茂科技 2025-05-12 11:02 233浏览
  •         信创产业含义的“信息技术应用创新”一词,最早公开信息见于2019年3月26日,在江苏南京召开的信息技术应用创新研讨会。本次大会主办单位为江苏省工业和信息化厅和中国电子工业标准化技术协会安全可靠工作委员会。        2019年5月16日,美国将华为列入实体清单,在未获得美国商务部许可的情况下,美国企业将无法向华为供应产品。       2019年6
    天涯书生 2025-05-11 10:41 174浏览
  • 递交招股书近一年后,曹操出行 IPO 进程终于迎来关键节点。从 2024 年 4 月首次递表,到 2025 年 4 月顺利通过中国证监会境外发行上市备案,并迅速更新招股书。而通过上市备案也标志着其赴港IPO进程进入实质性推进阶段,曹操出行最快有望于2025年内完成港股上市,成为李书福商业版图中又一关键落子。行路至此,曹操出行面临的挑战依然不容忽视。当下的网约车赛道,早已不是当年群雄逐鹿的草莽时代,市场渐趋饱和,竞争近乎白热化。曹操出行此时冲刺上市,既是背水一战,也是谋篇布局。其招股书中披露的资金
    用户1742991715177 2025-05-10 21:18 95浏览
  •   电磁数据管理系统深度解析   北京华盛恒辉电磁数据管理系统作为专业的数据处理平台,旨在提升电磁数据的处理效率、安全性与可靠性。以下从功能架构、核心特性、应用场景及技术实现展开分析:   应用案例   目前,已有多个电磁数据管理系统在实际应用中取得了显著成效。例如,北京华盛恒辉和北京五木恒润电磁数据管理系统。这些成功案例为电磁数据管理系统的推广和应用提供了有力支持。   一、核心功能模块   数据采集与接入:实时接收天线、频谱仪等设备数据,兼容多协议接口,确保数据采集的全面性与实时性
    华盛恒辉l58ll334744 2025-05-13 10:59 110浏览
  • 体积大小:14*11*2.6CM,电气参数:输入100V-240V/10A,输出16V24A。PCB 正面如下图。PCB 背面如下图。根据实际功能可以将PCB分成几部分:EMI滤波,PFC电路,LLC电路。EMI滤波区域,两级共模电感,LN各用了保险丝加压敏电阻,继电器(HF32FV-G)用来切除NTC的,为了提高效率点,如下图。PFC电路区域,如下图。LLC电路区域,如下图。详细分析一下该电源用的主要IC还有功率器件。AC侧采用了两颗整流桥进行并联,器件增加电流应力,如下图。共模电感都有放电针
    liweicheng 2025-05-10 20:03 129浏览
  • 【拆解】+自动喷香机拆解 家里之前买了从PDD买了一个小型自动喷香机放在厕所里。来增加家里的温馨感,这东西看着确实小巧,精致。可是这东西吧,耗电就是快,没过几天就没电了。今个就让我拆开看看什么在捣鬼。如下是产品的实物和宣传图: 由于螺丝孔太小和限位很深。对于我的螺丝刀套装没用。只能使用那种螺丝刀细头,同时又长的小螺丝刀进行拆解 拧下三颗螺丝钉,用一字螺丝刀撬开外壳,内部结构就呈现在眼前。 内部构造相当简单,部件没多少。就是锂电池供电,通过MCU实现按键控制,段码屏控制,LE
    zhusx123 2025-05-10 19:55 133浏览
  • 【拆解】+CamFi卡菲单反无线传输器拆解 对于单反爱好者,想要通过远程控制自拍怎么办呢。一个远程连接,远程控制相机拍摄的工具再合适不过了。今天给大伙介绍的是CamFi卡菲单反无线传输器。 CamFi 是专为数码单反相机打造的无线传输控制器,自带的 WiFi 功能(无需手机流量),不但可通过手机、平板、电脑等设备远程连接操作单反相机进行拍摄,而且还可实时传输相机拍摄的照片到 iPad 和电视等大屏设备进行查看和分享。 CamFi 支持大部分佳能和尼康单反相机,内置可充电锂离子电池,无需相机供电。
    zhusx123 2025-05-11 14:14 272浏览
  •   电磁数据展示系统平台解析   北京华盛恒辉电磁数据展示系统平台是实现电磁数据高效展示、分析与管理的综合性软件体系,以下从核心功能、技术特性、应用场景及发展趋势展开解读:   应用案例   目前,已有多个电磁数据展示系统在实际应用中取得了显著成效。例如,北京华盛恒辉和北京五木恒润电磁数据展示系统。这些成功案例为电磁数据展示系统的推广和应用提供了有力支持。   一、核心功能模块   数据采集与预处理   智能分析处理   集成频谱分析、时频变换等信号处理算法,自动提取时域频域特征;
    华盛恒辉l58ll334744 2025-05-13 10:20 123浏览
  •   基于 2025 年行业权威性与时效性,以下梳理国内知名软件定制开发企业,涵盖综合型、垂直领域及特色技术服务商:   华盛恒辉科技有限公司:是一家专注于高端软件定制开发服务和高端建设的服务机构,致力于为企业提供全面、系统的开发制作方案。在部队政企开发、建设到运营推广领域拥有丰富经验,在教育,工业,医疗,APP,管理,商城,人工智能,部队软件、工业软件、数字化转型、新能源软件、光伏软件、汽车软件,ERP,系统二次开发,CRM等领域有很多成功案例。   五木恒润科技有限公司:是一家专业的部队信
    华盛恒辉l58ll334744 2025-05-12 16:13 205浏览
  • 在印度与巴基斯坦的军事对峙情境下,歼10C的出色表现如同一颗投入平静湖面的巨石,激起层层涟漪,深刻印证了“质量大于数量”这一铁律。军事领域,技术优势就是决定胜负的关键钥匙。歼10C凭借先进的航电系统、强大的武器挂载能力以及卓越的机动性能,在战场上大放异彩。它能够精准捕捉目标,迅速发动攻击,以一敌多却毫不逊色。与之形成鲜明对比的是,单纯依靠数量堆砌的军事力量,在面对先进技术装备时,往往显得力不从心。这一现象绝非局限于军事范畴,在当今社会的各个领域,“质量大于数量”都已成为不可逆转的趋势。在科技行业
    curton 2025-05-11 19:09 211浏览
  • 在 AI 浪潮席卷下,厨电行业正经历着深刻变革。AWE 2025期间,万得厨对外首次发布了wan AiOS 1.0组织体超智能系统——通过AI技术能够帮助全球家庭实现从健康检测、膳食推荐,到食材即时配送,再到一步烹饪、营养总结的个性化健康膳食管理。这一创新之举并非偶然的个案,而是整个厨电行业大步迈向智能化、数字化转型浪潮的一个关键注脚,折射出全行业对 AI 赋能的热切渴求。前有标兵后有追兵,万得厨面临着高昂的研发成本与技术迭代压力,稍有懈怠便可能被后来者赶
    用户1742991715177 2025-05-11 22:44 161浏览
  • 蓝牙耳机是长这个样子,如下图。背部图,如下图。拆开L耳的一侧,有NFC和电池包(501230 3.7V 150mAh)如下图。电池包(501230 3.7V 150mAh)如下图。NFC正面,如下图。NFC背面,如下图。如何理解NFC的工作原理呢,搜集一下相关的资料,如下图。拆开R耳的一侧,PCB正面,如下图。PCB背面,如下图。有两组红黑的线,一组连接到了喇叭,另一组连接到了MIC头上,MIC头参数如下图。蓝牙模块(CSR 8635),有蛇形PCB走线做成天线,节约了天线成本,如下图。该IC介
    liweicheng 2025-05-10 00:45 98浏览
我要评论
0
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦