点击蓝字 关注我们
SUBSCRIBE to US
近期,波士顿动力公司(Boston Dynamics)倾注了一些力量在制造能够做商业用途的机器人,而另一方面,关于动态人形机器人的发展也并没有落下。在最新的视频中,波士顿动力公司展示了Atlas专注于感知和操纵的一些惊人的新功能,Atlas团队负责人回答了我们(作者,以下简称我)关于他们如何实现这一目标的一些问题。
这里的亮点之一是Atlas能够动态地移动和与对象交互,尤其是与具有较大质量的对象交互。举着木板的快速旋转180度是令人印象深刻的,因为Atlas必须完成所有增加的动力输出。与旋转的袋子投掷相同:当机器人在半空中释放袋子时,它的动量就会发生变化,这需要在着陆时进行补偿。要把箱子推倒,必须靠过去,但同时需要小心,这样Atlas就不会在推动之后从平台上摔下来。
虽然Atlas在这里展示的物理能力令人印象深刻,但这一演示也突出了要让机器人以自主甚至半自主的方式发挥作用,还有多少工作要做。例如,环境改造是人类一直在做的事情,但我们在很大程度上依赖于我们对世界的了解来有效地做到这一点。我很确定Atlas没有能力识别这样的问题,考虑需要进行什么样的修改才能使差距变得缩小,找到必要的资源,然后以人类的方式自主进行适当的修改。由此可以看到,在机器人能够以富有成效的方式利用这些令人印象深刻的物理技能之前,在世界理解和推理方面还有很多工作要做。
这段视频中还有很多内容,波士顿动力公司帮助我们整理了一些幕后解说:
关于这一点,我们向波士顿动力公司发送了几个问题,Atlas团队负责人Scott Kuindersma为我们进行了解答。
Q
Atlas事先对它将要操纵的对象了解多少?这些知识对于现实世界的操纵有多重要?
Scott Kuindersma:这段视频中,机器人有一张高级地图,其中包括我们希望它去哪里,我们希望它拾取什么,以及它一路上应该做什么特技。该地图与真实环境的几何匹配度不高;它是一个包含障碍模板和注释动作的近似描述,由机器人的感知系统在线调整。机器人具有离线计算的对象相关抓取目标,模型预测控制器(MPC)可以访问近似质量物体。
我们认为,现实世界中的机器人同样会利用关于其任务和环境的先验知识,但这些先验知识采用什么形式以及它们提供的信息量可能会因应用程序而异,其中一些需求可能会与一些早期的商业应用程序相一致,但我们也在构建允许Atlas在频谱上的其他点运行的功能。
Q
Atlas的硬件功能是否经常限制您使用Atlas的频率?在这一点上,相对于改进软件,改进硬件有多大区别?
Kuindersma:不经常。当我们偶尔花时间在inverted 540这样得东西上时,我们是在故意突破界限。除了对我们来说非常有趣和(希望)激励他人之外,这些活动几乎总是结出持久的果实,并为我们提供了更强大的软件来解决其他问题。
我们的硬件和软件团队之间的紧密结合,以及我们设计、迭代和相互学习的能力,是我们团队与众不同的原因之一。这偶尔会导致硬件升级和重大重新设计的行为。但从软件的角度来看,我们一直觉得自己只是在触及Atlas的表面。
Q
你能详细说明一下你用来确保Atlas能够成功执行最后一个技巧而不会陷入困境的故障排除过程吗?
Kuindersma:控制器通过使用机器人模型来预测和优化其未来状态。在这种情况下所做的改进是对该模型的扩展,包括了机器人四肢的几何形状和防止它们相交的约束。换句话说,我们没有专门调整这一行为以避免自碰撞,而是在控制器中添加了更多的模型细节,以使其更好地避免不可行的配置。这样,Atlas的所有行为都会受益。
Q
关于视频,您还可以与我们分享什么?
Kuindersma:一些有趣的事实:围绕MPC和操纵的核心新技术是在今年开发的,但我们为视频绘制白板草图和完成拍摄之间的时间是六周。2×12英寸平板的工具包投掷和旋转跳跃是两年前作为我们移动工作的一部分创建的180跳跃行为的在线推广。控制器输入的唯一区别是对象模型和所需的对象运动。
尽管机器人对投掷力学有很好的理解,但真实世界的表现对释放的精确时间以及释放过程中袋子是否碰巧被手指夹住很敏感。这些细节并没有被我们的模拟工具很好地表现出来,所以我们主要依靠硬件实验来改进行为,直到每次都能奏效。
微信号|IEEE电气电子工程师
新浪微博|IEEE中国
· IEEE电气电子工程师学会 ·
往
期
推
荐
Apptronik开发多用途人形机器人
光学AI可以满足巨大的数据需求
电动汽车是必不可少的网格级存储
新法拉第笼可以关闭和打开?