全球首个OpenAI机器人诞生!Figure01碾压马斯克擎天柱,10亿机器人大军正式启动

美股研究社 2024-03-15 19:15


OpenAI上一笔融资不到八个月,Figure就来交卷了!


来源 | 新智元

世界上第一个「ChatGPT机器人」来了!

初创公司Figure联合OpenAI,现在直接给LLM造了个身体(具体来说,它是个OpenAI训练的多模态大模型)。
半个月前刚获得OpenAI等的6.75亿美元融资,今天初创公司Figure就来交卷了,简直神速。
这个名为Figure 01的机器人,充分展示了和人类以及环境交互的能力。它会说会看,还能给人类递食物、捡垃圾、收拾碗筷。
不仅如此,它还能够推理,自行识别、计划和执行有用的任务。
在这个过程中,由OpenAI提供视觉推理和语言理解,Figure 01的神经网络,会提供快速、低等级、灵巧的机器人动作。
OpenAI和Figure Robotics放出的这段演示,瞬间震惊了网友:大模型和真实物理世界的距离,越来越近了!
此前Midjourney创始人预测:2040年,将会有10亿机器人,2060年将有一百亿,马斯克表示同意
这段视频可谓亮点满满。
首先,视频是1.0倍原速拍摄的,而且是连续拍摄,跟之前那些为了表现流畅而加速的人形机器人演示不一样。
其次,整个视频只了一个端到端的神经网络。
并且,机器人背后,并没有人在远程操作,所有动作都是由机器人自行完成的!
现在,压力给到了波士顿动力和马斯克的擎天柱这边。
高能机器人,能说会看还能推理
视频中的小哥问它:「Figure 01,你看到了什么?」
思索几秒后,它张口说话了:「我看到桌子中间的盘子中,放了一只苹果,沥水架上有几个盘子和一个杯子。我还看到你站在旁边,你的手放在桌子上。」
小哥接着问:「我能吃点东西吗?」
Figure 01回答:「当然!」然后抬起手,拿起一个苹果递给他。
下面,更高能的来了!
小哥直接把一堆垃圾哗啦啦倒在Figure 1面前,然后问它,你能不能一边给我解释下刚才为什么会这么做的原因,一边把这些垃圾收拾干净呢?
Figure 01一边有条不紊地把筐子拉到自己面前,把垃圾一个个捡进筐子里,一边回答道,「我给你苹果,是因为这是我在桌上唯一看到的能吃的东西」。
接下来,小哥又向Figure 01发出了灵魂拷问:「根据你眼前所见的场景,你觉得你眼前的这些盘子应该放到哪里呢?」
Figure 01自信满满地表示:像桌上这些盘子啊杯子啊,应该放到旁边的沥水架上。
小哥表示,那你就帮忙放一下吧?五秒后,Figure 01抬起右手,用敏捷灵活的动作,一个一个地把盘子和杯子放到了该放的地方。
最后,小哥还让Figure 01给自己的表现来个复盘:「你觉得你表现得如何?」
Figure 01很满意地说:「我觉得我做得很好,我把苹果递给了你,把垃圾丢掉了,桌上的东西也都放到了该放的地方。」
小哥向它表示了感谢后,Figure 01甚至还伸开双臂,耸了耸肩,表示有什么忙要帮的,欢迎随时来找我。

网友炸锅:科幻走进现实了?

看到这一幕的网友们,纷纷表示惊叹。
看起来,AGI可能在六个月内就会到来了,甚至更短!
波士顿动力只能再多编一些舞蹈花样了,不然真的打不过。😂
这就是世界上第一个终结者?
有人表示,让LLM机器人帮忙洗碗和打扫房子,就是最正确的事。不然总不能让它们成天吟诗画画吧……
「Figure 1,在我出门时,请你帮我打扫房子、洗碗、遛狗,你可以看《终结者2》,但是不要产生任何疯狂的想法,ok?」
如果对话再流畅一些,处理速度再快上100倍,那我们就会得到一个工作产品。
另外还有人吐槽了Figure 01的声音,为啥搞得像一个50岁的吸烟人士……
Figure CEO则表示,机器人的声音,是对文本转语音的AI进行了微调,还让大家猜猜是谁。
这家机器人初创公司Figure,囊括了波士顿动力、特斯拉、谷歌DeepMind和Archer Aviation的前员工。成立不到两年,它已经估值26亿美元。
和OpenAI的首次合作亮相,就如此惊艳。
显然,在机器人领域,人工智能时代才刚刚开始。
OpenAI的产品与合作副总裁Peter Welinder表示:"我们一直计划重返机器人领域,我们看到了与Figure合作的价值。我们想探索,在高性能的多模态模型驱动下,人形机器人能实现什么样的目标。」
如今,人形机器人再次引起了投资者兴趣,因为大模型驱动的软件,为机器人与人类的互动提供了更多可能性。
特斯拉CEO马斯克预测,在2040年,地球上将出现10亿个人形机器人。
创始人亲自下场解释原理
话说回来,被看Figure 01的这些操作看似容易,背后可是满满的玄机。
Figure AI的创始人Corey Lynch亲自在X解释了Figure 01的工作原理。
Figure 01现在能够做到:
- 描述它看到的一切情况
- 规划未来的行动
- 思考输入的视觉和文字信息
- 语音输出它的推理结果
放出的这个视频中,所有的行为都是学习的(不是远程操作的),并且没有加速播放。
如下图所示,Figure AI用机器人摄像头采集的视频信息,加上麦克风捕获的语音中的文本转录到由OpenAI提供的多模态大模型中,理解图像和文本。
模型能够处理对话的完整记录,包括之前的历史视频,得到语言响应,然后通过文本到语音的方式传回给人类。
同时模型还负责规划机器人运行哪些学习的闭环行为来完成给定的命令,将特定的神经网络权重加载到GPU上并执行策略。
将Figure 01连接到完成预训练的多模态模型,为其提供了一些有趣的新功能。
Figure 01在OpenAI的大模型的加持下可以做到:
- 描述机器人周围的环境;
- 决策时使用常识推理。比如,「餐桌上的盘子和杯子很可能之后要放到烘干架上」;
- 把「我饿了」这样模棱两可的高层次请求转化为「递给对方一个苹果」等与具体情况相适应的行为;
- 用通俗易懂的英语描述为什么它执行某个特定的动作。例如,「这是我能从餐桌上为你找到的唯一能吃的东西」。
理解对话内容的大模型为Figure 01提供了强大的短期记忆。
比如,如果人类提出问题:「你能把它们放在那里吗?」 「它们」指的是什么?「那里」又在哪里?正确回答需要机器人拥有思考记忆的能力。
通过预训练的模型分析对话的图像和文本历史记录,Figure 01可以快速形成并执行规划:
1)将杯子放在晾衣架上;
2)将盘子放在晾衣架上。
所有行为均由神经网络视觉运动Transformer进行策略驱动,将像素直接映射到动作。
神经网络以10hz的频率接收机器人拍到的图像,并以200hz的频率生成 24-DOF动作(手腕姿势和手指关节角度)。
这些动作作为高速「锚点(setpoints)」,供更高速率的全身控制器跟踪。
不同的部分各司其职:
- 云端的预训练模型对图像和文本进行常识推理,以得出高级规划;
- 学习的视觉运动策略执行规划,执行难以手动指定的快速反应行为,例如把一个袋子折叠成任何需要的形状;
- 同时,全身控制器确保安全、稳定的动作。例如,保持平衡。
最后Corey Lynch强调,即使就在几年前,业界都认为人形机器人进行规划和执行自己学习的行为,以及与它进行完整的对话的场景,将是几十年之后才会发生的事情。
显然,因为大模型的出现,一切都被加速了。
Figure AI是目前将AI能力延伸到现实世界中做得最好的地方。
Figure创始人:绝不把人形机器人用于军事
半个月前,这个消息就在AI圈内传开了——
人形机器人初创公司Figure,获得了OpenAI等公司的6.75亿美元融资!
参与融资的其他公司,包括OpenAI创业基金、亚马逊工业创新基金、Parkway风投公司、英特尔投资公司、Align风投公司和ARK投资公司。
OpenAI给Figure投钱,当然也是想下一盘大棋。
Figure的创始人兼首席执行官Brett Adcock表示,公司将利用这笔资金开发用于机器人技术的大型语言模型,扩大生产规模,并雇佣更多员工。
现在,Figure的演示已经显示了,他们在人形通用机器人的交互上,做出了重大飞跃的产品。
史上第一次,机器人在没有操控的情况下,和人如此自然地互动,并且能够服从人类。如此流畅的演示,此前的公司都没有做到。
当然,Figure 01目前只是一个原型,如果要进行商业部署,出售给企业,会需要更多的工作。
不过,Adcock已经表示,Figure的目标就是训练一个世界模型,来操作十亿单位级的人形机器人!
在Figure的网站上,Adcock介绍了Figure的总体规划——
Figure的目标是:开发对人类产生积极影响的通用类人机器人,并为子孙后代创造更美好的生活。这些机器人可以消除对不安全和不受欢迎的工作的需求,最终让我们过上更快乐、更有目的的生活。
Adcock表示,公司接下来还要艰苦奋斗几十年,需要一支冠军团队、数十亿美元的投资和工程创新。「我们的风险极高,成功机会极低」。
同时,他还宣称——
我们不会将人形机器人用于军事或国防应用,也不会将其用于任何需要对人类造成伤害的角色。我们的重点是为人类不想从事的工作提供资源。
现在,随着LLM的进步,全世界机器人都疯狂开卷了!
除了特斯拉的擎天柱Optimus,与亚马逊合作的人形机器人初创公司Agility,还有刚挖来前Optimus科学家领导开源机器人项目的Hugging Face,以及昨天刚成立的初创公司Physical Intelligence。
「青春版马斯克」帮人类连接天网
成立不到两年,Figure就成为估值26亿的独角兽,是连续创业者Brett Adcock成立的第3家公司。
1986年出生的Brett Adcoc,目前仅有38岁,从2012开始至今,创立了3个科技公司:
26岁的他在2012年就试图使用AI来革新招聘行业。
当时,他成立了Vettery——一个在线猎头平台,不到一年的时间团队迅速发展到数百名员工,客户网络扩大到30000家招聘公司。
Vettery人工智能系统每月匹配20000次面试,帮助数千人找到他们梦想的工作。
在成立1年多后,他就以1亿美元的价格将公司卖给了Adecco。
而他在2018年成立的第二家公司Archer,主营业务是制造可以垂直起降的电动飞机,解决在繁忙城市中无法使用飞机的问题。
不到5年的时间,Archer就以27亿美元的估值成功登录纽交所,成为了飞机行业中的特斯拉。
而在2022年,他成立的第三家公司Figure,希望能够用人形机器人彻底改变人类的工作方式。让人类无需再出现在那些危险而不适合人类的工作场所之中。
在Brett Adcock的眼里,Figure有可能成为世界上影响力最大的公司。
他白手起家,10年间成立的3家公司,分别达成了「亿元卖身」,「纽交所上市」,「2年成长为独角兽」3大成就,实在是令人咋舌。
而且纵观他成立的3家公司的过程和所涉及的行业,和前世界首富马斯克颇有相似之处。
而现在他的Figure AI更是直接与特斯拉的展开了竞争。
如今科技巨头纷纷「用钱投票」,一方面确实是因为人形机器人的赛道想象力实在太大,而另一方面,也是看中了Brett Adcock成功的履历和用科技改变世界的决心。
在他的个人网站上,给自己的介绍是:专注成立公司20年

关注下面公众号

和我一起探索港股市场的所有秘密

👇🏻

美股研究社 美股研究社,一个专注研究美股的平台,专业的美股投资人都在这.想了解美国股市行情、美股开户、美股资讯、美股公司;
评论
  • 习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习笔记&记录学习习笔记&记学习学习笔记&记录学习学习笔记&记录学习习笔记&记录学习学习笔记&记录学习学习笔记记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记
    youyeye 2024-12-11 17:58 70浏览
  • 天问Block和Mixly是两个不同的编程工具,分别在单片机开发和教育编程领域有各自的应用。以下是对它们的详细比较: 基本定义 天问Block:天问Block是一个基于区块链技术的数字身份验证和数据交换平台。它的目标是为用户提供一个安全、去中心化、可信任的数字身份验证和数据交换解决方案。 Mixly:Mixly是一款由北京师范大学教育学部创客教育实验室开发的图形化编程软件,旨在为初学者提供一个易于学习和使用的Arduino编程环境。 主要功能 天问Block:支持STC全系列8位单片机,32位
    丙丁先生 2024-12-11 13:15 57浏览
  • 近日,搭载紫光展锐W517芯片平台的INMO GO2由影目科技正式推出。作为全球首款专为商务场景设计的智能翻译眼镜,INMO GO2 以“快、准、稳”三大核心优势,突破传统翻译产品局限,为全球商务人士带来高效、自然、稳定的跨语言交流体验。 INMO GO2内置的W517芯片,是紫光展锐4G旗舰级智能穿戴平台,采用四核处理器,具有高性能、低功耗的优势,内置超微高集成技术,采用先进工艺,计算能力相比同档位竞品提升4倍,强大的性能提供更加多样化的应用场景。【视频见P盘链接】 依托“
    紫光展锐 2024-12-11 11:50 62浏览
  • 铁氧体芯片是一种基于铁氧体磁性材料制成的芯片,在通信、传感器、储能等领域有着广泛的应用。铁氧体磁性材料能够通过外加磁场调控其导电性质和反射性质,因此在信号处理和传感器技术方面有着独特的优势。以下是对半导体划片机在铁氧体划切领域应用的详细阐述: 一、半导体划片机的工作原理与特点半导体划片机是一种使用刀片或通过激光等方式高精度切割被加工物的装置,是半导体后道封测中晶圆切割和WLP切割环节的关键设备。它结合了水气电、空气静压高速主轴、精密机械传动、传感器及自动化控制等先进技术,具有高精度、高
    博捷芯划片机 2024-12-12 09:16 69浏览
  • 全球知名半导体制造商ROHM Co., Ltd.(以下简称“罗姆”)宣布与Taiwan Semiconductor Manufacturing Company Limited(以下简称“台积公司”)就车载氮化镓功率器件的开发和量产事宜建立战略合作伙伴关系。通过该合作关系,双方将致力于将罗姆的氮化镓器件开发技术与台积公司业界先进的GaN-on-Silicon工艺技术优势结合起来,满足市场对高耐压和高频特性优异的功率元器件日益增长的需求。氮化镓功率器件目前主要被用于AC适配器和服务器电源等消费电子和
    电子资讯报 2024-12-10 17:09 95浏览
  • 首先在gitee上打个广告:ad5d2f3b647444a88b6f7f9555fd681f.mp4 · 丙丁先生/香河英茂工作室中国 - Gitee.com丙丁先生 (mr-bingding) - Gitee.com2024年对我来说是充满挑战和机遇的一年。在这一年里,我不仅进行了多个开发板的测评,还尝试了多种不同的项目和技术。今天,我想分享一下这一年的故事,希望能给大家带来一些启发和乐趣。 年初的时候,我开始对各种开发板进行测评。从STM32WBA55CG到瑞萨、平头哥和平海的开发板,我都
    丙丁先生 2024-12-11 20:14 58浏览
  • 在智能化技术快速发展当下,图像数据的采集与处理逐渐成为自动驾驶、工业等领域的一项关键技术。高质量的图像数据采集与算法集成测试都是确保系统性能和可靠性的关键。随着技术的不断进步,对于图像数据的采集、处理和分析的需求日益增长,这不仅要求我们拥有高性能的相机硬件,还要求我们能够高效地集成和测试各种算法。我们探索了一种多源相机数据采集与算法集成测试方案,能够满足不同应用场景下对图像采集和算法测试的多样化需求,确保数据的准确性和算法的有效性。一、相机组成相机一般由镜头(Lens),图像传感器(Image
    康谋 2024-12-12 09:45 61浏览
  • 智能汽车可替换LED前照灯控制运行的原理涉及多个方面,包括自适应前照灯系统(AFS)的工作原理、传感器的应用、步进电机的控制以及模糊控制策略等。当下时代的智能汽车灯光控制系统通过车载网关控制单元集中控制,表现特殊点的有特斯拉,仅通过前车身控制器,整个系统就包括了灯光旋转开关、车灯变光开关、左LED前照灯总成、右LED前照灯总成、转向柱电子控制单元、CAN数据总线接口、组合仪表控制单元、车载网关控制单元等器件。变光开关、转向开关和辅助操作系统一般连为一体,开关之间通过内部线束和转向柱装置连接为多,
    lauguo2013 2024-12-10 15:53 93浏览
  • 一、SAE J1939协议概述SAE J1939协议是由美国汽车工程师协会(SAE,Society of Automotive Engineers)定义的一种用于重型车辆和工业设备中的通信协议,主要应用于车辆和设备之间的实时数据交换。J1939基于CAN(Controller Area Network)总线技术,使用29bit的扩展标识符和扩展数据帧,CAN通信速率为250Kbps,用于车载电子控制单元(ECU)之间的通信和控制。小北同学在之前也对J1939协议做过扫盲科普【科普系列】SAE J
    北汇信息 2024-12-11 15:45 102浏览
  • 时源芯微——RE超标整机定位与解决详细流程一、 初步测量与问题确认使用专业的电磁辐射测量设备,对整机的辐射发射进行精确测量。确认是否存在RE超标问题,并记录超标频段和幅度。二、电缆检查与处理若存在信号电缆:步骤一:拔掉所有信号电缆,仅保留电源线,再次测量整机的辐射发射。若测量合格:判定问题出在信号电缆上,可能是电缆的共模电流导致。逐一连接信号电缆,每次连接后测量,定位具体哪根电缆或接口导致超标。对问题电缆进行处理,如加共模扼流圈、滤波器,或优化电缆布局和屏蔽。重新连接所有电缆,再次测量
    时源芯微 2024-12-11 17:11 103浏览
  • 我的一台很多年前人家不要了的九十年代SONY台式组合音响,接手时只有CD功能不行了,因为不需要,也就没修,只使用收音机、磁带机和外接信号功能就够了。最近五年在外地,就断电闲置,没使用了。今年9月回到家里,就一个劲儿地忙着收拾家当,忙了一个多月,太多事啦!修了电气,清理了闲置不用了的电器和电子,就是一个劲儿地扔扔扔!几十年的“工匠式”收留收藏,只能断舍离,拆解不过来的了。一天,忽然感觉室内有股臭味,用鼻子的嗅觉功能朝着臭味重的方向寻找,觉得应该就是这台组合音响?怎么会呢?这无机物的东西不会腐臭吧?
    自做自受 2024-12-10 16:34 155浏览
  • 习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习笔记&记录学习习笔记&记学习学习笔记&记录学习学习笔记&记录学习习笔记&记录学习学习笔记&记录学习学习笔记记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记
    youyeye 2024-12-10 16:13 113浏览
  • RK3506 是瑞芯微推出的MPU产品,芯片制程为22nm,定位于轻量级、低成本解决方案。该MPU具有低功耗、外设接口丰富、实时性高的特点,适合用多种工商业场景。本文将基于RK3506的设计特点,为大家分析其应用场景。RK3506核心板主要分为三个型号,各型号间的区别如下图:​图 1  RK3506核心板处理器型号场景1:显示HMIRK3506核心板显示接口支持RGB、MIPI、QSPI输出,且支持2D图形加速,轻松运行QT、LVGL等GUI,最快3S内开
    万象奥科 2024-12-11 15:42 80浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦