全球首个OpenAI机器人诞生!Figure01碾压马斯克擎天柱,10亿机器人大军正式启动

美股研究社 2024-03-15 19:15


OpenAI上一笔融资不到八个月,Figure就来交卷了!


来源 | 新智元

世界上第一个「ChatGPT机器人」来了!

初创公司Figure联合OpenAI,现在直接给LLM造了个身体(具体来说,它是个OpenAI训练的多模态大模型)。
半个月前刚获得OpenAI等的6.75亿美元融资,今天初创公司Figure就来交卷了,简直神速。
这个名为Figure 01的机器人,充分展示了和人类以及环境交互的能力。它会说会看,还能给人类递食物、捡垃圾、收拾碗筷。
不仅如此,它还能够推理,自行识别、计划和执行有用的任务。
在这个过程中,由OpenAI提供视觉推理和语言理解,Figure 01的神经网络,会提供快速、低等级、灵巧的机器人动作。
OpenAI和Figure Robotics放出的这段演示,瞬间震惊了网友:大模型和真实物理世界的距离,越来越近了!
此前Midjourney创始人预测:2040年,将会有10亿机器人,2060年将有一百亿,马斯克表示同意
这段视频可谓亮点满满。
首先,视频是1.0倍原速拍摄的,而且是连续拍摄,跟之前那些为了表现流畅而加速的人形机器人演示不一样。
其次,整个视频只了一个端到端的神经网络。
并且,机器人背后,并没有人在远程操作,所有动作都是由机器人自行完成的!
现在,压力给到了波士顿动力和马斯克的擎天柱这边。
高能机器人,能说会看还能推理
视频中的小哥问它:「Figure 01,你看到了什么?」
思索几秒后,它张口说话了:「我看到桌子中间的盘子中,放了一只苹果,沥水架上有几个盘子和一个杯子。我还看到你站在旁边,你的手放在桌子上。」
小哥接着问:「我能吃点东西吗?」
Figure 01回答:「当然!」然后抬起手,拿起一个苹果递给他。
下面,更高能的来了!
小哥直接把一堆垃圾哗啦啦倒在Figure 1面前,然后问它,你能不能一边给我解释下刚才为什么会这么做的原因,一边把这些垃圾收拾干净呢?
Figure 01一边有条不紊地把筐子拉到自己面前,把垃圾一个个捡进筐子里,一边回答道,「我给你苹果,是因为这是我在桌上唯一看到的能吃的东西」。
接下来,小哥又向Figure 01发出了灵魂拷问:「根据你眼前所见的场景,你觉得你眼前的这些盘子应该放到哪里呢?」
Figure 01自信满满地表示:像桌上这些盘子啊杯子啊,应该放到旁边的沥水架上。
小哥表示,那你就帮忙放一下吧?五秒后,Figure 01抬起右手,用敏捷灵活的动作,一个一个地把盘子和杯子放到了该放的地方。
最后,小哥还让Figure 01给自己的表现来个复盘:「你觉得你表现得如何?」
Figure 01很满意地说:「我觉得我做得很好,我把苹果递给了你,把垃圾丢掉了,桌上的东西也都放到了该放的地方。」
小哥向它表示了感谢后,Figure 01甚至还伸开双臂,耸了耸肩,表示有什么忙要帮的,欢迎随时来找我。

网友炸锅:科幻走进现实了?

看到这一幕的网友们,纷纷表示惊叹。
看起来,AGI可能在六个月内就会到来了,甚至更短!
波士顿动力只能再多编一些舞蹈花样了,不然真的打不过。😂
这就是世界上第一个终结者?
有人表示,让LLM机器人帮忙洗碗和打扫房子,就是最正确的事。不然总不能让它们成天吟诗画画吧……
「Figure 1,在我出门时,请你帮我打扫房子、洗碗、遛狗,你可以看《终结者2》,但是不要产生任何疯狂的想法,ok?」
如果对话再流畅一些,处理速度再快上100倍,那我们就会得到一个工作产品。
另外还有人吐槽了Figure 01的声音,为啥搞得像一个50岁的吸烟人士……
Figure CEO则表示,机器人的声音,是对文本转语音的AI进行了微调,还让大家猜猜是谁。
这家机器人初创公司Figure,囊括了波士顿动力、特斯拉、谷歌DeepMind和Archer Aviation的前员工。成立不到两年,它已经估值26亿美元。
和OpenAI的首次合作亮相,就如此惊艳。
显然,在机器人领域,人工智能时代才刚刚开始。
OpenAI的产品与合作副总裁Peter Welinder表示:"我们一直计划重返机器人领域,我们看到了与Figure合作的价值。我们想探索,在高性能的多模态模型驱动下,人形机器人能实现什么样的目标。」
如今,人形机器人再次引起了投资者兴趣,因为大模型驱动的软件,为机器人与人类的互动提供了更多可能性。
特斯拉CEO马斯克预测,在2040年,地球上将出现10亿个人形机器人。
创始人亲自下场解释原理
话说回来,被看Figure 01的这些操作看似容易,背后可是满满的玄机。
Figure AI的创始人Corey Lynch亲自在X解释了Figure 01的工作原理。
Figure 01现在能够做到:
- 描述它看到的一切情况
- 规划未来的行动
- 思考输入的视觉和文字信息
- 语音输出它的推理结果
放出的这个视频中,所有的行为都是学习的(不是远程操作的),并且没有加速播放。
如下图所示,Figure AI用机器人摄像头采集的视频信息,加上麦克风捕获的语音中的文本转录到由OpenAI提供的多模态大模型中,理解图像和文本。
模型能够处理对话的完整记录,包括之前的历史视频,得到语言响应,然后通过文本到语音的方式传回给人类。
同时模型还负责规划机器人运行哪些学习的闭环行为来完成给定的命令,将特定的神经网络权重加载到GPU上并执行策略。
将Figure 01连接到完成预训练的多模态模型,为其提供了一些有趣的新功能。
Figure 01在OpenAI的大模型的加持下可以做到:
- 描述机器人周围的环境;
- 决策时使用常识推理。比如,「餐桌上的盘子和杯子很可能之后要放到烘干架上」;
- 把「我饿了」这样模棱两可的高层次请求转化为「递给对方一个苹果」等与具体情况相适应的行为;
- 用通俗易懂的英语描述为什么它执行某个特定的动作。例如,「这是我能从餐桌上为你找到的唯一能吃的东西」。
理解对话内容的大模型为Figure 01提供了强大的短期记忆。
比如,如果人类提出问题:「你能把它们放在那里吗?」 「它们」指的是什么?「那里」又在哪里?正确回答需要机器人拥有思考记忆的能力。
通过预训练的模型分析对话的图像和文本历史记录,Figure 01可以快速形成并执行规划:
1)将杯子放在晾衣架上;
2)将盘子放在晾衣架上。
所有行为均由神经网络视觉运动Transformer进行策略驱动,将像素直接映射到动作。
神经网络以10hz的频率接收机器人拍到的图像,并以200hz的频率生成 24-DOF动作(手腕姿势和手指关节角度)。
这些动作作为高速「锚点(setpoints)」,供更高速率的全身控制器跟踪。
不同的部分各司其职:
- 云端的预训练模型对图像和文本进行常识推理,以得出高级规划;
- 学习的视觉运动策略执行规划,执行难以手动指定的快速反应行为,例如把一个袋子折叠成任何需要的形状;
- 同时,全身控制器确保安全、稳定的动作。例如,保持平衡。
最后Corey Lynch强调,即使就在几年前,业界都认为人形机器人进行规划和执行自己学习的行为,以及与它进行完整的对话的场景,将是几十年之后才会发生的事情。
显然,因为大模型的出现,一切都被加速了。
Figure AI是目前将AI能力延伸到现实世界中做得最好的地方。
Figure创始人:绝不把人形机器人用于军事
半个月前,这个消息就在AI圈内传开了——
人形机器人初创公司Figure,获得了OpenAI等公司的6.75亿美元融资!
参与融资的其他公司,包括OpenAI创业基金、亚马逊工业创新基金、Parkway风投公司、英特尔投资公司、Align风投公司和ARK投资公司。
OpenAI给Figure投钱,当然也是想下一盘大棋。
Figure的创始人兼首席执行官Brett Adcock表示,公司将利用这笔资金开发用于机器人技术的大型语言模型,扩大生产规模,并雇佣更多员工。
现在,Figure的演示已经显示了,他们在人形通用机器人的交互上,做出了重大飞跃的产品。
史上第一次,机器人在没有操控的情况下,和人如此自然地互动,并且能够服从人类。如此流畅的演示,此前的公司都没有做到。
当然,Figure 01目前只是一个原型,如果要进行商业部署,出售给企业,会需要更多的工作。
不过,Adcock已经表示,Figure的目标就是训练一个世界模型,来操作十亿单位级的人形机器人!
在Figure的网站上,Adcock介绍了Figure的总体规划——
Figure的目标是:开发对人类产生积极影响的通用类人机器人,并为子孙后代创造更美好的生活。这些机器人可以消除对不安全和不受欢迎的工作的需求,最终让我们过上更快乐、更有目的的生活。
Adcock表示,公司接下来还要艰苦奋斗几十年,需要一支冠军团队、数十亿美元的投资和工程创新。「我们的风险极高,成功机会极低」。
同时,他还宣称——
我们不会将人形机器人用于军事或国防应用,也不会将其用于任何需要对人类造成伤害的角色。我们的重点是为人类不想从事的工作提供资源。
现在,随着LLM的进步,全世界机器人都疯狂开卷了!
除了特斯拉的擎天柱Optimus,与亚马逊合作的人形机器人初创公司Agility,还有刚挖来前Optimus科学家领导开源机器人项目的Hugging Face,以及昨天刚成立的初创公司Physical Intelligence。
「青春版马斯克」帮人类连接天网
成立不到两年,Figure就成为估值26亿的独角兽,是连续创业者Brett Adcock成立的第3家公司。
1986年出生的Brett Adcoc,目前仅有38岁,从2012开始至今,创立了3个科技公司:
26岁的他在2012年就试图使用AI来革新招聘行业。
当时,他成立了Vettery——一个在线猎头平台,不到一年的时间团队迅速发展到数百名员工,客户网络扩大到30000家招聘公司。
Vettery人工智能系统每月匹配20000次面试,帮助数千人找到他们梦想的工作。
在成立1年多后,他就以1亿美元的价格将公司卖给了Adecco。
而他在2018年成立的第二家公司Archer,主营业务是制造可以垂直起降的电动飞机,解决在繁忙城市中无法使用飞机的问题。
不到5年的时间,Archer就以27亿美元的估值成功登录纽交所,成为了飞机行业中的特斯拉。
而在2022年,他成立的第三家公司Figure,希望能够用人形机器人彻底改变人类的工作方式。让人类无需再出现在那些危险而不适合人类的工作场所之中。
在Brett Adcock的眼里,Figure有可能成为世界上影响力最大的公司。
他白手起家,10年间成立的3家公司,分别达成了「亿元卖身」,「纽交所上市」,「2年成长为独角兽」3大成就,实在是令人咋舌。
而且纵观他成立的3家公司的过程和所涉及的行业,和前世界首富马斯克颇有相似之处。
而现在他的Figure AI更是直接与特斯拉的展开了竞争。
如今科技巨头纷纷「用钱投票」,一方面确实是因为人形机器人的赛道想象力实在太大,而另一方面,也是看中了Brett Adcock成功的履历和用科技改变世界的决心。
在他的个人网站上,给自己的介绍是:专注成立公司20年

关注下面公众号

和我一起探索港股市场的所有秘密

👇🏻

美股研究社 美股研究社,一个专注研究美股的平台,专业的美股投资人都在这.想了解美国股市行情、美股开户、美股资讯、美股公司;
评论
  • 一个真正的质量工程师(QE)必须将一件产品设计的“意图”与系统的可制造性、可服务性以及资源在现实中实现设计和产品的能力结合起来。所以,可以说,这确实是一种工程学科。我们常开玩笑说,质量工程师是工程领域里的「侦探」、「警察」或「律师」,守护神是"墨菲”,信奉的哲学就是「墨菲定律」。(注:墨菲定律是一种启发性原则,常被表述为:任何可能出错的事情最终都会出错。)做质量工程师的,有时会不受欢迎,也会被忽视,甚至可能遭遇主动或被动的阻碍,而一旦出了问题,责任往往就落在质量工程师的头上。虽然质量工程师并不负
    优思学院 2025-01-09 11:48 177浏览
  • 光伏逆变器是一种高效的能量转换设备,它能够将光伏太阳能板(PV)产生的不稳定的直流电压转换成与市电频率同步的交流电。这种转换后的电能不仅可以回馈至商用输电网络,还能供独立电网系统使用。光伏逆变器在商业光伏储能电站和家庭独立储能系统等应用领域中得到了广泛的应用。光耦合器,以其高速信号传输、出色的共模抑制比以及单向信号传输和光电隔离的特性,在光伏逆变器中扮演着至关重要的角色。它确保了系统的安全隔离、干扰的有效隔离以及通信信号的精准传输。光耦合器的使用不仅提高了系统的稳定性和安全性,而且由于其低功耗的
    晶台光耦 2025-01-09 09:58 125浏览
  • 根据环洋市场咨询(Global Info Research)项目团队最新调研,预计2030年全球中空长航时无人机产值达到9009百万美元,2024-2030年期间年复合增长率CAGR为8.0%。 环洋市场咨询机构出版了的【全球中空长航时无人机行业总体规模、主要厂商及IPO上市调研报告,2025-2031】研究全球中空长航时无人机总体规模,包括产量、产值、消费量、主要生产地区、主要生产商及市场份额,同时分析中空长航时无人机市场主要驱动因素、阻碍因素、市场机遇、挑战、新产品发布等。报告从中空长航时
    GIRtina 2025-01-09 10:35 170浏览
  • HDMI 2.2 规格将至,开启视听新境界2025年1月6日,HDMI Forum, Inc. 宣布即将发布HDMI规范2.2版本。新HDMI规范为规模庞大的 HDMI 生态系统带来更多选择,为创建、分发和体验理想的终端用户效果提供更先进的解决方案。新技术为电视、电影和游戏工作室等内容制作商在当前和未来提供更高质量的选择,同时实现多种分发平台。96Gbps的更高带宽和新一代 HDMI 固定比率速率传输(Fixed Rate Link)技术为各种设备应用提供更优质的音频和视频。终端用户显示器能以最
    百佳泰测试实验室 2025-01-09 17:33 189浏览
  • Snyk 是一家为开发人员提供安全平台的公司,致力于协助他们构建安全的应用程序,并为安全团队提供应对数字世界挑战的工具。以下为 Snyk 如何通过 CircleCI 实现其“交付”使命的案例分析。一、Snyk 的挑战随着客户对安全工具需求的不断增长,Snyk 的开发团队面临多重挑战:加速交付的需求:Snyk 的核心目标是为开发者提供更快、更可靠的安全解决方案,但他们的现有 CI/CD 工具(TravisCI)运行缓慢,无法满足快速开发和部署的要求。扩展能力不足:随着团队规模和代码库的不断扩大,S
    艾体宝IT 2025-01-10 15:52 144浏览
  • 在过去十年中,自动驾驶和高级驾驶辅助系统(AD/ADAS)软件与硬件的快速发展对多传感器数据采集的设计需求提出了更高的要求。然而,目前仍缺乏能够高质量集成多传感器数据采集的解决方案。康谋ADTF正是应运而生,它提供了一个广受认可和广泛引用的软件框架,包含模块化的标准化应用程序和工具,旨在为ADAS功能的开发提供一站式体验。一、ADTF的关键之处!无论是奥迪、大众、宝马还是梅赛德斯-奔驰:他们都依赖我们不断发展的ADTF来开发智能驾驶辅助解决方案,直至实现自动驾驶的目标。从新功能的最初构思到批量生
    康谋 2025-01-09 10:04 152浏览
  • 1月9日,在2025国际消费电子展览会(CES)期间,广和通发布集智能语音交互及翻译、4G/5G全球漫游、随身热点、智能娱乐、充电续航等功能于一体的AI Buddy(AI陪伴)产品及解决方案,创新AI智能终端新品类。AI Buddy是一款信用卡尺寸的掌中轻薄智能设备,为用户带来实时翻译、个性化AI语音交互助手、AI影像识别、多模型账户服务、漫游资费服务、快速入网注册等高品质体验。为丰富用户视觉、听觉的智能化体验,AI Buddy通过蓝牙、Wi-Fi可配套OWS耳机、智能眼镜、智能音箱、智能手环遥
    物吾悟小通 2025-01-09 18:21 157浏览
  • 在当前人工智能(AI)与物联网(IoT)的快速发展趋势下,各行各业的数字转型与自动化进程正以惊人的速度持续进行。如今企业在设计与营运技术系统时所面临的挑战不仅是技术本身,更包含硬件设施、第三方软件及配件等复杂的外部因素。然而这些系统往往讲究更精密的设计与高稳定性,哪怕是任何一个小小的问题,都可能对整体业务运作造成严重影响。 POS应用环境与客户需求以本次分享的客户个案为例,该客户是一家全球领先的信息技术服务与数字解决方案提供商,遭遇到一个由他们所开发的POS机(Point of Sal
    百佳泰测试实验室 2025-01-09 17:35 167浏览
  • 职场是人生的重要战场,既是谋生之地,也是实现个人价值的平台。然而,有些思维方式却会悄无声息地拖住你的后腿,让你原地踏步甚至退步。今天,我们就来聊聊职场中最忌讳的五种思维方式,看看自己有没有中招。1. 固步自封的思维在职场中,最可怕的事情莫过于自满于现状,拒绝学习和改变。世界在不断变化,行业的趋势、技术的革新都在要求我们与时俱进。如果你总觉得自己的方法最优,或者害怕尝试新事物,那就很容易被淘汰。与其等待机会找上门,不如主动出击,保持学习和探索的心态。加入优思学院,可以帮助你快速提升自己,与行业前沿
    优思学院 2025-01-09 15:48 151浏览
  • 车机导航有看没有懂?智能汽车语系在地化不可轻忽!随着智能汽车市场全球化的蓬勃发展,近年来不同国家地区的「Automotive Localization」(汽车在地化)布局成为兵家必争之地,同时也是车厂在各国当地市场非常关键的营销利器。汽车在地化过程中举足轻重的「汽车语系在地化」,则是透过智能汽车产品文字与服务内容的设计订制,以对应不同国家地区用户的使用习惯偏好,除了让当地车主更能清楚理解车辆功能,也能进一步提高品牌满意度。客户问题与难处某车厂客户预计在台湾市场推出新一代车款,却由于车机导航开发人
    百佳泰测试实验室 2025-01-09 17:47 116浏览
  • 在智能网联汽车中,各种通信技术如2G/3G/4G/5G、GNSS(全球导航卫星系统)、V2X(车联网通信)等在行业内被广泛使用。这些技术让汽车能够实现紧急呼叫、在线娱乐、导航等多种功能。EMC测试就是为了确保在复杂电磁环境下,汽车的通信系统仍然可以正常工作,保护驾乘者的安全。参考《QCT-基于LTE-V2X直连通信的车载信息交互系统技术要求及试验方法-1》标准10.5电磁兼容试验方法,下面将会从整车功能层面为大家解读V2X整车电磁兼容试验的过程。测试过程揭秘1. 设备准备为了进行电磁兼容试验,技
    北汇信息 2025-01-09 11:24 150浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦