Figure突破性进展:机器人VLA模型Helix发布!

原创 汽车电子设计 2025-02-23 08:17
芝能科技出品


2025年2月21日,美国人形机器人初创公司Figure发布了其突破性进展——Helix,一个创新的视觉-语言-动作(VLA)模型,旨在推进机器人技术的广泛应用,尤其是在家庭环境中的普适性。


Helix将视觉感知、语言理解与动作控制深度融合,为人形机器人赋予了前所未有的高频精细控制能力,尤其是在两台机器人协同工作时。


相比传统技术,Helix能够实现低功耗、无需任务特定调整的通用行为控制,且大幅降低了对专家编程的依赖。


此外,通过独特的“双系统”架构,Helix突破了现有机器人系统在速度和泛化能力上的瓶颈,标志着具身智能技术的新纪元。



01

Helix的技术创新:

机器人智能的革命


Helix模型的核心突破在于其对“系统1+系统2”架构的采用,在机器人领域尚属首次。


● Helix将机器人操作分为两大系统:


◎ 系统1(S1):这是一个高频的视觉运动策略,运行速度达到200Hz,能够精准快速地将从系统2中获取的语义信息转化为精细的机器人动作。


S1主要负责机器人实时的控制与反应,确保机器人在执行任务时可以根据不断变化的环境进行快速调整,尤其是在协作任务中,它能够快速适应合作机器人的动作变化,保证任务的高效完成。


◎ 系统2(S2):这是一个基于大规模预训练的视觉-语言模型(VLM),以较低的频率(7-9Hz)运行,主要负责理解场景、语言解析和高层目标设定。S2为机器人提供宏观的语义信息,帮助机器人做出决策。



这两者的解耦架构允许每个系统按照其最佳节奏运作,从而克服了传统机器人系统在速度和泛化能力之间的权衡。


系统1负责即时反应,系统2则负责深度思考和决策,二者协作无缝衔接,极大提升了机器人执行任务的灵活性与精确度。


芝能点评:这个系统和之前我们看到在智能驾驶的方面是一致的。



● 多机器人协作的突破


Helix的另一项创新是支持多台机器人协同工作。在过去,机器人协作通常需要复杂的协调机制和任务分配,而Helix模型的出现,使得两台机器人可以在同一任务中通过共享一个模型协同工作。


这种能力不仅限于简单的操作,还包括更复杂的物体抓取与传递任务。例如,两个机器人可以互相传递物品,或共同完成需要多台机器人的协作任务,这在过去是难以想象的。


Helix的多机器人协作能力为未来机器人集群的应用奠定了基础,尤其是在家庭环境中,多个机器人可以根据任务需求灵活分工,协同完成复杂的家务任务,极大提高了机器人的实际应用价值。


Helix的另一项显著进展是其对抓取任务的能力提升,搭载Helix的Figure机器人可以通过自然语言指令,抓取各种从未见过的小型物品。


这个能力的实现,打破了传统机器人仅能处理已知物品的局限,使得机器人能够在更加复杂和动态的家庭环境中执行任务。


通过自然语言指令,机器人无需事先学习特定的物品识别或抓取动作,而是能够实时地根据环境变化做出灵活反应,这为机器人在开放环境中的应用提供了极大的便利。


02

Helix的应用前景:

具身智能的商业化时代


随着Helix的发布,Figure不仅在技术上取得了重要突破,也在商业化进程中迈出了坚实的步伐。


Helix的低功耗、高效能和无需任务微调的特性,使其能够在较低的门槛下实现商业化部署。其微型化设计使得Helix可以在嵌入式低功耗GPU上运行,适用于多种应用场景,包括家庭、办公和工业环境。



家庭环境一直是机器人技术的最大挑战之一。相比受控的工业环境,家庭中的物品形态不一,空间布局千变万化,机器人的任务复杂度也更高。


Helix能够根据自然语言指令执行任务,显著提升了机器人的适应性和灵活性,使其在家庭环境中的应用前景广阔。例如,机器人可以帮助家庭成员清理房间、整理杂物,甚至完成如烹饪等更复杂的任务。这种灵活的执行能力,使得Helix有可能成为家居自动化的核心驱动力。



Helix的另一大优势是其低成本的商业化潜力。Helix模型的训练只需少量高质量数据,并且通过一次训练即可实现高度泛化,避免了传统机器人技术中需要大量人工干预的繁琐过程。


这使得Helix不仅在技术上具有竞争力,也在成本上具有显著优势。Figure表示,Helix可以在低功耗GPU上运行,这为其大规模部署提供了可能。


未来,随着技术的不断进步,Helix有望在更多商业化场景中得到应用,从而推动机器人产业的快速发展。


根据Figure的计划,未来四年内,公司将量产10万台人形机器人,标志着其从实验室技术走向日常生活的商业化应用。


如果这个目标的真的实现,意味着Helix将成为具身智能领域的代表性技术之一,对家庭、医疗、安保等多个行业产生深远影响。


随着技术的不断完善,机器人不仅能够完成重复性工作,还将逐步具备处理复杂、动态任务的能力,改变我们对家庭生活和工作环境的认知。



小结



Figure的Helix模型无疑是机器人技术的重大突破,在技术层面解决了机器人在速度、精度、泛化能力等方面的瓶颈,还在商业化路径上展现出了巨大的潜力。

未来我们将看到更多智能机器人走入家庭和企业,承担起更多样化的任务,我们将持续观察。

汽车电子设计 本公众号是博主和汽车电子的行业的工程师们一起交流、探讨、思考的小结,以作为技术交流和沟通的桥梁
评论 (0)
  • 在智能终端设备开发中,语音芯片与功放电路的配合直接影响音质表现。广州唯创电子的WTN6、WT588F等系列芯片虽功能强大,但若硬件设计不当,可能导致输出声音模糊、杂音明显。本文将以WTN6与WT588F系列为例,解析音质劣化的常见原因及解决方法,帮助开发者实现清晰纯净的语音输出。一、声音不清晰的典型表现与核心原因当语音芯片输出的音频信号存在以下问题时,需针对性排查:背景杂音:持续的“沙沙”声或高频啸叫,通常由信号干扰或滤波不足导致。语音失真:声音断断续续或含混不清,可能与信号幅度不匹配或功放参数
    广州唯创电子 2025-03-25 09:32 66浏览
  • 在智慧城市领域中,当一个智慧路灯项目因信号盲区而被迫增设数百个网关时,当一个传感器网络因入网设备数量爆增而导致系统通信失效时,当一个智慧交通系统因基站故障而导致交通瘫痪时,星型网络拓扑与蜂窝网络拓扑在构建广覆盖与高节点数物联网网络时的局限性便愈发凸显,行业内亟需一种更高效、可靠与稳定的组网技术以满足构建智慧城市海量IoT网络节点的需求。星型网络的无线信号覆盖范围高度依赖网关的部署密度,同时单一网关的承载设备数量有限,难以支撑海量IoT网络节点的城市物联系统;而蜂窝网络的无线信号覆盖范围同样高度依
    华普微HOPERF 2025-03-24 17:00 177浏览
  • 核心板简介创龙科技 SOM-TL3562 是一款基于瑞芯微 RK3562J/RK3562 处理器设计的四核 ARM C ortex-A53 + 单核 ARM Cortex-M0 全国产工业核心板,主频高达 2.0GHz。核心板 CPU、R OM、RAM、电源、晶振等所有元器件均采用国产工业级方案,国产化率 100%。核心板通过 LCC 邮票孔 + LGA 封装连接方式引出 MAC、GMAC、PCIe 2.1、USB3.0、 CAN、UART、SPI、MIPI CSI、MIPI
    Tronlong 2025-03-24 09:59 184浏览
  • WT588F02B是广州唯创电子推出的一款高性能语音芯片,广泛应用于智能家电、安防设备、玩具等领域。然而,在实际开发中,用户可能会遇到烧录失败的问题,导致项目进度受阻。本文将从下载连线、文件容量、线路长度三大核心因素出发,深入分析烧录失败的原因并提供系统化的解决方案。一、检查下载器与芯片的物理连接问题表现烧录时提示"连接超时"或"设备未响应",或烧录进度条卡顿后报错。原因解析接口错位:WT588F02B采用SPI/UART双模通信,若下载器引脚定义与芯片引脚未严格对应(如TXD/RXD交叉错误)
    广州唯创电子 2025-03-26 09:05 77浏览
  • 无论你是刚步入职场的新人,还是已经有几年经验的职场老手,培养领导力都是职业发展中一个至关重要的环节。拥有良好的领导能力不仅能让你从人群中脱颖而出,也能让你在团队中成为一个值得信赖、富有影响力的核心成员。什么是领导力?领导力并不仅仅意味着“当老板”或者“发号施令”。它更多地是一种能够影响他人、激发团队潜能,并带领大家实现目标的能力。一位优秀的领导者需要具备清晰的沟通能力、解决问题的能力,以及对人心的深刻理解。他们知道如何激励人心,如何在压力下保持冷静,并能在关键时刻做出正确的决策。如何培养领导力?
    优思学院 2025-03-23 12:24 94浏览
  • 人形机器人产业节奏预估:2024年原型机元年,2025年小规模量产元年。当宇树科技H1人形机器人以灵动的手部动作在春晚舞台上演创意融合舞蹈《秧Bot》,舞出"中国智造"时,电视机前十几亿观众第一次深刻意识到:那个需要仰望波士顿动力的时代正在落幕。*图源:宇树科技短短数周后,宇树G1机器人又用一段丝滑的街舞在网络收割亿级播放量,钢铁之躯跳出赛博朋克的浪漫。2月11日,宇树科技在其京东官方旗舰店上架了两款人形机器人产品,型号分别为Unitree H1和G1。2月12日,9.9万元的G1人形机器人首批
    艾迈斯欧司朗 2025-03-22 21:05 137浏览
  • 在智能终端设备快速普及的当下,语音交互已成为提升用户体验的关键功能。广州唯创电子推出的WT3000T8语音合成芯片,凭借其卓越的语音处理能力、灵活的控制模式及超低功耗设计,成为工业控制、商业终端、公共服务等领域的理想选择。本文将从技术特性、场景适配及成本优势三方面,解析其如何助力行业智能化转型。一、核心技术优势:精准、稳定、易集成1. 高品质语音输出,适配复杂环境音频性能:支持8kbps~320kbps宽范围比特率,兼容MP3/WAV格式,音质清晰自然,无机械感。大容量存储:内置Flash最大支
    广州唯创电子 2025-03-24 09:08 192浏览
  • 在人工智能与物联网技术蓬勃发展的今天,语音交互已成为智能设备的重要功能。广州唯创电子推出的WT3000T8语音合成芯片凭借其高性能、低功耗和灵活的控制方式,广泛应用于智能家居、工业设备、公共服务终端等领域。本文将从功能特点、调用方法及实际应用场景入手,深入解析这款芯片的核心技术。一、WT3000T8芯片的核心功能WT3000T8是一款基于UART通信的语音合成芯片,支持中文、英文及多语种混合文本的实时合成。其核心优势包括:高兼容性:支持GB2312/GBK/BIG5/UNICODE编码,适应不同
    广州唯创电子 2025-03-24 08:42 158浏览
  •       知识产权保护对工程师的双向影响      正向的激励,保护了工程师的创新成果与权益,给企业带来了知识产权方面的收益,企业的创新和发明大都是工程师的劳动成果,他们的职务发明应当受到奖励和保护,是企业发展的重要源泉。专利同时也成了工程师职称评定的指标之一,专利体现了工程师的创新能力,在求职、竞聘技术岗位或参与重大项目时,专利证书能显著增强个人竞争力。专利将工程师的创意转化为受法律保护的“无形资产”,避免技术成果被他人抄袭或无偿使
    广州铁金刚 2025-03-25 11:48 128浏览
  • 在嵌入式语音系统的开发过程中,广州唯创电子推出的WT588系列语音芯片凭借其优异的音质表现和灵活的编程特性,广泛应用于智能终端、工业控制、消费电子等领域。作为该系列芯片的关键状态指示信号,BUSY引脚的设计处理直接影响着系统交互的可靠性和功能拓展性。本文将从电路原理、应用场景、设计策略三个维度,深入解析BUSY引脚的技术特性及其工程实践要点。一、BUSY引脚工作原理与信号特性1.1 电气参数电平标准:输出3.3V TTL电平(与VDD同源)驱动能力:典型值±8mA(可直接驱动LED)响应延迟:语
    广州唯创电子 2025-03-26 09:26 78浏览
  •        当今社会已经步入了知识经济的时代,信息大爆炸,新鲜事物层出不穷,科技发展更是一日千里。知识经济时代以知识为核心生产要素,通过创新驱动和人力资本的高效运转推动社会经济发展。知识产权(IP)应运而生,成为了知识经济时代竞争的核心要素,知识产权(Intellectual Property,IP)是指法律赋予人们对‌智力创造成果和商业标识等无形财产‌所享有的专有权利。其核心目的是通过保护创新和创意,激励技术进步、文化繁荣和公平竞争,同时平衡公共利益与
    广州铁金刚 2025-03-24 10:46 75浏览
  • 文/Leon编辑/cc孙聪颖‍“无AI,不家电”的浪潮,正在席卷整个家电行业。中国家电及消费电子博览会(AWE2025)期间,几乎所有的企业,都展出了搭载最新AI大模型的产品,从电视、洗衣机、冰箱等黑白电,到扫地机器人、双足机器人,AI渗透率之高令人惊喜。此番景象,不仅让人思考:AI对于家电的真正意义是什么,具体体现在哪些方面?作为全球家电巨头,海信给出了颇有大智慧的答案:AI化繁为简,将复杂留给技术、把简单还给生活,是海信对于AI 家电的终极答案。在AWE上,海信发布了一系列世俱杯新品,发力家
    华尔街科技眼 2025-03-23 20:46 78浏览
我要评论
0
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦