与此同时,人形机器人作为另一个前沿领域正在受到越来越多的关注。人形机器人不仅可以应用于制造业、服务业等多个行业,还可能改变个人生活、家庭服务以及特殊环境作业等诸多方面,尤其是在劳动力短缺、老龄化社会趋势下,市场需求将进一步增大,可能成为继新能源汽车之后的又一个万亿级市场。
本田ASIMO(Advanced Step Innovative Mobility,高级步行创新移动机器人)最早源于1986年,之后经过多次迭代,一直到2018年,本田停止了ASIMO机器人项目,不再迭代改进ASIMO人形机器人。ASIMO的外观科幻灵动,运动技能多样,诸如奔跑、倒行、跳跃、踢足球等等,视觉和听觉传感器的运用,使其能够同时识别颜色及区分多人的声音,并且可以由各种传感器输入的信息进行综合判断,推测周围状况,以决定机器人的对应行动。
波士顿动力公司的Atlas人形机器人堪称世界上最具活力的人形机器,自2013年亮相以来,每次发布新的成果视频必然能获得焦点,Atlas 的先进控制算法使机器人能够在考虑环境的同时规划复杂的全身运动,运动速度最高达到2.5米/秒, Atlas 使用钛和铝的混合物 3D 打印部件,并通过紧凑的液压系统提供高功率,使其具有跳跃和翻筋斗所需的强度重量比。
2021年,人形机器人Ameca诞生,Ameca 是一个逼真的类人机器人,由英国Engineered Arts 公司研发,通过对真人的 3D 内部扫描,可以准确地模仿人体骨骼结构、皮肤纹理和表情。更为创新的是最新版本接入了ChatGPT4,可以在聊天过程中分析你的表情,并通过在线语音合成技术,模仿人的音色,以类似真人的声音实现实时问答的效果。
2023年3月,硅谷的一家新兴企业Figure推出了其创新产品——Figure 01机器人,该机器人集成了OpenAI的强大视觉语言模型(VLM),标志着机器人技术的新里程碑。通过OpenAI模型的支持,Figure 01获得了前所未有的视觉理解和语言交流能力,不仅能与用户进行无缝沟通,响应复杂的口头指示,还实现了物体的精准抓取与放置,并可阐释其行为逻辑。此外,这款机器人采用的先进神经网络系统确保了其动作的高速与细腻,模仿人类的敏捷与流畅,展现了机器人技术向更高拟人化水平的迈进。
特斯拉在2023年12月发布了其人形机器人Optimus Gen-2,特斯拉自研的执行器和传感器拥有11自由度的全新手部以及全身42自由度的运动结构,作为一家人工智能技术主导的公司,其在自动驾驶领域的技术积累可以直接运用在人形机器人上面,特斯拉车辆利用纯视觉识别物体,创建向量空间,通过深度学习实现感知任务,而Optimus也具备这种能力,通过头部三个方位的摄像头进行识别,定位物体位置并理解周围世界。
1、第一阶段:仿生控制人形机器人。
这一阶段主要聚焦于人形机器人的结构设计优化与运动控制技术的进步。本田ASIMO是这一阶段的代表性作品,它展现了较为成熟的双足行走技术、平衡控制以及相对复杂的环境感知和交互能力。波士顿动力公司的Atlas机器人同样属于此阶段,通过液压和电动驱动系统实现了更为灵活和动态的运动表现,包括奔跑、跳跃、摔倒恢复等多种高级动作。
2、第二阶段:智能人形机器人时代。
这一阶段的发展重点转向了人形机器人在人工智能和计算能力方面的突破,尤其是强化学习、感知决策和自主思考能力的提升。特斯拉Optimus被视为此阶段的典型代表,致力于将强大的AI算法、大模型和高性能计算硬件整合到人形机器人中,旨在使其具备更广泛的任务处理能力,例如自主执行生产线任务、协助日常生活以及其他需要更高智能水平的工作。这一阶段不仅追求更高的动态运动性能,而且更加注重机器人的智能水平和应用场景的扩展。
来源:焉知人形机器人
人形机器人作为集多种高新技术于一体的复杂系统,其技术组成涉及到机械电子、材料科学、自动控制、计算机科学、人工智能等多个学科领域。以下是人形机器人技术组成的关键要素:
2、 传感器与感知系统
感知系统是人形机器人与外界交互的基础,包括视觉、听觉、触觉等多种传感器。高清摄像头和深度传感器赋予机器人视觉,使其能够识别环境、物体及人脸,进行三维重建和避障导航。麦克风阵列和语音识别技术使机器人能够理解人类语音指令,实现自然语言交互。同时,力传感器、触觉传感器分布在关节和手掌,让机器人能够感知接触力,实现精细操作和安全互动。
3、 运动控制与驱动技术
运动控制技术是人形机器人实现平稳、准确运动的核心。它依赖于复杂的算法,如逆运动学、轨迹规划、力控制等,来协调各个关节的动作,模拟生物肌肉和神经系统的工作原理。高精度的伺服控制系统负责执行这些算法,实时调整电机的转速和扭矩,保证动作的连贯性和稳定性。波士顿动力Atlas 人形机器人控制器的核心是一种称为模型预测控制 (MPC) 的技术,使用该模型来预测机器人的状态在短时间内将如何演变,以确定将来可以采取的可能动作。此外,能量管理技术,包括高效的电机设计和大容量电池系统,是支持长时间自主运行的关键。
4、人工智能与决策系统
人形机器人的人工智能大脑是其智慧的源泉。通过深度学习、强化学习等先进算法,机器人能够学习和理解环境、预测行为后果,并做出决策。大模型技术如OpenAI的GPT系列或DALL-E,为机器人提供了强大的语言理解和生成能力,以及视觉场景理解能力。同时,情境感知和情感计算技术使得机器人能够更好地理解人类情感和需求,进行更自然的情感交流和个性化的服务。
5、软件与系统集成
软件平台是整合所有硬件和技术的关键,包括操作系统、中间件、应用软件等。人形机器人通常运行在定制的操作系统之上,该系统负责调度硬件资源、管理传感器数据流、运行各类应用程序。此外,为了便于编程和二次开发,机器人还需配备易用的编程接口和软件开发工具包(SDK),允许开发者为机器人设计特定的行为逻辑和应用程序。
人形机器人的技术组成是一个多学科交叉的综合体,每一部分都不可或缺,共同推动着机器人向更加智能化、人性化方向发展。随着技术的不断进步,未来的人形机器人将更加适应复杂多变的环境,更好地服务于人类社会的各个领域。
人形机器人,作为现代科技的结晶,正逐步渗透至我们生活的方方面面,其多样化的应用场景不仅预示着技术进步的无限可能,也映射出社会需求的深刻变迁。
首先,从服务行业的角度来看,人形机器人正逐步成为提高服务质量、增强客户体验的新宠。
在酒店与餐饮业,它们扮演着迎宾员的角色,以其亲切的外观与高效的交互能力,为顾客提供入住引导、信息咨询乃至个性化服务,如根据顾客偏好推荐餐厅和房间。在商场与购物中心,它们担任导购,利用内置的地图与商品数据库,带领顾客直达目标店铺,甚至参与商品展示与促销活动。此外,在医疗保健领域,人形机器人凭借其精准的运动控制与智能识别技术,辅助医护人员进行日常查房、病人监护、甚至是执行一些精密的护理操作,减轻医护人员负担的同时,提升了医疗服务的安全性和效率。特别是在老龄化社会背景下,它们还能够成为老年人的贴心伴侣,进行健康监测、情感陪伴以及紧急情况下的求助报警,为银发经济带来新的解决方案。
其次,在工业与公共安全领域,人形机器人以其独特优势开辟了全新的应用空间。
例如2024年,Agility Robotics研发的Digit人形机器人,是专为仓储搬运领域而设计。在高度自动化的生产线上,人形机器人能够执行精确度要求高的组装、检测、甚至危险环境下的作业,比如在核能设施、化工厂进行检查维护,有效避免了人员直接暴露于有害环境中的风险。在应急救援方面,无论是地震废墟下的搜救,还是火灾现场的信息侦察,人形机器人凭借其坚固的结构与环境适应能力,能在人类难以到达或极度危险的环境中执行任务,保障救援人员安全的同时提高救援效率。此外,它们在公共服务领域的应用也日益广泛,如在大型活动中担任安全巡逻、人群管理的角色,或是作为警察的辅助力量,在特定情况下执行执法任务,减少人为错误与冲突。
随着人工智能、机器人学、材料科学等技术的持续进步,人形机器人的应用边界将持续拓展,未来它们将在更多未曾设想的领域中发挥不可替代的作用,深刻影响人类社会的结构与运行方式。