近年来,“智能机器人”的概念十分火爆,究竟什么样的机器人才能被称为“智能”?根据我国GB/T 39405-2020标准,“智能机器人”被定义为在机器人基础上,具备更强的感知、学习能力和自主能力,能够适应更复杂的环境和任务需求。
按照我国标准,机器人主要分为三类:
- 工业机器人,主要功能包括搬运、上下料、焊接、喷涂、加工、装配、洁净等;
- 服务机器人,又分为个人 /家庭服务机器人和公共服务机器人,前者主要功能包括家务、教育、娱乐、养老、助残等,后者主要功能包括餐饮、讲解导引、多媒体、公共游乐等;
- 特种机器人,主要功能包括检查维修、搜救、巡检、侦察、排爆、安装、采掘、运输、手术、康复等。
其中,服务机器人以其应用场景的复杂性、与人交互的密切性和市场潜力的巨大性,对智能化升级的需求尤为迫切。
中国服务机器人市场目前还处在起步阶段,但市场增速明显,预计未来几年将继续保持快速增长。服务机器人的应用场景从2018年的金融、农业、医疗等领域,扩展到了2023年的酒店/旅行、餐厅等,不过目前仍只搭载在一些标准化程度较高的场景。
过去八年(2017-2023)服务机器人市场快速增长(资料来源:IFR,TE研究院)
在探索服务机器人的未来时,我们往往会问:它们是简单的"工具"还是真正的"智慧"伙伴?
随着人工智能和机器人技术的发展,服务机器人正逐渐从执行简单任务的机器转变为能够理解和适应复杂环境的智能体,在所有机器人类别中,最有希望、也最有必要从“智障机器人”晋级为“智能机器人”。
在5月17日举行的第十四届松山湖中国IC创新高峰论坛上,举行了一场主题为《“智障”机器人还是“智慧”机器人?》的圆桌论坛,来自不同领域的行业专家共同探讨了智能机器人的现状与未来。
由左至右依次为:
主持人:中国半导体行业协会IC设计分会副理事长、芯原股份创始人、董事长兼总裁 戴伟民
圆桌嘉宾:
瑞芯微电子股份有限公司副总裁 陈锋先生
成都启英泰伦科技有限公司创始人、CEO 何云鹏先生
深圳市亿境虚拟现实技术有限公司总经理 石庆先生
鹏瞰科技(上海)有限公司产品市场副总裁 王伟先生
乌镇智库理事长 张晓东先生
小米生态链研发总监 张秀云女士
神顶科技(南京)有限公司董事长、CEO 袁帝文先生
回顾2018年时,服务机器人主要应用场景是金融、农业、医疗、仓储物流、家庭陪伴等。而5年后的2023年,服务机器人主要应用场景依然是金融、农业、医疗、仓储物流、酒店/旅行、餐厅等。有没有什么技术,能让服务机器人实现应用场景的突破?
戴伟民在开场时指出,2023年ChatGPT的横空降世,让智能机器人从单一功能的“智障”迈入了强智时代,它们在感知、学习、自主能力方面与传统机器人不同,能够适应更复杂的环境和任务需求。本次圆桌以服务机器人为焦点,特别关注中国市场的迅猛增长与潜能。
问题一:云端大脑,理想还是幻想?
戴伟民提出了一个核心问题:利用5G技术,将服务机器人的“大脑”全放在云上是否可行?
陈锋认为服务机器人的大脑不能完全依赖云端。因为服务机器人需要实时从A点到B点移动,或是对周围环境感知后做出实时反应,网络中断将无法确保服务,本地智能不可或缺。“由于存在断网等风险,本地智能和算力不可或缺。”
张晓东也同意这一观点,但从计算机发展历程的角度,他认为“从集中式到分布式是一个趋势,未来云端与边缘计算的民主化可能使得问题有新转机。”暗示了云端大脑的潜在可能性。
专家们普遍认为,一方面,云端大脑可以提供强大的计算能力和存储空间;另一方面,网络的不稳定性可能成为其发展的瓶颈。尽管云端大脑有其优势,但本地智能和算力的结合将为服务机器人提供更为稳定和灵活的解决方案。
问题二:未来三年,哪些服务机器人将走进千家万户?
清洁机器人是当前应用范围最广、量最大的服务机器人,除此之外,服务机器人最有希望在哪些领域实现大面积采用?
戴伟民展望了服务机器人的市场前景,特别提到儿童教育陪伴和老人看护陪伴机器人的重要性。他认为,这些机器人将成为家庭中不可或缺的成员,提供情感和生活上的支持。
谈及未来三年内可量产的消费类服务机器人,戴伟民强调AI玩伴的潜力,特别是在儿童教育方面,“三岁看大,七岁看老,早期教育是养成学习习惯的黄金时期”,AI玩伴机器人不仅能够成为孩子的好伙伴,还能通过数据分析帮助家长更好地了解和培养孩子。
同时,他提及烹饪、老人照护、康复机器人以及娱乐机器人的市场需求,指出综合功能的机器人具有广阔空间。
问题三:大模型驱动,智慧机器人的催化剂?
智能机器人的演进可以分为几个阶段,从完全依赖人为操纵的L0级无智能到完全替代人类的L4级超级智能。目前,大多数服务机器人处于L1至L3级之间,其中:
- L1:基础智能,具有一定的自主学习能力,但决策能力有限。
- L2:中等智能,具有较高的自主学习能力,但在关键时刻仍需要人类干预。
- L3:高度智能,具有很强的自主学习和决策能力,但无法持续自学、自优化,在某些情况下仍需要人类辅助。
随着技术的进步,智能机器人未来将朝着更高级别的智能化发展,达到L4级别——超级智能,具有极高的自主学习和决策能力,能在极端复杂的环境下执行任务,完全替代人类。
大模型的引入为机器人产业带来了革命性的变化。从RNN、LSTM到Transformer,再到BERT、GPT等大模型的成功应用,自然语言处理技术的进步为服务机器人的理解能力和交互体验带来了质的飞跃。专家们预测,大模型驱动的机器人将在不久的将来面市,为人类生活带来更多便利。
与无差异化的多模态大模型相比,以语言为基础的多模态大模型会成为主流。自然语言处理的进步,总共经历了五次范式变迁:
- 1950-1990年:小规模专家知识。
- 1990-2010年:浅层机器学习算法。
- 2010-2017年:深度学习算法。
- 2018-2023年:预训练语言模型。
- 2023年至今:ChatGPT。
大模型的发展脉络可概括为以下几个阶段:
- 早期阶段:循环神经网络(RNN)及其变种长短期记忆(LSTM)曾是处理序列数据的主要方法。
- 转型关键年:2017年成为转折点,Google Brain团队推出了Transformer模型,引入注意力机制(self-attention),有效解决了RNN序列处理的局限性,迅速成为自然语言处理(NLP)领域的主流模型。
- Transformer的崛起:随后,诸如BERT和GPT等大模型的出现进一步验证了Transformer架构的灵活性和强大性能,它们不仅在机器翻译、时间序列预测等多种NLP任务上取得显著成果,还推动了预训练和微调范式的普及。
- 规模竞赛:进入2021年,模型规模不断膨胀,谷歌发布的Switch Transformer标志着业界迈入万亿参数时代,展现了对大规模计算资源和更高效架构的需求。
- 交互式AI的新篇章:2022年11月,OpenAI推出的ChatGPT,作为一款基于先进AI技术的自然语言处理工具,革新了人机交互体验,展示了AI在对话理解和生成方面的巨大潜力。
这一系列进展背后,不仅是技术迭代的体现,也映射出Google Brain、OpenAI、Google、NVIDIA、Microsoft等科技巨头在推动人工智能前沿发展中的积极作用和激烈竞争。
在第十三届芯原CEO论坛上,专家们曾预测,到2028年,用于端侧微调卡和推理卡的销售额将超过用于云侧的训练卡。这意味着在“树根”(算力)、“树干”(通用大模型、训练卡)发展完备后,“树枝”(垂域大模型、微调卡)和“树叶”(应用、推理卡)将会在近几年开枝散叶。
在本次圆桌论坛上,嘉宾和现场观众们也普遍认为,大模型驱动的机器人将在3年内面世。而事实上,近期已经有类似产品出现,例如杭州宇树科技发布的Unitree G1人形智能机器人搭载了UnifoLM(Unitree机器人统一大模型),这是一个强大的AI技术平台,能够赋予机器人自我学习和迭代升级的能力。UnifoLM作为G1的核心驱动力之一,不仅提升了机器人的智能化水平,还为人形机器人的应用开发提供了共创平台,促进了智能体技术的发展与创新。
何云鹏认为,大模型对于服务机器人来说非常重要,特别是对于需要理解世界知识的通用服务机器人。但对于特定任务,可能不需要那么大的模型参数。我们应该基于应用需求,结合传统AI算法,来解决特定问题。
张晓东言简意赅地表达了他对大模型的看法:“有大模型即智慧,无大模型即智障”。他认为,大模型的出现极大地推动了智能的发展,并且大模型小型化、下沉到终端的趋势将使得大模型更加普及,如今的AI手机、AI PC就是最好的例证。
问题四:人形机器人,未来还是过去?
人形机器人作为具身智能的典型代表,其发展受到了业界的广泛关注。英伟达CEO黄仁勋在多个场合强调了具身智能的重要性,并预测人形机器人将成为未来主流产品,例如在ITF World 2023上,他指出,具身智能是人工智能的下一个浪潮,这种智能系统能够理解、推理并与物理世界互动。
在GTC AI大会上,英伟达发布了人形机器人的模型和芯片,称之为“英伟达的灵魂”。黄仁勋预测,人形机器人的制造成本将远低于人们的预期,使其成为大众化的产品。
最好的例子就是上文提到的宇树科技Unitree G1人形智能机器人,发布于今年5月,售价9.9万元人民币起。资料显示,宇树科技专注于消费级、行业级高性能通用足式/人形机器人及灵巧机械臂的自主研发、生产和销售。曾受邀参加2021央视春晚、2022冬奥会开幕式、2023 Super Bowl赛前表演、2023杭州亚运会和亚残运会等。他们还是全球首家公开零售高性能四足机器人、并最早实现行业落地的公司,全球销量历年领先。
多方对人形机器人未来发展的看好,让它逐渐成为服务机器人市场的新宠。那么问题来了,服务机器人是否一定要做成人形形态?
“所有研究人形机器人的从业者都有一个共同的观点——人是最高效的机体,但是我的观点比较极端,我认为人(形机体)是不如其他生物的能力强的。”一个最简单的例子,爬壁时人形机体(两手两脚)就没有蜘蛛形(8只脚)有效,张秀云认为,服务机器人不一定要人形,但人形机器人可提供更自然、更亲切的交互体验,可能因为共情和感情的原因,更容易被人类接受。
袁帝文补充说,人形机器人的发展与大模型的进步紧密相关,因为它们能够更好地模拟人类的活动和视角,在数据采集与人形机器人发展中扮演关键角色。他举了一个例子,2020年之前资本市场对于仿生(人形)机器人十分排斥,但在大模型出来之后,情况大大改变。
“现在人形机器人的发展,反而是大模型在推动。很多大模型公司都积极和人形机器人合作做数据采集。” 袁帝文认为,人已经可以做很多事情,所以机器人如何达到人的水平,要从人的视角做训练,“机器人行业需要这样的大模型。”
智能机器人的技术框架(来源:《智能机器人技术产业发展白皮书(2023版)》)
石庆也认为,服务机器人不一定要具备人形形态,但人形设计有助于机器人更好地融入人类社会和家庭环境。以马斯克近期发布的一段机器人影像为例,都是通过训练师戴着VR头盔做动作,机器人学习,“之所以用数字孪生的方式训练,就是希望机器人更像人,反之如果训练蜘蛛(形机器人),那么应用场景就不太适合家庭,亲密程度上会打折。”
问题五:光纤通信,让机器人反应更及时?
随着GPT、Transformer、文心一言等大模型飞速发展,让具身智能的典型代表“人形机器人”重回C位只是时间问题,不过我们也要看到需求提高带来的痛点:
- 超复杂电机控制:机器人关节数在30-50个以上
- 超多传感接入:机器人需要接入越来越多的传感器
- 灵巧外观设计:机器人朝向更加小型化发展,空间受限
- 带宽时延:以太网方案1G以上网络升级是一大挑战,时延、丢包率均较高
- 通信标准:多种协议并存、不统一
专家们认为,未来的服务机器人需要更高性能的MCU、更强大的NPU和更高效的通信网络。
图1:机器人常见的三张独立网络 图2:TS-PON 一网打通任督二脉
何云鹏指出,机器人所需要的芯片不是一款两款,而是一系列用于完成不同任务的芯片,甚至可能需要不同计算类型的芯片相互协同来完成组合任务。如果以人类的特点来类比机器人,就需要有大脑、四肢、小脑和感官神经末梢,机器人芯片从任务划分对人机进行交互。拿到目标任务之后,需要了解人的目的、意图,再把任务分解成子任务,进一步思考如何实施并指定规划。“任务分解属于大脑任务,分解之后会给到小脑来负责行动,这个行为和行动的控制就是机器姿态的控制、紧急避障等。”
“小脑芯片”或者说“神经元芯片”就相当于边缘计算芯片,低功耗设计对于这类芯片至关重要,将AI集成于传感器中,“感算一体”可以显著减少功耗,何云鹏说到,“不过中间还需要一些连接芯片把数据串联起来,因为感知是分布式的。”
王伟提出了一个创新的想法,使用光纤(TS-PON解决方案)作为机器人的通信网络。他认为,通过一根光纤承载所有电气总线业务,提供了一种高带宽、低时延、抗干扰的通信方式,有望成为服务机器人通信网络的升级方向。
王伟介绍了鹏瞰科技使用光纤通讯网络,替传统电缆的案例,成功解决了带宽、减轻重量与电磁干扰问题,据悉此技术已应用于先进人形机器人中。
人形机器人系统中的 TS-PON 网络
鹏瞰的TS-PON(时间敏感无源光网络)解决方案优势包括:
- 带宽/时延:当前单纤10G,即将50G;时延µs级别,不存在数据丢包、不存在EMI/EMC干扰。
- 超高性能MCU:充分发挥AI高性能处理器和高级传感器的性能,有效提升柔性控制能力。
- 一张光网:一根光纤承揽所有电气总线业务,并可支撑高达128个节点,布线非常简洁。
- 多协议融合网络:灵活适配不同硬件接口与协议栈,统一标准,整合资源,突破碎片化瓶颈。
面对新兴的工业需求,如自动驾驶、柔性生产和高精度机器人技术的迅速发展,对工业网络提出了更高的要求,特别是在高带宽、低延迟及强抗干扰能力方面,以支持日益增长的传感器数量和增强的AI处理能力。传统基于铜线的工业网络技术已逐渐难以满足这些新标准,构成了行业发展的“卡脖子”问题。
在此背景下,鹏瞰TS-PON通感控一体化芯片,利用光通信的优势替代传统方案,满足车企、机器人制造商等对高速、低时延连接的迫切需求。随着国内芯片制造工艺达到14nm乃至更先进,开发更高性能的SoC已经指日可待。
鹏瞰TS-PON通感控一体化SoC芯片架构示意图
这些SoC芯片集成了多种功能,不仅提高了工业互联网的性能指标,包括精确度、处理能力和能效,还通过高度集成化设计降低了成本与复杂度,从而为工业网络的全面升级提供了关键技术支撑,彻底解决“卡脖子”难题,推动产业升级。
亿道这几年也关注AR/VR赛道,与机器人行业有着较高的契合度。石庆认为,光纤通信在机器人的通信网络中有巨大的潜力。它可以解决机器人关节间的通信问题,具有抗干扰和高带宽的优势。
结语
服务机器人的未来充满了无限可能。从云端大脑到大模型驱动,从人形设计到终端芯片和光纤通信的创新,每一步的发展都是对"智慧"定义的重新思考。随着大模型和AI技术的不断进步,终端设备需要更高性能的芯片来处理复杂的任务。这包括自然交互、任务分解、行为规划和感知处理等多个方面。
通过这次圆桌论坛,我们可以看到服务机器人行业正站在一个新的起点上。戴伟民表示,我们有理由相信,服务机器人将不再是简单的工具,而是能够真正理解和服务于人类需求的智能伙伴。
在这场从"智障"到"智慧"的跨越中,我们期待服务机器人能够带来更多惊喜和可能。