影智科技唐沐:人形是累赘,具身智能并不缺少落地场景

原创 Alter聊科技 2024-12-19 21:05

影智科技创始人唐沐认为:具身智能在产品设计上应该解决特定需求,而非单纯追求形式上的“人形”。具身智能的真正价值,在于以具体问题为导向,让机器人能够灵活适应环境、精准满足需求。

撰文张贺飞
编辑沈菲菲

马斯克、黄仁勋等人的站台,让具身智能迅速蹿升为2024年最受资本追捧的赛道之一。

复盘具身智能赛道过去一年融资事件,人形机器人是出现频率最高的词。或许是受《机械姬》、《西部世界》等科幻作品的影响,人们本能地认为具身智能应该拥有双手双脚、面部表情等设计。

但影智科技创始人唐沐对此并不认同:“具身智能在产品设计上应该解决特定需求,而非单纯追求形式上的’人形’。当前市场对人形机器人的追捧更多是概念化,而非实用主义。

作为QQ头像、微信表情包等现象级符号的缔造者,小米路由器、小爱智能音箱等亿级爆款产品的掌舵人,唐沐以其敏锐的洞察力和创新的产品思维,打造了一系列国民级产品。

与那些还处于实验室状态、“吊着威亚”展示的人形机器人不同,影智科技的xbot咖啡机器人已经是各种科技展会上的明星,每次体验机器人制作咖啡的观众都排起了长队。


具身智能为什么必须回归需求导向?这种理念为机器人带来了哪些颠覆性的改变?又有哪些成功落地的应用场景?带着这些问题,我和影智科技创始人唐沐进行了一场深度对话,尝试打破外界的刻板印象,找到通往具身智能正确答案。

01.
机器人的进化路径:
不是从“像人”开始,而是“更有用”

2023年走进大众视野的具身智能,正处于“八仙过海” 的时期,吸引了一大批用人形机器人求解具身智能的创业者。

而支撑他们投身人形机器人的动机,可能只是一场不确定的“风”:当马斯克开始做人形机器人之后,市场、资本机构都认为必须加快入场,不能等特斯拉真正做出来了大家再去追。

有着20多年产品经验的唐沐,并不苟同这种追风现象。

2003年,唐沐加入腾讯,着手组建了腾讯用户研究与体验设计中心(CDC),负责QQ、QQ电脑管家、QQ音乐、QQ空间等亿级用户的产品体验设计。外界所熟悉的QQ头像、微信表情包等均出自唐沐之手。

2013年,本着“做一款自己的产品”的想法,唐沐加入小米,历任智能产品部总经理、小米生态链副总裁,带领团队开创了小米路由器、小爱音箱两条亿级产品线,以及VR、AR、机器人等领域的技术探索。

多年后,唐沐离开小米创办了影智科技,天使投资人名单中不乏微信之父张小龙、小米联合创始人林斌、黎万强、黄江吉、洪锋等外界耳熟能详的人物。


影智科技的标杆产品,正是前面提到的xbot咖啡机器人。彼时,唐沐就意识到,机器人需要遵循技术的底层逻辑,在正确的时间做正确的事,而非奔着一个遥远的目标给投资人画饼。

这样的履历,让唐沐有足够的底气选择不盲目追风,坚持自己对具身智能趋势的理解和洞察。

当其他创业者为人形机器人枕戈待旦时,堪称“国内具身智能消费机器人第一人”的唐沐,没有沉溺于对人形机器人的空洞想象,理性地讲述了自己对机器人演进路径的独到见解:

X1阶段是工业机器人,强调动作的人工编排,用于工厂内的高度结构化任务;

X2阶段是消费机器人,结合人工与AI进行任务编排,比如学习咖啡师的技艺训练机器人的拉花技巧;

X3阶段是具身智能消费机器人,拥有视觉、听觉、触觉等多模态感知能力,可以基于用户的个性化信息,结合消费场景和用户进行深层次互动,进一步提升服务质量和灵活性;

最后一个阶段才是AGI机器人。


和人形机器人广泛而模糊的目标不同,唐沐认为:机器人的进化路径,不是从‘像人’开始,而是从‘更有用’出发。具身智能的真正价值,在于以具体问题为导向,让机器人能够灵活适应环境、精准满足需求,这才是技术发展的正确方向,就像让机器人做咖啡。

相比人形机器人在舞台上比心、跳舞等“炫技”,影智科技的xbot咖啡机器人让人记住的,是实打实的“新质生产力”:能够在75秒内复刻大师级的拉花咖啡技艺。


2021年举办的黑杯咖啡大师竞技赛上,xbot咖啡机器人和世界级拉花咖啡师同台竞技,并最终摘得了冠军。由于人类咖啡师的集体抗议,xbot咖啡机器人在第二年“被迫”当了评委。主办方先让xbot咖啡机器人做一杯拉花咖啡,然后让人类咖啡师还原,并根据完成度评分。

现在,xbot咖啡机器人已经不单单是效率上的降维打击,在大模型的赋能下重新定义了服务边界——从生产力工具跃升为兼具情感互动与个性化服务的咖啡智能体。

02.
具身智能的现实价值:
不是形态上像人,而是思维上像人

在星巴克的品牌故事里,有一个重要的理念是“将顾客作为朋友”,咖啡师熟悉每一位顾客的名字和喜好,甚至在顾客进门前就准备好了他们常点的饮品,以此给予顾客在家和工作之外的归属感。

但在中国市场,这种归属感早已输给了人效二字:被一杯杯订单忙到喘不过气的咖啡师们,很难有精力和顾客建立有感情的沟通。咖啡店拼的是出单量和运营效率,而非顾客的体验感。

在唐沐看来,这正是具身智能的现实价值。

“X2阶段的机器人已在效率上实现对人工的降维碾压,而大模型的多模态感知与认知推理能力,将重新定义咖啡消费,不仅赋予了咖啡人情味儿,还拓展出了全新的消费场景。”

影智科技自研的xbot咖啡大模型已经应用到三类消费场景中,完美诠释了唐沐的理念:


一是AIGC“烘托”的仪式感和氛围感。

除了大师级的拉花技艺,xbot咖啡大模型带来了独一无二的咖啡体验:顾客可以扫码上传自己感兴趣的照片,通过AIGC技术生成自己喜欢的图像风格,让咖啡机器人用焦糖在奶泡上打印出相应的图案。


一杯咖啡满足的不再只是“提神”的需求,也是一种社交资本:情人节给女朋友买一杯印有玫瑰花图案的咖啡,在景点打卡时咖啡上印有刚拍的风景……让喝咖啡更有仪式感,并激发出消费者的社交需求。

二是多模态感知能力带来的情感体验。

当顾客走到咖啡机器人前点单时,可以智能识别用户身份和口味偏好,自动切换到顾客喜欢的数字人形象,而且数字人会主动和顾客打招呼,并推荐顾客可能感兴趣的咖啡品类。


在用户允许的情况下,咖啡机器人甚至可以通过声音和表情实时感知顾客的情绪状态,比如顾客表现出疲倦或情绪低落时,建议顾客多加一些糖来保持好心情,或者调整咖啡因浓度帮助用户提神。

三是千人千面的消费需求和健康管理。

得益于xbot咖啡大模型的认知推理能力,基于顾客消费数据的个性化消费知识图谱,顾客只需要一个类似“做一杯热带风情”咖啡的指令,咖啡机器人能够自动创作出符合顾客需求的咖啡,让顾客的需求不再局限于已有的菜单,而且能够根据自己的想法个性化定制。


xbot咖啡大模型还能为顾客制定健康管理方案,比如了解到顾客连喝了三杯咖啡后,推荐喝一杯有利于健康的乌龙茶。

如果说人形机器人追求的是形态上像人,唐沐的理念是思维上像人,让具身智能机器人像人一样和顾客打招呼,像人一样关心顾客的情绪。

唐沐进一步解释称:“具身智能还没有终极的答案,不代表没有可以参考的路径,譬如十年前的自动驾驶,如果按照当时预期的终极目标,到现在也没有实现,但并不妨碍L2.5、L3级别的自动驾驶能力上车。具身智能从发展到成熟的过程中,也存在大量可落地的场景。

摆脱了“炫技”等表面追求的xbot咖啡机器人,可能不如人形机器人有话题性,却构建了更贴近消费场景的具身智能生态,打造出了更贴近当前社会需求高度契合的真实图景。

03.
遵循商业化常识:
人形可能会是累赘,优先解决高频刚需

对于具身智能的市场前景,外界有不少判断。

高盛曾预测称,在理想状态下,软硬件成本年均下降达到20%的话,人形机器人市场规模有望在2035年达到1540亿美元。

黄仁勋在媒体采访中坦言,“100年后大街上将到处都是人形机器人”,马斯克也在X上默契地回复,“人形机器人普及程度将是汽车10倍”。

面对具身智能的商业化问题,有别于动辄十年后、百年后的长远叙事,唐沐用一组掷地有声的真实数据给出了答案:

“目前xbot咖啡机器人在全球部署超过300台,包括博物馆、景区、商场、展会、图书馆等场所,两周前刚落地到70家万达影城。每台咖啡机器人日均制作的咖啡在200杯以上,最高的时候超过了350杯。仅在过去一个月,我们的营收已经超过2000万元。”

正在大规模量产的xbot咖啡机器人

唐沐对具身智能机器人的商业化构想,也随着xbot咖啡机器人的落地得到了充分验证。

比如在2023年成都大运会期间,成都的一家公司将xbot咖啡机器人“搬”到了大运会的运动员餐厅,24小时不间断运营。期间吸引了不少运动员拍照打卡,不乏意大利、巴西等对咖啡要求很高的国家的运动员。后台统计数据显示,xbot咖啡机器人在12天里做了4000多杯咖啡,主办方全程只安排了一个志愿者负责换料。


再比如北京首都图书馆的例子,在微博、小红书等社交媒体上,有不少人分享打卡首都图书馆的咖啡机器人,为机器人的拉花技能和个性化图案印花点赞。连唐沐都直言超出了预期:“一开始只是和首都图书馆联营合作,不小心成了图书馆的网红打卡点,每天运营10个小时,日均制作200多杯咖啡,只用4个月的时间就收回了成本。”

两个月前的国庆75周年庆典上,xbot咖啡机器人作为新质生产力的代表,出现在天安门景区,意料之中地成了新晋打卡点,每天都有不少游客排队体验。

咖啡机器人的商业化路径跑通后,唐沐并没有停下来。

除了直接销售咖啡机器人,影智科技正在全面发力机器人联营业务,探索咖啡服务之外的信息增值服务。围绕真实的场景需求,咖啡小站、无人快餐车等产品已经被排上日程,其中无人车快餐车上的机器人,可以制作咖啡、冰淇淋以及汉堡、沙拉等快餐。

被问及影智科技是否会进入更多场景、未来的边界在哪里时,唐沐的回答始终聚焦在场景化设计的理念:“所有的产品必须要在场景中设计,我们绝对不做臆想的,不会突然冒出一个idea就把它做出来。

站在行业的视角上看,整个具身智能赛道似乎还未到谈论商业化的时候,不断有创业者带着激情进场,资本也愿意为一个美好的愿景买单。但看似繁荣的热潮背后,潜在的困境也如影随形,倘若没有未雨绸缪的商业化审慎思考,过于夸大未来而忽略当下,最终留下的往往是一地鸡毛。

见证了多次潮起潮落的唐沐,本着对国民级产品的执着,认为具身智能创业应该遵循商业化常识:“具身智能不等于人形机器人,在许多场景中,人形设计可能过于复杂且不具备效率,甚至会成为累赘,创业者应该以具身智能为核心,优先解决高频刚需问题,不要盲目追求形式上的人形化。

04.
写在最后

2019年中国的人均咖啡消费不到5杯,2023年的时候已经增长到16.7杯,一线城市甚至达到了100多杯。等待xbot咖啡机器人的,是一个潜力无限的千亿级市场。

作为一个蓝海市场的开拓者,唐沐笃定地表示:“我们的产品不是跟着潮流走,而是要用实力去定义潮流的方向。这或许是我这种‘大龄创业者’的特质吧,不会被理想冲昏头脑,也不迷恋概念上的‘炫酷’, 解决现实需求才是直接打破行业规则的王道。”

具身智能的大幕才刚刚拉开,已经站在浪潮之巅的唐沐坚信,随着人形机器人热潮退去,行业将迎来一场回归:从形式到本质,从概念到落地,具身智能将重塑更多行业,创造出前所未有的价值。

往期推荐


01

“芯片围城”下国产AI要放缓?答案或截然相反

02

AutoGLM的一小步,人机交互进化的一大步



主理人 | 张贺飞(Alter)


前媒体人、公关,现专职科技自媒体


钛媒体、36kr、创业邦、福布斯中国等专栏作者


转载、商务、开白以及读者交流,请联系个人微信「imhefei」

Alter聊科技 探究产业兴衰,专注商业解读。
评论
  • 在强调可移植性(portable)的年代,人称「二合一笔电」的平板笔电便成为许多消费者趋之若鹜的3C产品。说到平板笔电,不论是其双向连接设计,面板与键盘底座可分离的独特功能,再加上兼具笔电模式、平板模式、翻转模式及帐篷模式等多种使用方式,让使用者在不同的使用情境下都能随意调整,轻巧灵活的便利性也为多数消费者提供了绝佳的使用体验。然而也正是这样的独特设计,潜藏着传统笔电供货商在产品设计上容易忽视的潜在风险。平板笔电Surface Pro 7+ 的各种使用模式。图片出处:Microsoft Comm
    百佳泰测试实验室 2024-12-19 17:40 72浏览
  • ​本文介绍PC电脑端运行VMware环境下,同时烧录固件检测不到设备的解决方法。触觉智能Purple Pi OH鸿蒙开发板演示,搭载了瑞芯微RK3566芯片,类树莓派设计,Laval官方社区主荐,已适配全新OpenHarmony5.0 Release系统!PC端烧录固件时提示没有发现设备按照各型号烧录手册中进入loader模式的操作方法,让开发板连接到PC端。正常来说开发板烧录时会显示“发现一个LOADER设备”,异常情况下,会提示“没有发现设备”,如下图所示: 解决步骤当在烧录系统固
    Industio_触觉智能 2024-12-18 18:07 54浏览
  • 以人形机器人和通用人工智能为代表的新技术、新产品、新业态蓬勃发展,正成为全球科技创新的制高点与未来产业的新赛道。01、Optimus-Gen 2来了,人形机器人管家还远吗?没有一点点防备,特斯拉人形机器人Optimus-Gen 2来了!12月13日,马斯克于社交媒体上公布了特斯拉第二代人形机器人的产品演示,并预计将于本月内发布。在视频中,Optimus-Gen 2相比上一代有了大幅改进,不仅拥有AI大模型的加持,并在没有其他性能影响的前提下(相比上一代)将体重减少10kg,更包含:由特斯拉设计的
    艾迈斯欧司朗 2024-12-18 12:50 116浏览
  •  2024年下半年,接二连三的“Duang Duang”声,从自动驾驶行业中传来:文远知行、黑芝麻、地平线、小马智行等相继登陆二级市场,希迪智驾、Momenta、佑驾等若干家企业在排队冲刺IPO中。算法模型的历史性迭代与政策的不断加码,让自动驾驶的前景越来越清晰。由来只有新人笑,有谁听到旧人哭。在资本密集兑现的自动驾驶小元年里,很多人可能都已经遗忘,“全球自动驾驶第一股”的名号,曾经属于一家叫做图森未来的公司。曾经风光无两的“图森”,历经内讧与退市等不堪往事之后,而今的“未来”似乎被锚
    锦缎研究院 2024-12-18 11:13 92浏览
  •   前言  作为一名电子专业的学生,半导体存储显然是绕不过去的一个坎,今天聊一聊关于Nand Flash的一些小知识。  这里十分感谢深圳雷龙发展有限公司为博主提供的两片CS创世SD NAND的存储芯片,同时也给大家推荐该品牌的相关产品。  一、定义  存储芯片根据断电后是否保留存储的信息可分为易失性存储芯片(RAM)和非易失性存储芯片(ROM)。  非易失性存储器芯片在断电后亦能持续保存代码及数据,分为闪型存储器 (Flash Memory)与只读存储器(Read-OnlyMemory),其中
    雷龙发展 2024-12-17 17:37 71浏览
  • 习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习笔记&记录学习习笔记&记学习学习笔记&记录学习学习笔记&记录学习习笔记&记录学习学习笔记&记录学习学习笔记记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记
    youyeye 2024-12-18 14:02 98浏览
  • 上汽大通G90是一款集豪华、科技与舒适于一身的中大型MPV,号称“国产埃尔法”。在国内市场,作为“卷王”的G90主要面向中大型MPV市场,满足家庭出行、商务接待和客运租赁等多元化场景需求,在国内市场上取得了不错的销售成绩。在海外市场,上汽大通G90也展现出了强大的竞争力,通过技术创新和品质提升,上汽大通的产品在国际市场上获得了广泛认可,出口量持续增长,如果你去过泰国,你就应该可以了解到,上汽的品牌出海战略,他们在泰国有建立工厂,上汽大通G90作为品牌的旗舰车型之一,自然也在海外市场上占据了重要地
    lauguo2013 2024-12-18 10:11 102浏览
  • By Toradex秦海1). 简介为了保证基于 IEEE 802.3 协议设计的以太网设备接口可以互相兼容互联互通,需要进行 Ethernet Compliance 一致性测试,相关的技术原理说明请参考如下文章,本文就不赘述,主要展示基于 NXP i.MX8M Mini ARM 处理器平台进行 1000M/100M/10M 以太网端口进行一致性测试的测试流程。https://www.toradex.com
    hai.qin_651820742 2024-12-19 15:20 38浏览
  • 沉寂已久的无人出租车赛道,在2024年突然升温了。前脚百度旗下萝卜快跑,宣布无人驾驶单量突破800万单;后脚特斯拉就于北京时间10月11日上午,召开了以“We,Robot”为主题的发布会,公布了无人驾驶车型Cybercab和Robovan,就连低调了好几个月的滴滴也在悄悄扩编,大手笔加码Robotaxi。不止是滴滴、百度、特斯拉,作为Robotaxi的重磅选手,文远知行与小马智行,也分别在10月份先后启动美股IPO,极氪也在近日宣布,其与Waymo合作开发的无人驾驶出行汽车将大规模量产交付,无人
    刘旷 2024-12-19 11:39 89浏览
  •        随着对车载高速总线的深入研究,以电信号为媒介的传输方式逐渐显露出劣势,当传输速率超过25Gbps时,基于电信号传输已经很难保证长距离传输下的信号质量与损耗。在这样的背景下,应用于工业领域的光通信技术因其高带宽、长距离、低电磁干扰的特点得到了密切的关注,IEEE在2023年发布了802.3cz[1]协议,旨在定义一套光纤以太网在车载领域的应用标准。MultiGBASE-AU总览       以下是Mult
    经纬恒润 2024-12-17 17:29 85浏览
  • 由于该文反应热烈,受到了众多工程师的关注,衷心感谢广大优秀工程师同仁的建言献策。特针对该技术点更新一版相关内容! 再次感谢大家的宝贵建议!填充铜(Solid Copper)和网格铜(Hatched Copper)是PCB设计中两种不同的铺铜方式,它们在电气性能、热管理、加工工艺和成本方面存在一些区别:1. 电气性能:填充铜:提供连续的导电层,具有极低的电阻和最小的电压降。适合大电流应用,并能提供优秀的电磁屏蔽效果,显著提高电磁兼容性。网格铜:由于铜线之间存在间隔,电阻相对较高,电压降也
    为昕科技 2024-12-18 17:11 70浏览
  • You are correct that the length of the via affects its inductance. Not only the length of the via, but also the shape and proximity of the return-current path determines the inductance.   For example, let's work with a four-layer board h
    tao180539_524066311 2024-12-18 15:56 102浏览
  • 2003年买的电子管功放机,俗称胆机,坏过几次,咨询厂家,购买零件,自己修理,干中学,学中干。有照片记录的是2011年3月,一天,发现整流管比之前红亮了很多,赶紧关机,想找原因,反反复复折腾了几个月,搞好了。就此,还在网上论坛咨询和讨论,欧博Rererence 5.0电子管发粉红色光,何故?-『胆艺轩音响技术论坛』-胆艺轩[Tubebbs]论坛 发表于2011-5-7同时与厂家联系得到支持,见文:29kg胆机修理之联想——环保简易,做到真难!-面包板社区 发表于2011-6-13又继续使用了多年
    自做自受 2024-12-17 22:18 185浏览
  • 车载光纤通信随着ADAS(高阶驾驶辅助系统)、汽车智能网联、V2X和信息娱乐技术的不断发展,车载电子系统和应用数量迅速增加。不断增长的车内传输数据量对车载通信网络造成了巨大的数据带宽和安全性需求,传统的车载总线技术已经不能满足当今高速传输的要求。铜缆的广泛使用导致了严重的电磁干扰(EMI),同时也存在CAN、LIN、FlexRay等传统总线技术不太容易解决的问题。在此背景下,车载光纤通信技术逐渐受到关注和重视,除了大大提高数据传输率外,还具有抗电磁干扰、减少电缆空间和车辆质量等优点,在未来具有很
    广电计量 2024-12-18 13:31 107浏览
  • 户外照明的“璀璨王者”,艾迈斯欧司朗OSCONIQ® C3030降临啦全球领先的光学解决方案供应商艾迈斯欧司朗(瑞士证券交易所股票代码:AMS)近日宣布,推出新一代高性能LED——OSCONIQ® C 3030。这款尖端LED系列专为严苛的户外及体育场照明环境而设计,兼具出色的发光强度与卓越的散热效能。其支持高达3A的驱动电流及最大9W的功率输出,以紧凑扁平封装呈现卓越亮度和可靠性,确保高强度照明持久耐用且性能出众。应用领域01体育场及高杆照明OSCONIQ® C 3030以卓越的光通量密度、出
    艾迈斯欧司朗 2024-12-18 14:25 96浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦