影智科技唐沐:人形是累赘,具身智能并不缺少落地场景

原创 Alter聊科技 2024-12-19 21:05

影智科技创始人唐沐认为:具身智能在产品设计上应该解决特定需求,而非单纯追求形式上的“人形”。具身智能的真正价值,在于以具体问题为导向,让机器人能够灵活适应环境、精准满足需求。

撰文张贺飞
编辑沈菲菲

马斯克、黄仁勋等人的站台,让具身智能迅速蹿升为2024年最受资本追捧的赛道之一。

复盘具身智能赛道过去一年融资事件,人形机器人是出现频率最高的词。或许是受《机械姬》、《西部世界》等科幻作品的影响,人们本能地认为具身智能应该拥有双手双脚、面部表情等设计。

但影智科技创始人唐沐对此并不认同:“具身智能在产品设计上应该解决特定需求,而非单纯追求形式上的’人形’。当前市场对人形机器人的追捧更多是概念化,而非实用主义。

作为QQ头像、微信表情包等现象级符号的缔造者,小米路由器、小爱智能音箱等亿级爆款产品的掌舵人,唐沐以其敏锐的洞察力和创新的产品思维,打造了一系列国民级产品。

与那些还处于实验室状态、“吊着威亚”展示的人形机器人不同,影智科技的xbot咖啡机器人已经是各种科技展会上的明星,每次体验机器人制作咖啡的观众都排起了长队。


具身智能为什么必须回归需求导向?这种理念为机器人带来了哪些颠覆性的改变?又有哪些成功落地的应用场景?带着这些问题,我和影智科技创始人唐沐进行了一场深度对话,尝试打破外界的刻板印象,找到通往具身智能正确答案。

01.
机器人的进化路径:
不是从“像人”开始,而是“更有用”

2023年走进大众视野的具身智能,正处于“八仙过海” 的时期,吸引了一大批用人形机器人求解具身智能的创业者。

而支撑他们投身人形机器人的动机,可能只是一场不确定的“风”:当马斯克开始做人形机器人之后,市场、资本机构都认为必须加快入场,不能等特斯拉真正做出来了大家再去追。

有着20多年产品经验的唐沐,并不苟同这种追风现象。

2003年,唐沐加入腾讯,着手组建了腾讯用户研究与体验设计中心(CDC),负责QQ、QQ电脑管家、QQ音乐、QQ空间等亿级用户的产品体验设计。外界所熟悉的QQ头像、微信表情包等均出自唐沐之手。

2013年,本着“做一款自己的产品”的想法,唐沐加入小米,历任智能产品部总经理、小米生态链副总裁,带领团队开创了小米路由器、小爱音箱两条亿级产品线,以及VR、AR、机器人等领域的技术探索。

多年后,唐沐离开小米创办了影智科技,天使投资人名单中不乏微信之父张小龙、小米联合创始人林斌、黎万强、黄江吉、洪锋等外界耳熟能详的人物。


影智科技的标杆产品,正是前面提到的xbot咖啡机器人。彼时,唐沐就意识到,机器人需要遵循技术的底层逻辑,在正确的时间做正确的事,而非奔着一个遥远的目标给投资人画饼。

这样的履历,让唐沐有足够的底气选择不盲目追风,坚持自己对具身智能趋势的理解和洞察。

当其他创业者为人形机器人枕戈待旦时,堪称“国内具身智能消费机器人第一人”的唐沐,没有沉溺于对人形机器人的空洞想象,理性地讲述了自己对机器人演进路径的独到见解:

X1阶段是工业机器人,强调动作的人工编排,用于工厂内的高度结构化任务;

X2阶段是消费机器人,结合人工与AI进行任务编排,比如学习咖啡师的技艺训练机器人的拉花技巧;

X3阶段是具身智能消费机器人,拥有视觉、听觉、触觉等多模态感知能力,可以基于用户的个性化信息,结合消费场景和用户进行深层次互动,进一步提升服务质量和灵活性;

最后一个阶段才是AGI机器人。


和人形机器人广泛而模糊的目标不同,唐沐认为:机器人的进化路径,不是从‘像人’开始,而是从‘更有用’出发。具身智能的真正价值,在于以具体问题为导向,让机器人能够灵活适应环境、精准满足需求,这才是技术发展的正确方向,就像让机器人做咖啡。

相比人形机器人在舞台上比心、跳舞等“炫技”,影智科技的xbot咖啡机器人让人记住的,是实打实的“新质生产力”:能够在75秒内复刻大师级的拉花咖啡技艺。


2021年举办的黑杯咖啡大师竞技赛上,xbot咖啡机器人和世界级拉花咖啡师同台竞技,并最终摘得了冠军。由于人类咖啡师的集体抗议,xbot咖啡机器人在第二年“被迫”当了评委。主办方先让xbot咖啡机器人做一杯拉花咖啡,然后让人类咖啡师还原,并根据完成度评分。

现在,xbot咖啡机器人已经不单单是效率上的降维打击,在大模型的赋能下重新定义了服务边界——从生产力工具跃升为兼具情感互动与个性化服务的咖啡智能体。

02.
具身智能的现实价值:
不是形态上像人,而是思维上像人

在星巴克的品牌故事里,有一个重要的理念是“将顾客作为朋友”,咖啡师熟悉每一位顾客的名字和喜好,甚至在顾客进门前就准备好了他们常点的饮品,以此给予顾客在家和工作之外的归属感。

但在中国市场,这种归属感早已输给了人效二字:被一杯杯订单忙到喘不过气的咖啡师们,很难有精力和顾客建立有感情的沟通。咖啡店拼的是出单量和运营效率,而非顾客的体验感。

在唐沐看来,这正是具身智能的现实价值。

“X2阶段的机器人已在效率上实现对人工的降维碾压,而大模型的多模态感知与认知推理能力,将重新定义咖啡消费,不仅赋予了咖啡人情味儿,还拓展出了全新的消费场景。”

影智科技自研的xbot咖啡大模型已经应用到三类消费场景中,完美诠释了唐沐的理念:


一是AIGC“烘托”的仪式感和氛围感。

除了大师级的拉花技艺,xbot咖啡大模型带来了独一无二的咖啡体验:顾客可以扫码上传自己感兴趣的照片,通过AIGC技术生成自己喜欢的图像风格,让咖啡机器人用焦糖在奶泡上打印出相应的图案。


一杯咖啡满足的不再只是“提神”的需求,也是一种社交资本:情人节给女朋友买一杯印有玫瑰花图案的咖啡,在景点打卡时咖啡上印有刚拍的风景……让喝咖啡更有仪式感,并激发出消费者的社交需求。

二是多模态感知能力带来的情感体验。

当顾客走到咖啡机器人前点单时,可以智能识别用户身份和口味偏好,自动切换到顾客喜欢的数字人形象,而且数字人会主动和顾客打招呼,并推荐顾客可能感兴趣的咖啡品类。


在用户允许的情况下,咖啡机器人甚至可以通过声音和表情实时感知顾客的情绪状态,比如顾客表现出疲倦或情绪低落时,建议顾客多加一些糖来保持好心情,或者调整咖啡因浓度帮助用户提神。

三是千人千面的消费需求和健康管理。

得益于xbot咖啡大模型的认知推理能力,基于顾客消费数据的个性化消费知识图谱,顾客只需要一个类似“做一杯热带风情”咖啡的指令,咖啡机器人能够自动创作出符合顾客需求的咖啡,让顾客的需求不再局限于已有的菜单,而且能够根据自己的想法个性化定制。


xbot咖啡大模型还能为顾客制定健康管理方案,比如了解到顾客连喝了三杯咖啡后,推荐喝一杯有利于健康的乌龙茶。

如果说人形机器人追求的是形态上像人,唐沐的理念是思维上像人,让具身智能机器人像人一样和顾客打招呼,像人一样关心顾客的情绪。

唐沐进一步解释称:“具身智能还没有终极的答案,不代表没有可以参考的路径,譬如十年前的自动驾驶,如果按照当时预期的终极目标,到现在也没有实现,但并不妨碍L2.5、L3级别的自动驾驶能力上车。具身智能从发展到成熟的过程中,也存在大量可落地的场景。

摆脱了“炫技”等表面追求的xbot咖啡机器人,可能不如人形机器人有话题性,却构建了更贴近消费场景的具身智能生态,打造出了更贴近当前社会需求高度契合的真实图景。

03.
遵循商业化常识:
人形可能会是累赘,优先解决高频刚需

对于具身智能的市场前景,外界有不少判断。

高盛曾预测称,在理想状态下,软硬件成本年均下降达到20%的话,人形机器人市场规模有望在2035年达到1540亿美元。

黄仁勋在媒体采访中坦言,“100年后大街上将到处都是人形机器人”,马斯克也在X上默契地回复,“人形机器人普及程度将是汽车10倍”。

面对具身智能的商业化问题,有别于动辄十年后、百年后的长远叙事,唐沐用一组掷地有声的真实数据给出了答案:

“目前xbot咖啡机器人在全球部署超过300台,包括博物馆、景区、商场、展会、图书馆等场所,两周前刚落地到70家万达影城。每台咖啡机器人日均制作的咖啡在200杯以上,最高的时候超过了350杯。仅在过去一个月,我们的营收已经超过2000万元。”

正在大规模量产的xbot咖啡机器人

唐沐对具身智能机器人的商业化构想,也随着xbot咖啡机器人的落地得到了充分验证。

比如在2023年成都大运会期间,成都的一家公司将xbot咖啡机器人“搬”到了大运会的运动员餐厅,24小时不间断运营。期间吸引了不少运动员拍照打卡,不乏意大利、巴西等对咖啡要求很高的国家的运动员。后台统计数据显示,xbot咖啡机器人在12天里做了4000多杯咖啡,主办方全程只安排了一个志愿者负责换料。


再比如北京首都图书馆的例子,在微博、小红书等社交媒体上,有不少人分享打卡首都图书馆的咖啡机器人,为机器人的拉花技能和个性化图案印花点赞。连唐沐都直言超出了预期:“一开始只是和首都图书馆联营合作,不小心成了图书馆的网红打卡点,每天运营10个小时,日均制作200多杯咖啡,只用4个月的时间就收回了成本。”

两个月前的国庆75周年庆典上,xbot咖啡机器人作为新质生产力的代表,出现在天安门景区,意料之中地成了新晋打卡点,每天都有不少游客排队体验。

咖啡机器人的商业化路径跑通后,唐沐并没有停下来。

除了直接销售咖啡机器人,影智科技正在全面发力机器人联营业务,探索咖啡服务之外的信息增值服务。围绕真实的场景需求,咖啡小站、无人快餐车等产品已经被排上日程,其中无人车快餐车上的机器人,可以制作咖啡、冰淇淋以及汉堡、沙拉等快餐。

被问及影智科技是否会进入更多场景、未来的边界在哪里时,唐沐的回答始终聚焦在场景化设计的理念:“所有的产品必须要在场景中设计,我们绝对不做臆想的,不会突然冒出一个idea就把它做出来。

站在行业的视角上看,整个具身智能赛道似乎还未到谈论商业化的时候,不断有创业者带着激情进场,资本也愿意为一个美好的愿景买单。但看似繁荣的热潮背后,潜在的困境也如影随形,倘若没有未雨绸缪的商业化审慎思考,过于夸大未来而忽略当下,最终留下的往往是一地鸡毛。

见证了多次潮起潮落的唐沐,本着对国民级产品的执着,认为具身智能创业应该遵循商业化常识:“具身智能不等于人形机器人,在许多场景中,人形设计可能过于复杂且不具备效率,甚至会成为累赘,创业者应该以具身智能为核心,优先解决高频刚需问题,不要盲目追求形式上的人形化。

04.
写在最后

2019年中国的人均咖啡消费不到5杯,2023年的时候已经增长到16.7杯,一线城市甚至达到了100多杯。等待xbot咖啡机器人的,是一个潜力无限的千亿级市场。

作为一个蓝海市场的开拓者,唐沐笃定地表示:“我们的产品不是跟着潮流走,而是要用实力去定义潮流的方向。这或许是我这种‘大龄创业者’的特质吧,不会被理想冲昏头脑,也不迷恋概念上的‘炫酷’, 解决现实需求才是直接打破行业规则的王道。”

具身智能的大幕才刚刚拉开,已经站在浪潮之巅的唐沐坚信,随着人形机器人热潮退去,行业将迎来一场回归:从形式到本质,从概念到落地,具身智能将重塑更多行业,创造出前所未有的价值。

往期推荐


01

“芯片围城”下国产AI要放缓?答案或截然相反

02

AutoGLM的一小步,人机交互进化的一大步



主理人 | 张贺飞(Alter)


前媒体人、公关,现专职科技自媒体


钛媒体、36kr、创业邦、福布斯中国等专栏作者


转载、商务、开白以及读者交流,请联系个人微信「imhefei」

Alter聊科技 探究产业兴衰,专注商业解读。
评论
  • 现在为止,我们已经完成了Purple Pi OH主板的串口调试和部分配件的连接,接下来,让我们趁热打铁,完成剩余配件的连接!注:配件连接前请断开主板所有供电,避免敏感电路损坏!1.1 耳机接口主板有一路OTMP 标准四节耳机座J6,具备进行音频输出及录音功能,接入耳机后声音将优先从耳机输出,如下图所示:1.21.2 相机接口MIPI CSI 接口如上图所示,支持OV5648 和OV8858 摄像头模组。接入摄像头模组后,使用系统相机软件打开相机拍照和录像,如下图所示:1.3 以太网接口主板有一路
    Industio_触觉智能 2025-01-20 11:04 141浏览
  • 高速先生成员--黄刚这不马上就要过年了嘛,高速先生就不打算给大家上难度了,整一篇简单但很实用的文章给大伙瞧瞧好了。相信这个标题一出来,尤其对于PCB设计工程师来说,心就立马凉了半截。他们辛辛苦苦进行PCB的过孔设计,高速先生居然说设计多大的过孔他们不关心!另外估计这时候就跳出很多“挑刺”的粉丝了哈,因为翻看很多以往的文章,高速先生都表达了过孔孔径对高速性能的影响是很大的哦!咋滴,今天居然说孔径不关心了?别,别急哈,听高速先生在这篇文章中娓娓道来。首先还是要对各位设计工程师的设计表示肯定,毕竟像我
    一博科技 2025-01-21 16:17 94浏览
  •  万万没想到!科幻电影中的人形机器人,正在一步步走进我们人类的日常生活中来了。1月17日,乐聚将第100台全尺寸人形机器人交付北汽越野车,再次吹响了人形机器人疯狂进厂打工的号角。无独有尔,银河通用机器人作为一家成立不到两年时间的创业公司,在短短一年多时间内推出革命性的第一代产品Galbot G1,这是一款轮式、双臂、身体可折叠的人形机器人,得到了美团战投、经纬创投、IDG资本等众多投资方的认可。作为一家成立仅仅只有两年多时间的企业,智元机器人也把机器人从梦想带进了现实。2024年8月1
    刘旷 2025-01-21 11:15 239浏览
  • Ubuntu20.04默认情况下为root账号自动登录,本文介绍如何取消root账号自动登录,改为通过输入账号密码登录,使用触觉智能EVB3568鸿蒙开发板演示,搭载瑞芯微RK3568,四核A55处理器,主频2.0Ghz,1T算力NPU;支持OpenHarmony5.0及Linux、Android等操作系统,接口丰富,开发评估快人一步!添加新账号1、使用adduser命令来添加新用户,用户名以industio为例,系统会提示设置密码以及其他信息,您可以根据需要填写或跳过,命令如下:root@id
    Industio_触觉智能 2025-01-17 14:14 118浏览
  • 数字隔离芯片是一种实现电气隔离功能的集成电路,在工业自动化、汽车电子、光伏储能与电力通信等领域的电气系统中发挥着至关重要的作用。其不仅可令高、低压系统之间相互独立,提高低压系统的抗干扰能力,同时还可确保高、低压系统之间的安全交互,使系统稳定工作,并避免操作者遭受来自高压系统的电击伤害。典型数字隔离芯片的简化原理图值得一提的是,数字隔离芯片历经多年发展,其应用范围已十分广泛,凡涉及到在高、低压系统之间进行信号传输的场景中基本都需要应用到此种芯片。那么,电气工程师在进行电路设计时到底该如何评估选择一
    华普微HOPERF 2025-01-20 16:50 70浏览
  • 2024年是很平淡的一年,能保住饭碗就是万幸了,公司业绩不好,跳槽又不敢跳,还有一个原因就是老板对我们这些员工还是很好的,碍于人情也不能在公司困难时去雪上加霜。在工作其间遇到的大问题没有,小问题还是有不少,这里就举一两个来说一下。第一个就是,先看下下面的这个封装,你能猜出它的引脚间距是多少吗?这种排线座比较常规的是0.6mm间距(即排线是0.3mm间距)的,而这个规格也是我们用得最多的,所以我们按惯性思维来看的话,就会认为这个座子就是0.6mm间距的,这样往往就不会去细看规格书了,所以这次的运气
    wuliangu 2025-01-21 00:15 153浏览
  • 嘿,咱来聊聊RISC-V MCU技术哈。 这RISC-V MCU技术呢,简单来说就是基于一个叫RISC-V的指令集架构做出的微控制器技术。RISC-V这个啊,2010年的时候,是加州大学伯克利分校的研究团队弄出来的,目的就是想搞个新的、开放的指令集架构,能跟上现代计算的需要。到了2015年,专门成立了个RISC-V基金会,让这个架构更标准,也更好地推广开了。这几年啊,这个RISC-V的生态系统发展得可快了,好多公司和机构都加入了RISC-V International,还推出了不少RISC-V
    丙丁先生 2025-01-21 12:10 103浏览
  •  光伏及击穿,都可视之为 复合的逆过程,但是,复合、光伏与击穿,不单是进程的方向相反,偏置状态也不一样,复合的工况,是正偏,光伏是零偏,击穿与漂移则是反偏,光伏的能源是外来的,而击穿消耗的是结区自身和电源的能量,漂移的载流子是 客席载流子,须借外延层才能引入,客席载流子 不受反偏PN结的空乏区阻碍,能漂不能漂,只取决于反偏PN结是否处于外延层的「射程」范围,而穿通的成因,则是因耗尽层的过度扩张,致使跟 端子、外延层或其他空乏区 碰触,当耗尽层融通,耐压 (反向阻断能力) 即告彻底丧失,
    MrCU204 2025-01-17 11:30 176浏览
  • 本文介绍瑞芯微开发板/主板Android配置APK默认开启性能模式方法,开启性能模式后,APK的CPU使用优先级会有所提高。触觉智能RK3562开发板演示,搭载4核A53处理器,主频高达2.0GHz;内置独立1Tops算力NPU,可应用于物联网网关、平板电脑、智能家居、教育电子、工业显示与控制等行业。源码修改修改源码根目录下文件device/rockchip/rk3562/package_performance.xml并添加以下内容,注意"+"号为添加内容,"com.tencent.mm"为AP
    Industio_触觉智能 2025-01-17 14:09 159浏览
  •     IPC-2581是基于ODB++标准、结合PCB行业特点而指定的PCB加工文件规范。    IPC-2581旨在替代CAM350格式,成为PCB加工行业的新的工业规范。    有一些免费软件,可以查看(不可修改)IPC-2581数据文件。这些软件典型用途是工艺校核。    1. Vu2581        出品:Downstream     
    电子知识打边炉 2025-01-22 11:12 38浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦