2024一整年,各大科技厂商经历了对RayBan Meta的“质疑-理解-成为-超越”,在AI眼镜领域集结重兵。整个市场也从RayBan Meta的“一枝独秀”,变成了近百家企业参与、数十款新品被推出的火爆局面。
“百镜大战”一触即发。这种兵临城下的情况,不由地让人想起了几年前的智能音箱“百团大战”。同样是由硅谷科技大厂(谷歌、亚马逊)拉开序幕,互联网巨头集结重兵,大小科创企业一同杀入市场,掀起了一场声势浩大的智能音箱普及潮。
时间拉回到当下,厂商们再次争相入局AI眼镜,其中还有不少是智能音箱大战的老面孔(谷歌、苹果、百度、天猫精灵、小米、Rokid等)。
这不禁让人浮想联翩,AI眼镜会成为下一个智能音箱吗?“百镜大战”的走向,是否会押着“百箱大战”的韵脚?
更重要的是,“百箱大战”让语音交互产品变得成熟且普及,那么AI眼镜又会给你我的生活带来哪些深刻的变化?我们就来做一次全面的梳理和展望。
目前,AI眼镜已经吸引了百度、阿里、小米、联想等大厂,Rokid、雷鸟、闪极等创企和传统眼镜厂商们,纷纷积极布局。彭博社最近的报道披露,苹果也在推进代号「Atlas」的 AI 眼镜项目。
事已至此,很多消费者却仍然一头雾水,到底什么是AI眼镜,跟普通眼镜有什么不同?
创投圈有个惯例,在初创领域要寻找那些成功商业模式的对标者。做AI眼镜,绝大多数厂商对标的就是Ray-Ban Meta。凭借上百万的销量,Ray-Ban Meta成为全球最热销的AI眼镜,也成为后来者借鉴参考的对象。
类Ray-Ban Meta的AI眼镜,外观上更接近普通眼镜,比VR/AR等近眼显示设备更为小巧便携,容易佩戴。而功能上,与普通眼镜相比主要有三个不同:
1.能拍。RayBan Meta、小度AI眼镜、Rokid、雷鸟、闪极,以及待发布的小米AI眼镜,都为普通眼镜加上摄像头模块,通过语音、按键或敲击来进行拍摄,用第一视角快速直观地记录生活。
2.能看。多模态大模型被引入眼镜,无需举起手机,就可以直接对眼镜采集到的视觉信息,进行实时获取、分析与处理,看懂物理世界,并与之进行交互,比如旅行时对着外语路牌实时AI翻译,出门自动智能导航,呼叫AI助手对面前的文档进行总结归纳,吃饭时快速分析卡路里等。
3.能听。传统的音频智能眼镜,就支持语音指令来指挥眼镜播放音乐、查询信息等,而AI眼镜一般会引入大模型,打造更强的语音识别、噪声过滤、语义理解、精准互动等能力。比如Ray-Ban Meta新型号搭载的是Meta的大模型Llama3,小度AI眼镜基于百度文心大模型, Rokid Glasses采用阿里巴巴的通义大模型,天猫精灵则将与夸克AI能力进行融合,来探索AI眼镜。
在上述基础能力之上,已经有厂商开始探索加入差异化的亮点。比如有的加了近眼显示,OPPO、星纪魅族、Rokid Glasses等厂商,加入光学显示模组,推出了带有近眼显示的AR+AI眼镜,可以将字幕显示在镜片上。还有的满足特殊需求,界环两款AI眼镜“时尚眼影”和“时尚腮红”,面向时尚人群的搭配需求。
客观来说,作为一个刚刚萌芽的硬件品类,AI眼镜的产品体验还并没有完全成熟。
硬件方面,AI眼镜受到重量、体积的限制,留给电池组件的空间不足,几乎所有AI眼镜都无法长时间佩戴,对于眼镜不离身的近视、视障群体很不方便。显示模组的加入也会加大眼镜佩戴的负担。
软件方面,端侧AI的协同优化有待加强。多模态大模型、语音大模型在端侧运行,算力需求高、吞吐较慢,互动中几秒的时延都会让用户有等待感,实时翻译/导航的响应速度比不上高性能手机。有的厂商为了实时性,对模型进行压缩蒸馏,又会损失性能,变成“AI弱智眼镜”,让AI功能变得鸡肋。
想要让广大消费者觉得AI眼镜真的很有用,厂商们要有一段路要走。既然如此,“AI眼镜”这把战火,是怎么烧上各大厂商心头的呢?
AI眼镜产品尚未成熟,科技巨头已经集结重兵,火药味十足。这种局面,与2016年左右突飞猛进的智能音箱市场有异曲同工之处。
从时机看,初期的智能音箱与AI眼镜当前的情况类似,产品尚未打磨成熟,缺少AI杀手级场景,当时还有声音说,AI加入音箱是“大炮打蚊子”。尽管如此,巨头们都选择抢跑,消费者可以不用AI眼镜,但品牌不能没有,先推个新品占坑再说,这又是为什么?
从动机看,巨头们争夺的并不是一个小小的音箱/眼镜市场,而是担心错过开启下一个交互中枢的“钥匙”。
如果说智能手机是触控中枢,开启数字世界的钥匙;智能音箱是语音交互的中枢,开启智慧居家场景的钥匙;那么AI眼镜就是视觉中枢,有望成为开启物理世界数字互动的一把钥匙。AI眼镜佩戴时间长,第一视角直观、实时、高效地与外界互动,所联接的服务生态商业潜力也很广阔。
这些中枢型产品,一旦硬件形态稳固、产品说服力完备之后,就会快速进入普及潮,撬动一个全新的硬件增长周期,智能手机的“iPhone时刻”,智能音箱的“Echo时刻”,概莫能外。而AI眼镜,刚刚迎来自己的“Ray-Ban Meta时刻”,此时还没有哪个国内品牌占据头部份额,那么巨头的优势发挥空间和潜在市场想象,就十分广阔了。而巨头们入局某一领域,往往就会带动整个市场参与者的跟进,所以AI眼镜也就成了下一个智能音箱,拉开“百镜大战”的序幕。
如果说AI眼镜厂商,能从“百箱大战”中吸取什么经验,那应该是智能硬件市场的残酷性。
简单来说,“百箱大战”经历了几个阶段。
第一阶段,爆款开局,百花齐放。2016年亚马逊echo获得市场认可,科技巨头们纷纷开始发力智能音箱,各家方案百花齐放,华强北一条街就有上百家做音箱的。
第二阶段,品类稳定,技术迭代。2017-2018年,背靠百度研究院的小度、阿里达摩院的天猫精灵相继入局,带来无唤醒词、中文语义理解等大量技术创新,大家发现,原来音箱之间也是不一样的。智能音箱不断迭代,产品走向成熟。
第三步:竞争加剧,大厂洗牌。技术升级、以价换量的价格战、产品高速迭代,大厂一通连环操作,高强度竞争让很多小型创企离开,行业集中度提升。
第四步:生态加码,身位稳固。百度小度、阿里天猫精灵、小米小爱凭借各自独特的生态优势(内容、电商、IoT),构建起智能音箱的核心价值。到了2019年,智能音箱市场“三足鼎立”的局面已经基本稳固。
回顾“百箱大战”可以看到,智能硬件大战是一场全程重投入、竞争高强度、价格变动大的长程运动。
激烈的市场竞争会洗刷掉那些实力不足的参与者,强大如谷歌、苹果等科技巨头,也曾在智能音箱大战中掉队,对小型初创公司来说更是非常难熬的。只有极少数有着深入技术布局和成本承压能力的厂商,能一直屹立于市场。
所以,争夺AI眼镜这把视觉中枢的钥匙,巨头们入局之前也要琢磨一下,是否有“不破楼兰终不还”的战略规划,是否做好了“不要伤亡数字,只要塔山”的思想准备。
做好了战略层面的思想准备,巨头们还要面对一个残酷现实:AI眼镜要抢滩消费者的眼球,恐怕比智能音箱抢滩你我的客厅,战线更加漫长。
首先,视觉具有独占性,加剧了AI眼镜的竞争烈度。
客厅场景对智能音箱的包容度是很高的,最火爆的时候,我家里同时用着四款音箱(百度小度、天猫精灵、京东叮咚、腾讯叮当),但眼睛却只能允许一款AI眼镜独占视野,所以各大AI眼镜厂商的营销策略、价格战,恐怕都会比智能音箱更加激进。
其次,视觉使用的高频程度,决定了消费者的观望期更长。
智能音箱的功能容错率很高,互动几次答错了、不满意,直接拔电放到一旁吃灰就好。但戴眼镜的人,除了睡觉很少会摘下来,视觉的高频使用,意味着消费者会对AI眼镜的产品成熟度更加苛刻,所以购买AI眼镜,消费者会有一个更长的“观望期”。AI眼镜无法像智能音箱一样快速接入超大规模的大众用户。
尤其是AI功能,在低时延、隐私安全、语义理解、任务完成度等方面,还没有规模商用的说服力高的产品。模仿Ray-Ban Meta的产品,主打功能还是拍摄,有人说是“加了相机的智能耳机”,AI浓度高的小度AI眼镜还未全面发售。
此外,视觉也是高度个性化的,限制了AI眼镜的商业化速度。
家居场景对智能音箱的包容度很高,只要不太丑,在装修风格中不太突兀,那么智能音箱可以作为走亲访友的伴手礼、商业酒店客房大批量采购,都是不错的商业模式。但眼镜却不同,不同用户需要不同选择,无法用一种简单设计来满足绝大多数人的审美趣味,以自用为主,不太适合作为礼物送给他人,也要考虑到近视、弱视等群体对屈光、度数等个性化需求,一般要线下验光、制作,非标品是很难快速交付的。
所以,AI眼镜的商业打开周期,恐怕也会比智能音箱更长。
从上述角度看,从“百镜大战”胜出的艰难程度,也会远超于“百箱大战”。
说了这么多难题,我们也得给铁了心入局AI眼镜的厂商出点主意。
一般来说,智能硬件都需要最主打的一个亮点、刚需功能,撬开消费者的购买欲望,作为赢得市场的“胜负手”。
目前,AI眼镜给予消费者的主要功能还是拍摄,Meta内部曾说AI功能的使用率不到10%,让消费者蠢蠢欲动的AI功能,比如实时导航、实时翻译、互动问答解题、会议记录……面临“感觉有点用,但又不好用”的尴尬。所以业内开始出现一种声音,认为“AI只是眼镜的赠品”。那么,厂商能靠拍摄功能走向竞争终局吗?答案是否定的。
从真实需求来看,第一视角拍摄,有非常多的成熟硬件品类可以选择,比如gopro、无人机、手持稳定器、VR近眼显示设备……AI眼镜在续航、视野方面恐怕没有明显优势。而且,拍摄组件与眼镜的集成与调优,可以随着工程化水平的提高而逐步解决,但怎么让AI眼镜变得不可或缺、不可替代,却不是那么容易解决的。
所以,在接下来的产品成熟期,AI恐怕才是智能眼镜的主要溢价模块。
而且,AI技术作为最难攻克的一环,也能让厂商拉开竞争梯度,成为竞争的胜负手。
参考智能音箱大战的规律,接下来AI眼镜也会进入到一个技术升级、产品迭代的周期。其中,AI功能的挖掘和完善,将是重中之重。
如果要给厂商们出点主意,那就是把能真正改变产品体验、做实产品价值的技术握在手里,加强眼镜与AI的深度结合:
与本土化AI相结合,从隐私安全、使用场景和需求来看,AI眼镜都需要本土的优秀大模型或AI产品相结合,变得更懂中文,更懂方言,更贴近国内的用户习惯和使用环境;
与计算摄影相结合,拍摄是很多人选择AI眼镜的首要功能,AI软硬件可以在画质优化、画面纠偏、调整畸变、实时视觉识别等方面,优化眼镜的拍摄效果;
与内容服务生态相结合,与出行、学习、办公、娱乐等生态伙伴合作,优化内容服务在AI眼镜上的表现,降低算力消耗,提升高相关场景的使用感受。
AI的技术升级与功能迭代,会将各大厂商送到新的起跑线,也给2025的消费电子市场带来一点不同。