AI在手机里结出了果

原创 脑极体 2024-12-02 17:44


2023年初AI大模型火爆全球,当时就有人说,这项技术走向大众的最佳方式就是手机。


不管消费者怎么想这句话,苦于销量连年下降的手机厂商们肯定是把它听进去了。


于是,从2023年下半年开始,所有手机新品都在标榜AI能力,都宣称自己是AI手机。这场盛宴持续上演到今天,即使是相对保守的苹果也发布了“Apple Intelligence”,而那些原本被认为已经被挤压到缺少生存空间的二线手机品牌,也顽强地依靠“All in AI”留在了牌桌上。


一时间,AI在手机市场是锣鼓喧天,红旗招展,人山人海……不对,人山人海可能还不一定。



对于用户来说,面对铺天盖地的AI手机,华美无比的发布会PPT,可能有点小迷惑:AI到底能给我带来什么?这么多AI手机之间有什么不同?我设想的AI是科幻电影里那种,手机能给我吗?


事实上,从2017年深度学习火热起来之后,手机与AI的结合一直都在持续。几年来,我们经历了端侧AI算力、AI摄影、端侧大模型,到系统级AI能力的变迁。假如手机是一片果园,AI这棵果树在里面已经长了很多年。


那么,到2024年,AI手机无限风光之时,这颗果子它保熟了吗?


让我们穿越纷繁复杂的概念,看看AI手机究竟带来了什么。



提起AI手机,我们总会有一种很空洞的感觉,甚至不知道厂商和专家到底在激动个什么。


这种虚妄感来源于业界并不存在对AI手机的标准化认定。于是每个厂商,甚至每个人都可以对其进行独立阐释。这些阐释有共识,有差异,还有大量似是而非与文字游戏。这些声音交织在一起,就变成了一种概念游戏。


因此,想要了解AI手机,首先要避免被概念游戏干扰。就像要摘果子,首先要把枝叶拨开。如何实现这种免打扰呢?一个简单的方法,叫作“AI手机,我有三不看”。


首先,厂商的“AI大帽子”不用看。


不久之前,AI手机领域姗姗来迟地发布了此前承诺的Apple Intelligence。但这个“苹果智能”却没有激起多大的市场水花。原因在于,苹果智能更像是众多AI功能的升级打包,而非某种新能力、新思路。



这种给众多AI小功能起个大名字的玩法,在今天的手机界比较普遍。用户以为得到了新东西,其实不过是新瓶装旧酒,散装改零售。类似的说法,经常还包括某某智能、某某GPT、某某原生,大差不差都是一个意思。甚至很多时候这根本不是一个研发系统主导的项目,而是市场部归拢收集一下各个部门都有哪些AI能力,最后编个名字给写进PPT里而已。


其次,是缺乏标准的技术名词不用看。


任何技术在受到重视之后,都会经历一个造词阶段。这些新造的词有些会最终留下来,变成约定俗成、相对标准化的说法。但绝大部分都会悄然流逝在历史记忆里。在AI手机领域,我们经常会看见大量类似的新词。它们或多或少都有所指,但作为普通消费者大可不必去探寻每个词的来龙去脉,也不用被它们迷惑了判断。


诸如智能框架、意图识别、主动服务、全局智能等高大上的AI手机词汇,在今天都没有统一标准,爱好者可以研究研究,大多数消费者不妨敬而远之。



再次,大模型参数以及其他AI参数不用看。


从2018年预训练大模型开始出现,就产生了一种头部厂商说效果,其他厂商拼参数的现象。在核心能力上很难构建差异化的厂商,往往会宣传自己模型参数更大,跑分效果更好。这一点来到AI手机阶段,就变成了宣传端侧大模型的参数大、数量多。但AI模型不是CPU等硬件,参数高并不意味着性能好。模型效果还取决于压缩方案、调优效果等一系列条件,所以不必将厂商宣传的模型参数等同于产品价值。


蒸馏掉这些之后还能留下的东西,才是AI在手机里结出的果。



很多人都在说,AI没有应用可怎么办。但问题是,ChatGPT本身就是一种应用。在应用端再诞生更强的超级应用固然前景美好,但大模型本身的应用价值本身就有跟手机结合的空间。


AI手机的第一步,就是要把类ChatGPT的大模型能力带到手机的第一方功能里。比如iOS18.1,重点引入的AI功能,就包括AI写作、邮件推荐与回复、消息摘要等。换个角度想想,我们会发现这些都是ChatGPT就能做到的事。


这种思路并没有什么不好,而且也必须由手机厂商第一方来主导。因为如今智能手机提供的第一方功能非常多,而其中又有大量可以加入语义理解、内容生成等大模型能力的地方。因此,大语言模型与手机第一方功能的点对点结合,是AI在手机里结出最多的果。



对于类似功能的选择,建议是根据自身需求来挑选实用的功能,或者功能群组。比如去年11月,OPPO就发布了一键生成AI通话摘要。这个功能可以在通话结束后,智能识别通话内容并生成重点信息摘要。再比如Find X8 Pro可以长按电源键呼出问屏功能,AI根据屏幕显示来回答文章内容、图片信息等。小米在澎湃OS 2当中,也推出了一系列诸如AI写作、AI识音、AI妙画的智能功能。



但对于手机厂商来说,大模型功能的加入显然只是敲门砖。这种单点升级并不能满足厂商对AI的野心。


于是,智能体来了。



AI Agent又被称为智能体,被广泛认可是真正体现了AI思维的新应用形态。智能体可以跨越不同的软件工作流程,来实现目标主导的自主判断。这种运行逻辑放在手机里有两方面的好处。


对于用户来说,智能体可以被视作独立于点滑交互的新交互形式。用户可以命令智能体来完成指令,并且其理解能力、生成能力与应用范畴都远大于此前的语音助手,更加贴近用户对个人助理的基本想象。


对于手机厂商来说,智能体不仅是一个全新卖点,还可以绕过APP的藩篱,让第一方的应用权限更大,体验更加重要。把智能体做起来,有概率让用户习惯、第三方应用服务都与厂商绑定更加紧密。


在这样的驱动力下,几个月以来手机厂商纷纷在智能体阵地上秣马厉兵,誓有一种在2025年展开智能体决战的架势。而从AI手机的发展线上看,手机+AI Agent是一个脱离了ChatGPT基本应用框架,同时苹果为代表的欧美终端厂商没有跟进的领域。中国AI手机的未来成就,或许就系在智能体的机遇上。



在智能体方面,目前最为用力地就是荣耀。不久之前的荣耀Magic7发布会上,荣耀CEO赵明用YOYO智能体自动下单了2000杯咖啡,一下让智能体手机的概念大为出圈。目前,荣耀主推的智能体体验包括“一句话关闭自动续费”“一句话点咖啡”“一句话发送文件”“一句话关闭应用权限”等。在手机行业里相对完整且具体地展现了智能体价值。


在2024 vivo开发者大会上,vivo也亮出了自己的智能体方案Phone GPT,其不仅具有对屏幕界面的识别和操作功能,还可以接管音频,通过电话实现预订餐厅等功能。把智能体延伸到音频领域,也成为接下来一个值得关注的方向。



在OPPO这边,则有可以连续多轮自然对话,并可以跨应用操作的OPPO AI。除了提供识物、导航、问答等AI能力外,OPPO AI还可以与影像能力、AIGC能力结合,帮助用户完成图片识别、图片处理、排版润色等功能。


在华为这里,HarmonyOS NEXT版本具有搭载了盘古大模型的鸿蒙智能助手小艺。其感知和推理能力较此前版本有极大提升,可以实现23类主要场景的交互。



这些尝试,都可以看作是向手机+AI Agent方向的前进,只是各个厂商的具体技术实现方式、能力侧重以及宣传话术不同。


对于消费者来说,如果你是深度手机用户,今天可能已经到了尝鲜智能体的时机,但如果并没有被传统交互方式困扰等问题,或许还可以让智能体手机再成熟一些。


至少AI Agent这颗果子,目前看来有着硕大无朋的潜力。



AI大模型与手机的结合方案有很多,但个人认为,二者的最佳结合点其实是很明确的,那就是无障碍能力。


AI大模型的核心功能之一,就是在图像、音频、文字几种不同的媒介间进行转换,而这恰好也是视障、听障人群最为需要的。因此,当有人认为AI大模型与手机结合并不必要时,我会说看看无障碍能力的长足进展就能知道,AI手机必有未来。


通过与很多听障、视障朋友的交流,以及对相关机构的采访,发现大家都希望实名表扬华为和vivo。早些年普遍认为苹果的无障碍能力很好,但现在已经是华为和vivo在引领端侧无障碍能力的发展,尤其是AI时代的无障碍升级。



比如说,vivo通过AI技术为听障、视障人群和老年人提供了一系列帮助。去年,vivo的“手语翻译官”软件获得了CCL2024手语数字人翻译质量评测第一名。今年,vivo还升级了“手语学习”功能,推动手语的教育普及。



鸿蒙系统的发展,每一步都伴随着对端侧无障碍事业的大力投入。比如HarmonyOS 4就推出了助听器直连功能。在华为开发者大会2023期间,推出了能帮助视障人群识别具体场景与物品的小艺看世界。而在今年,HarmonyOS NEXT则在业界率先推出了小艺声音修复功能,它利用AI技术对语言障碍者的声音进行实时分析、修复和优化,不仅能够发出可懂音,还能尽可能保留用户音色。这个功能专为四级和三级言语障碍人群设计,可以实现无需文本输入的声音修复,极大拓展了端侧无障碍能力的边界。


对于很多用户来说,手机里的AI能力或许是锦上添花,但对于有障碍群体来说,AI手机或许就是改变生活乃至生命的钥匙。


仅为此,AI也必须在手机中存在,壮大,盛放。



回顾一下手机厂商推进的AI能力,会发现其实每一步都还有很青涩的地方。如果我们愿意承认二者结合的复杂性,那么AI手机的果子可能还真不太保熟。


如果手机只提供AI能力,那么厂商会面临与应用开发者的直接竞争。而应用开发者包括互联网巨头与专业的AI厂商,手机厂商的技术能力与用户号召力可能并不具有说服力。


于是,手机厂商希望押注智能体这样的突破性体验,但目前阶段这类体验还有待打磨和升级。很多时候,用户给智能体下达的指令需要反复确认,效率还不如直接点滑,而AI接管音频等能力则不确定性更大。面对经常出错的,且应用范围不广的智能体,用户的耐心与信任或许会快速枯竭。



更为重要的是,这类前沿能力还不足以影响消费者的核心决策。AI手机大概率会导致手机市场短期向好,但还没到能够逆转持续走低趋势的程度。


再向上一层则比较务虚。意图识别、主动服务、服务找人等口号,众多手机厂商都喊了很多年。但真实情况是,最先进的大模型也无法预测人的想法。消费者对AI手机的期待是科幻电影里全能的个人助理。厂商为了促销,也会在话术中将AI手机进行包装和夸大,但最终在可见的范围内,手机行业只能一次次与消费者的预期违背。


顶着这些压力,AI手机还在赶路的途中。从技术体验的角度,它确实还不足以带来颠覆,但从产业发展的角度,AI大模型与手机结合是一个绝佳的战略机遇。海外大模型进不来,谷歌另辟蹊径,苹果龟速发展。AI之于中国手机,多少有了点天命在身的意味。


这是一个前所未有的局面,即使果子还没熟透。对于大多数消费者,也不妨像《乡村爱情》里谢永强经常说的那样——“我得去果园看看”。


·
·

·

脑极体 从技术协同到产业革命,从智能密钥到已知尽头
评论
  • 这篇内容主要讨论三个基本问题,硅电容是什么,为什么要使用硅电容,如何正确使用硅电容?1.  硅电容是什么首先我们需要了解电容是什么?物理学上电容的概念指的是给定电位差下自由电荷的储藏量,记为C,单位是F,指的是容纳电荷的能力,C=εS/d=ε0εrS/4πkd(真空)=Q/U。百度百科上电容器的概念指的是两个相互靠近的导体,中间夹一层不导电的绝缘介质。通过观察电容本身的定义公式中可以看到,在各个变量中比较能够改变的就是εr,S和d,也就是介质的介电常数,金属板有效相对面积以及距离。当前
    知白 2025-01-06 12:04 107浏览
  • 自动化已成为现代制造业的基石,而驱动隔离器作为关键组件,在提升效率、精度和可靠性方面起到了不可或缺的作用。随着工业技术不断革新,驱动隔离器正助力自动化生产设备适应新兴趋势,并推动行业未来的发展。本文将探讨自动化的核心趋势及驱动隔离器在其中的重要角色。自动化领域的新兴趋势智能工厂的崛起智能工厂已成为自动化生产的新标杆。通过结合物联网(IoT)、人工智能(AI)和机器学习(ML),智能工厂实现了实时监控和动态决策。驱动隔离器在其中至关重要,它确保了传感器、执行器和控制单元之间的信号完整性,同时提供高
    腾恩科技-彭工 2025-01-03 16:28 166浏览
  • 在智能家居领域中,Wi-Fi、蓝牙、Zigbee、Thread与Z-Wave等无线通信协议是构建短距物联局域网的关键手段,它们常在实际应用中交叉运用,以满足智能家居生态系统多样化的功能需求。然而,这些协议之间并未遵循统一的互通标准,缺乏直接的互操作性,在进行组网时需要引入额外的网关作为“翻译桥梁”,极大地增加了系统的复杂性。 同时,Apple HomeKit、SamSung SmartThings、Amazon Alexa、Google Home等主流智能家居平台为了提升市占率与消费者
    华普微HOPERF 2025-01-06 17:23 76浏览
  • 光耦合器,也称为光隔离器,是一种利用光在两个隔离电路之间传输电信号的组件。在医疗领域,确保患者安全和设备可靠性至关重要。在众多有助于医疗设备安全性和效率的组件中,光耦合器起着至关重要的作用。这些紧凑型设备经常被忽视,但对于隔离高压和防止敏感医疗设备中的电气危害却是必不可少的。本文深入探讨了光耦合器的功能、其在医疗应用中的重要性以及其实际使用示例。什么是光耦合器?它通常由以下部分组成:LED(发光二极管):将电信号转换为光。光电探测器(例如光电晶体管):检测光并将其转换回电信号。这种布置确保输入和
    腾恩科技-彭工 2025-01-03 16:27 171浏览
  • 每日可见的315MHz和433MHz遥控模块,你能分清楚吗?众所周知,一套遥控设备主要由发射部分和接收部分组成,发射器可以将控制者的控制按键经过编码,调制到射频信号上面,然后经天线发射出无线信号。而接收器是将天线接收到的无线信号进行解码,从而得到与控制按键相对应的信号,然后再去控制相应的设备工作。当前,常见的遥控设备主要分为红外遥控与无线电遥控两大类,其主要区别为所采用的载波频率及其应用场景不一致。红外遥控设备所采用的射频信号频率一般为38kHz,通常应用在电视、投影仪等设备中;而无线电遥控设备
    华普微HOPERF 2025-01-06 15:29 73浏览
  • 物联网(IoT)的快速发展彻底改变了从智能家居到工业自动化等各个行业。由于物联网系统需要高效、可靠且紧凑的组件来处理众多传感器、执行器和通信设备,国产固态继电器(SSR)已成为满足中国这些需求的关键解决方案。本文探讨了国产SSR如何满足物联网应用的需求,重点介绍了它们的优势、技术能力以及在现实场景中的应用。了解物联网中的固态继电器固态继电器是一种电子开关设备,它使用半导体而不是机械触点来控制负载。与传统的机械继电器不同,固态继电器具有以下优势:快速切换:确保精确快速的响应,这对于实时物联网系统至
    克里雅半导体科技 2025-01-03 16:11 175浏览
  • 彼得·德鲁克被誉为“现代管理学之父”,他的管理思想影响了无数企业和管理者。然而,关于他的书籍分类,一种流行的说法令人感到困惑:德鲁克一生写了39本书,其中15本是关于管理的,而其中“专门写工商企业或为企业管理者写的”只有两本——《为成果而管理》和《创新与企业家精神》。这样的表述广为流传,但深入探讨后却发现并不完全准确。让我们一起重新审视这一说法,解析其中的矛盾与根源,进而重新认识德鲁克的管理思想及其著作的真正价值。从《创新与企业家精神》看德鲁克的视角《创新与企业家精神》通常被认为是一本专为企业管
    优思学院 2025-01-06 12:03 73浏览
  • 根据Global Info Research项目团队最新调研,预计2030年全球封闭式电机产值达到1425百万美元,2024-2030年期间年复合增长率CAGR为3.4%。 封闭式电机是一种电动机,其外壳设计为密闭结构,通常用于要求较高的防护等级的应用场合。封闭式电机可以有效防止外部灰尘、水分和其他污染物进入内部,从而保护电机的内部组件,延长其使用寿命。 环洋市场咨询机构出版的调研分析报告【全球封闭式电机行业总体规模、主要厂商及IPO上市调研报告,2025-2031】研究全球封闭式电机总体规
    GIRtina 2025-01-06 11:10 76浏览
  •     为控制片内设备并且查询其工作状态,MCU内部总是有一组特殊功能寄存器(SFR,Special Function Register)。    使用Eclipse环境调试MCU程序时,可以利用 Peripheral Registers Viewer来查看SFR。这个小工具是怎样知道某个型号的MCU有怎样的寄存器定义呢?它使用一种描述性的文本文件——SVD文件。这个文件存储在下面红色字体的路径下。    例:南京沁恒  &n
    电子知识打边炉 2025-01-04 20:04 63浏览
  • 在快速发展的能源领域,发电厂是发电的支柱,效率和安全性至关重要。在这种背景下,国产数字隔离器已成为现代化和优化发电厂运营的重要组成部分。本文探讨了这些设备在提高性能方面的重要性,同时展示了中国在生产可靠且具有成本效益的数字隔离器方面的进步。什么是数字隔离器?数字隔离器充当屏障,在电气上将系统的不同部分隔离开来,同时允许无缝数据传输。在发电厂中,它们保护敏感的控制电路免受高压尖峰的影响,确保准确的信号处理,并在恶劣条件下保持系统完整性。中国国产数字隔离器经历了重大创新,在许多方面达到甚至超过了全球
    克里雅半导体科技 2025-01-03 16:10 122浏览
  • PLC组态方式主要有三种,每种都有其独特的特点和适用场景。下面来简单说说: 1. 硬件组态   定义:硬件组态指的是选择适合的PLC型号、I/O模块、通信模块等硬件组件,并按照实际需求进行连接和配置。    灵活性:这种方式允许用户根据项目需求自由搭配硬件组件,具有较高的灵活性。    成本:可能需要额外的硬件购买成本,适用于对系统性能和扩展性有较高要求的场合。 2. 软件组态   定义:软件组态主要是通过PLC
    丙丁先生 2025-01-06 09:23 66浏览
  • 随着市场需求不断的变化,各行各业对CPU的要求越来越高,特别是近几年流行的 AIOT,为了有更好的用户体验,CPU的算力就要求更高了。今天为大家推荐由米尔基于瑞芯微RK3576处理器推出的MYC-LR3576核心板及开发板。关于RK3576处理器国产CPU,是这些年的骄傲,华为手机全国产化,国人一片呼声,再也不用卡脖子了。RK3576处理器,就是一款由国产是厂商瑞芯微,今年第二季推出的全新通用型的高性能SOC芯片,这款CPU到底有多么的高性能,下面看看它的几个特性:8核心6 TOPS超强算力双千
    米尔电子嵌入式 2025-01-03 17:04 41浏览
  • 本文介绍Linux系统更换开机logo方法教程,通用RK3566、RK3568、RK3588、RK3576等开发板,触觉智能RK3562开发板演示,搭载4核A53处理器,主频高达2.0GHz;内置独立1Tops算力NPU,可应用于物联网网关、平板电脑、智能家居、教育电子、工业显示与控制等行业。制作图片开机logo图片制作注意事项(1)图片必须为bmp格式;(2)图片大小不能大于4MB;(3)BMP位深最大是32,建议设置为8;(4)图片名称为logo.bmp和logo_kernel.bmp;开机
    Industio_触觉智能 2025-01-06 10:43 71浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦