手机厂开卷AI这一年端侧大模型越做越小?

原创 科创板日报 2024-10-11 19:46

30亿参数端侧模型有望成为标配。在云端大模型方面,百亿以下的模型对手机厂商极为有价值。AI会催生出全新的硬件品类,vivo等手机厂商均有计划推出眼镜产品。

作者 | 黄心怡

从2023年下半年,AI大模型就开始席卷手机圈。vivo、OPPO、华为、荣耀等国内手机厂商都在生成式AI上发力。
经过一年多的发展,多名业内人士告诉《科创板日报》记者,相比去年,如今云端运行大模型的成本已经大幅度下降,大规模的端侧普及也对降本起到了更多作用,越来越多的功能可以在端侧进行。同时,端侧模型的尺寸越来越小,30亿参数端侧模型有望成为标配。而在云端大模型方面,百亿以下的模型对手机企业极其有价值。
此外,AI有望催生出全新的硬件品类,特别是智能眼镜备受瞩目。除了华为、荣耀、小米已入局外,《科创板日报》记者在采访中了解,vivo也在计划推出眼镜产品
不过当前AI功能尚不成熟,现如今就AI会加速智能手机的更换周期或许为时过早。但从长期来看,未来10年将会是一场真正的革命。
百亿以下模型极其有价值
当前,AI已成为手机厂商新机的亮点。把大模型装进手机,尤其是在旗舰机型上,AI已经是必备要素。
今年9月,首次搭载AI功能的iPhone 16正式发布,采用30亿参数端侧模型、自研云端大模型,以及与OpenAI合作接入的外部GPT模型相结合的模式。
在刚刚结束的vivo开发者大会上,vivo也发布了30亿参数量级的蓝心端侧大模型3B,并升级了千亿级蓝心云端大模型,蓝心语音大模型、图像大模型以及蓝心多模态大模型首次亮相。
谈及对AI的投入,vivo AI全球研究院院长周围在接受《科创板日报》记者采访时表示,会重点瞄准两千亿以下的云端模型,以及把端侧模型做到领先,把百亿模型做到独具特色,千亿以上的大模型则会考虑和第三方厂商合作
“我们把大模型分为三个类别,第一是百亿及以下,第二是两千亿以下,第三是两千亿以上的。从投资的角度来看,这分别是两千张卡、一万张卡、N万张卡的投资边界。像我们这样的公司,可能一年花30亿、组建一万张卡的训练集群是上限。”
周围认为,对于手机企业而言,百亿以下的模型极其有价值。“像图像识别、声音识别、审核模型、PhoneGPT等都是百亿模型。千亿模型是云端的中控模型,大概可以达到大学生的水平。千亿以上则适用于一些复杂的场景,像大领域的应用等等,我们不会碰这些。”
大模型落地手机的成本大幅下降
要把大模型装进手机,面临着算力、内存、存储容量以及电池密度等各方面的瓶颈,导致其大模型参数量最高在百亿规模。去年,vivo曾实现了130亿蓝心大模型的端侧跑通,但这也对手机内存有较大的占用。如何进一步把模型做小,已成为手机厂商的探索方向。此次vivo就发布了尺寸更小的30亿端侧大模型3B。
“去年我们发布了70亿、130亿的大模型,经过极致量化压缩之后,70亿大模型仍要占用户3.5GB的存储空间。所以当时并没有把模型强行内置到系统中,而是给用户提供了可下载和可卸载的选择。今年尺寸更小的3B端侧大模型,占用1.5G的内存。因此,这次我们会内置到接下来旗舰机型的OriginOS 5之中。”vivo AI系统中心高级总监熊官敬介绍。
值得一提的是,苹果首款AI手机也选择了端侧30亿参数大模型。
熊官敬表示,3B模型已可以满足很多场景下的需求。“在通话、录音、输入法各个地方都能用。从大模型榜单上来看,3B模型PK之前的6B和7B都没问题。”
在去年的采访中,周围曾透露云端运行大模型的成本非常高:“vivo有3亿中国大陆用户,如果每天用10次,一天的运算成本大概是3000万元,一年需要花费约90-100亿元。”
在此次采访中,周围直言,随着各家大模型厂商相继降价,云端大模型的成本已经大幅度下降。不过,对降本起到更多作用的是大规模的端侧普及
“今年我们有十几个、数十个功能都端侧化了,以后可能闲聊、识别、决策、执行全部都端侧化了。所以我们不浪费钱,费的是电。”
AI必将催生新的智能品类
除了手机以外,AI在眼镜等新兴终端的落地备受关注。IDC数据显示,2024年一季度全球AR眼镜出货量为10万台,同比增长56%;智能眼镜出货量为26万台,同比增长217%;另据IDC数据,2024年上半年,国内AR、ER市场共出货12.2万台,同比增长79.2%。去年9月,Meta与雷朋合作推出的Ray-Ban Meta智能眼镜在当前已成为全球智能眼镜领域内的爆款单品,第三方数据显示,其销量已突破100万台。
周围认为,AI会催生出全新的硬件品类。未来,vivo也计划推出眼镜产品。
“vivo本来就在做眼镜。我们去年给国家无障碍环境展示馆给盲人做导览,用的是vivo手机,但后来发现放在眼镜上的体验更好。我们和合作伙伴也在谈做软件和系统的支撑,用的是蓝河操作系统。但至于今年还是2025年或者什么时候出来,还不知道。这要看产品的成熟度,而且我们也希望行业有成功案例之后,才会有商业上的动作。”
谈及大模型在AI眼镜的落地,IDC中国研究总监潘雪菲认为,就音频AI眼镜来看,目前端侧落地大模型还是有相当长的时间。“考虑到佩戴舒适度,音频眼镜在体积和人体工学设计上对芯片体积和空间设计要求较高,可能会有一些小型模型在端侧本地运行,比如几个播放暂停接打电话等简单语音包,可以落在本地。”
AI驱动的换机潮何时到来?
当前生成式AI技术尚未成熟,对于AI手机元年何时带来的换机潮,业内也有争论。
近期,受到iPhone 16系列预购销量下滑影响,美国知名投资银行杰富瑞的分析师艾迪森·李将苹果股票评级从“买入”下调至“持有”,理由是担心人们对其新款支持AI功能iPhone的预期过高。
艾迪森表示,智能手机硬件目前还不够先进,无法满足高科技人工智能分析师和iPhone 消费者所期望的水平。他认为,对iPhone 16甚至17的高期望并不现实。因为缺乏实质性的新功能,人工智能覆盖范围有限,这意味着高市场预期(5%-10%的销量增长)不太可能实现。
艾迪森在报告中写道,“智能手机与人工智能服务器不同,缺乏高速内存和先进的封装技术,从而限制了它们的人工智能能力。现在就期待AI会加速智能手机的更换周期还为时过早。”艾迪森称,像苹果这样的制造商还需要两到三年的时间才能开发出能够顺利运行AI软件的智能手机硬件。
IDC中国研究经理郭天翔对《科创板日报》记者表示,很多国家地区苹果的AI功能依然不能使用,这导致对消费者的吸引力有限。此外,AI智能手机的杀手级应用还没出现,消费者不会因为智能手机有了足够好的NPU(芯片)主动购买。
大多数消费者并不真正知道他们使用AI可以做什么。今天的AI智能手机超级周期更多是由手机厂商推动。但这符合新技术进入市场的规律。AI智能手机的普及已经开始,就像功能手机过渡到智能手机一样,第一步往往是科技公司主动吸引消费者购买体验。”
郭天翔表示,如今智能手机渗透率已经很高,某些地区超过90%,但智能手机出货量仍旧有所增长。“每个人都会因为新功能购买下一代iPhone、三星、小米或者其他品牌设备。所以首批用户应该是传统智能手机消费者更换AI智能手机。目前依然处于开始阶段。并不知道未来5到10年AI智能手机会给我们带来什么。”
郭天翔认为,乐观来看,未来10年将会是一场真正的革命,大多数消费者将找到真正有用的杀手级应用。IDC预计,到2028年,全球超过70%的智能手机都将支持人工智能或者生成式AI。
周围也对长期发展保持乐观。对于何时AI才能带来翻天覆地的销量变化,周围认为要保持平常心对待。
“现在还有一些功能要有云端的支持,但端侧化的演进非常快。预计到2027年,整个端侧的算力,可能就会很好地支撑今天演示的那些自动执行的能力。所以,我认为到时会发生很大的变化。当然,可能也不用等到那个时候,随着后续新机的发布,估计明年就会有强烈的感知。”





推荐阅读







科创板日报 国内首个专注科创板、创投及TMT等领域的新锐媒体,致力于打造领先、专业、权威的科创信息服务平台。
评论
  •         在上文中,我们介绍了IEEE 802.3cz[1]协议提出背景,旨在定义一套光纤以太网在车载领域的应用标准,并介绍了XMII以及PCS子层的相关机制,在本篇中,将围绕IEEE 802.3cz-MultiGBASE-AU物理层的两个可选功能进行介绍。EEE功能        节能以太网(Energy-Efficient Ethernet)是用于在网络空闲时降低设备功耗的功能,在802.3cz的定义中,链
    经纬恒润 2024-12-19 18:47 78浏览
  • 随着工业自动化和智能化的发展,电机控制系统正向更高精度、更快响应和更高稳定性的方向发展。高速光耦作为一种电气隔离与信号传输的核心器件,在现代电机控制中扮演着至关重要的角色。本文将详细介绍高速光耦在电机控制中的应用优势及其在实际工控系统中的重要性。高速光耦的基本原理及优势高速光耦是一种光电耦合器件,通过光信号传递电信号,实现输入输出端的电气隔离。这种隔离可以有效保护电路免受高压、电流浪涌等干扰。相比传统的光耦,高速光耦具备更快的响应速度,通常可以达到几百纳秒到几微秒级别的传输延迟。电气隔离:高速光
    晶台光耦 2024-12-20 10:18 125浏览
  •         不卖关子先说感受,真本书真是相见恨晚啊。字面意思,见到太晚了,我刚毕业或者刚做电子行业就应该接触到这本书的。我自己跌跌撞撞那么多年走了多少弯路,掉过多少坑,都是血泪史啊,要是提前能看到这本书很多弯路很多坑都是可以避免的,可惜这本书是今年出的,羡慕现在的年轻人能有这么丰富完善的资料可以学习,想当年我纯靠百度和论坛搜索、求助啊,连个正经师傅都没有,从软件安装到一步一布操作纯靠自己瞎摸索,然后就是搜索各种教程视频,说出来都是泪啊。  &
    DrouSherry 2024-12-19 20:00 87浏览
  • You are correct that the length of the via affects its inductance. Not only the length of the via, but also the shape and proximity of the return-current path determines the inductance.   For example, let's work with a four-layer board h
    tao180539_524066311 2024-12-18 15:56 128浏览
  • 沉寂已久的无人出租车赛道,在2024年突然升温了。前脚百度旗下萝卜快跑,宣布无人驾驶单量突破800万单;后脚特斯拉就于北京时间10月11日上午,召开了以“We,Robot”为主题的发布会,公布了无人驾驶车型Cybercab和Robovan,就连低调了好几个月的滴滴也在悄悄扩编,大手笔加码Robotaxi。不止是滴滴、百度、特斯拉,作为Robotaxi的重磅选手,文远知行与小马智行,也分别在10月份先后启动美股IPO,极氪也在近日宣布,其与Waymo合作开发的无人驾驶出行汽车将大规模量产交付,无人
    刘旷 2024-12-19 11:39 140浏览
  • 汽车驾驶员监控系统又称DMS,是一种集中在车辆中的技术,用于实时跟踪和评估驾驶员状态及驾驶行为。随着汽车产业智能化转型,整合AI技术的DMS逐渐成为主流,AI模型通过大量数据进行持续训练,使得驾驶监控更加高效和精准。 驾驶员监测系统主要通过传感器、摄像头收集驾驶员的面部图像,定位头部姿势、人脸特征及行为特征,并通过各种异常驾驶行为检测模型运算来识别驾驶员的当前状态。如果出现任何异常驾驶行为(如疲劳,分心,抽烟,接打电话,无安全带等),将发出声音及视觉警报。此外,驾驶员的行为数据会被记录
    启扬ARM嵌入式 2024-12-20 09:14 84浏览
  • 百佳泰特为您整理2024年12月各大Logo的最新规格信息。——————————USB▶ 百佳泰获授权进行 USB Active Cable 认证。▶ 所有符合 USB PD 3.2 标准的产品都有资格获得USB-IF 认证——————————Bluetooth®▶ Remote UPF Testing针对所有低功耗音频(LE Audio)和网格(Mesh)规范的远程互操作性测试已开放,蓝牙会员可使用该测试,这是随时测试产品的又一绝佳途径。——————————PCI Express▶ 2025年
    百佳泰测试实验室 2024-12-20 10:33 96浏览
  • 耳机虽看似一个简单的设备,但不仅只是听音乐功能,它已经成为日常生活和专业领域中不可或缺的一部分。从个人娱乐到专业录音,再到公共和私人通讯,耳机的使用无处不在。使用高质量的耳机不仅可以提供优良的声音体验,还能在长时间使用中保护使用者听力健康。耳机产品的质量,除了验证产品是否符合法规标准,也能透过全面性的测试和认证过程,确保耳机在各方面:从音质到耐用性,再到用户舒适度,都能达到或超越行业标准。这不仅保护了消费者的投资,也提升了该公司在整个行业的产品质量和信誉!客户面临到的各种困难一家耳机制造商想要透
    百佳泰测试实验室 2024-12-20 10:37 138浏览
  • ​本文介绍PC电脑端运行VMware环境下,同时烧录固件检测不到设备的解决方法。触觉智能Purple Pi OH鸿蒙开发板演示,搭载了瑞芯微RK3566芯片,类树莓派设计,Laval官方社区主荐,已适配全新OpenHarmony5.0 Release系统!PC端烧录固件时提示没有发现设备按照各型号烧录手册中进入loader模式的操作方法,让开发板连接到PC端。正常来说开发板烧录时会显示“发现一个LOADER设备”,异常情况下,会提示“没有发现设备”,如下图所示: 解决步骤当在烧录系统固
    Industio_触觉智能 2024-12-18 18:07 79浏览
  • 由于该文反应热烈,受到了众多工程师的关注,衷心感谢广大优秀工程师同仁的建言献策。特针对该技术点更新一版相关内容! 再次感谢大家的宝贵建议!填充铜(Solid Copper)和网格铜(Hatched Copper)是PCB设计中两种不同的铺铜方式,它们在电气性能、热管理、加工工艺和成本方面存在一些区别:1. 电气性能:填充铜:提供连续的导电层,具有极低的电阻和最小的电压降。适合大电流应用,并能提供优秀的电磁屏蔽效果,显著提高电磁兼容性。网格铜:由于铜线之间存在间隔,电阻相对较高,电压降也
    为昕科技 2024-12-18 17:11 133浏览
  • 在强调可移植性(portable)的年代,人称「二合一笔电」的平板笔电便成为许多消费者趋之若鹜的3C产品。说到平板笔电,不论是其双向连接设计,面板与键盘底座可分离的独特功能,再加上兼具笔电模式、平板模式、翻转模式及帐篷模式等多种使用方式,让使用者在不同的使用情境下都能随意调整,轻巧灵活的便利性也为多数消费者提供了绝佳的使用体验。然而也正是这样的独特设计,潜藏着传统笔电供货商在产品设计上容易忽视的潜在风险。平板笔电Surface Pro 7+ 的各种使用模式。图片出处:Microsoft Comm
    百佳泰测试实验室 2024-12-19 17:40 164浏览
  • //```c #include "..\..\comm\AI8051U.h"  // 包含头文件,定义了硬件寄存器和常量 #include "stdio.h"              // 标准输入输出库 #include "intrins.h"         &n
    丙丁先生 2024-12-20 10:18 79浏览
  • 户外照明的“璀璨王者”,艾迈斯欧司朗OSCONIQ® C3030降临啦全球领先的光学解决方案供应商艾迈斯欧司朗(瑞士证券交易所股票代码:AMS)近日宣布,推出新一代高性能LED——OSCONIQ® C 3030。这款尖端LED系列专为严苛的户外及体育场照明环境而设计,兼具出色的发光强度与卓越的散热效能。其支持高达3A的驱动电流及最大9W的功率输出,以紧凑扁平封装呈现卓越亮度和可靠性,确保高强度照明持久耐用且性能出众。应用领域01体育场及高杆照明OSCONIQ® C 3030以卓越的光通量密度、出
    艾迈斯欧司朗 2024-12-18 14:25 136浏览
  • By Toradex秦海1). 简介为了保证基于 IEEE 802.3 协议设计的以太网设备接口可以互相兼容互联互通,需要进行 Ethernet Compliance 一致性测试,相关的技术原理说明请参考如下文章,本文就不赘述,主要展示基于 NXP i.MX8M Mini ARM 处理器平台进行 1000M/100M/10M 以太网端口进行一致性测试的测试流程。https://www.toradex.com
    hai.qin_651820742 2024-12-19 15:20 138浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦