2025 年大模型技术在应用侧的新趋势是什么?哪些新的技术方向值得关注?企业在规划 2025 年数字化项目时有哪些核心关注点?本文将基于爱分析与企业用户、模型厂商的调研交流中,抽象和总结出 2025 年的趋势和洞察,供大家参考。
分享嘉宾|张扬 爱分析 联合创始人兼首席分析师
内容已做精简,如需获取专家完整版视频实录和课件,请扫码领取。
01
2025 年大模型如何赋能企业数字化建设?
从数字化的核心主导方针来看,2025 年已经明确围绕价值创造展开。
宏观环境方面,在今年四季度初时,大家对于政策有良好的预期,但从实际落地的角度来看,很多企业用户、厂商用户从政府侧回款的周期还是比较缓慢,尽管已经有 10 万亿的投放预期,但实际的业务变化以及经营状况的变化,在 2025 年还是缓慢恢复的过程。
所以在 2025 年大家做数字化规划时,应该以创造价值为核心导向,更多的关注业务收益,以及重点关注技术对于业务收益创造有哪些核心点。
大模型2025 年技术趋势
上图左边的技术架构是大模型完整的全链路技术架构,从上层的战略域,到下辖的应用域和管理域,再到基础的框架域、能力域,和与框架域、能力域并行的上下文域,以及最底下的基础设施的计算域。- 第一是战略域,是从整个大模型的技术架构探索的一个新方向。
所谓的快思考和慢思考主要映射的是人体大脑的两个系统,一个是靠直觉,一个是靠推理。直觉系统可以理解为快思考的系统,推理系统可以理解为慢思考的系统。过去大模型的生成能力基本是围绕快思考的方向展开的,类似于利用人脑系统里面的直觉去做。对于要求响应速度快,或者业务场景没有太复杂的企业应用,快思考会比较适合。例如大家现在用的知识库、内容生成、营销素材生成、视频生成等,都适用直觉的快思考的方式。而对于复杂的业务场景,一方面需要有大量的业务 KnowHow 和业务知识,另外一方面也需要有比较完整的思考逻辑,也就是推理逻辑。在过去的大模型应用落地时有很大的欠缺,很多企业也在通过做预训练或者微调尝试弥补专业知识的差距,都属于从框架域和能力域的角度来解决问题。如果以更高维度的战略域角度出发,更多是企业内在逻辑推理过程的理解。不管是用思维链的方式,还是把整个思考推理的逻辑训练到模型里,要远比纯粹的知识训练维度更高。这也就是从ChatGPT 4-o 提出的慢思考过程,在整个企业的大模型技术架构里,不只有直接的推理,还有很多思维链的逻辑推理,这就更适合复杂的业务场景,例如可以用大模型做数据分析背后更加深入的下钻、归因、根因分析,包括潜在的应对解决方案的分析。所以从模型推理的场景角度来看,会因为慢思考的加入,2025 年大模型的应用将逐步深入到企业更加复杂的业务场景里。- 第二是框架域,框架域的两个核心点,一个是Agent,一个是RAG
RAG 在 2025 年核心趋势的判断是 RAG 的工程化会越来越成熟,幻觉的消除更多是时间长短的问题。从消除幻觉的理论基础上是比较容易理解和成熟的,本质是当有理有据的专家知识输入时,模型的幻觉会自然消失。所以在实践落地的过程中, RAG 具体的工程化策略中,消除幻觉是需要长时间且逐步成熟的过程。今年我们看到基于传统 RAG 已经提升到 RAG 2.0,还有 Graph RAG 和新提出来的双层信息过滤框架,这些不同的 RAG 路线,可以理解为不同的工程化策略和手段,这些工程化的策略和手段目前已经很丰富,而且依然不停地有新的工程化路线出来,也意味着这些工程化手段的落地门槛,或者落地工具也会越来越成熟。所以预计在 2025 年末,随着工程化手段的增加和工程化本身的能力提升,基本消除幻觉问题是可以做到的。以及企业用户对于准确性的关注度将会降低,不再是第一位考虑的问题,因为在一些复杂场景里是无法 100% 解决幻觉的,但可能在绝大部分场景里,幻觉将不再是一个问题。多模态的视频模态肯定是 2025 年最核心最大的能力突破。一些大模型厂商、基模厂商的下一步将重点做这个方向,以及 2025 年一些 To C 的新场景迸发出来,基本也是在多模态领域。举个例子,短视频核心的组成元素包括背景音乐、文本脚本、真人表演。目前文本生成已经不成问题,背景音乐从技术能力角度来看,大模型生成的音乐不管是从音乐多样性的风格,还是音乐的成熟度,都已经比较高了,只不过是欠缺一个爆款音乐的出现,所以核心要解决的是自动化生成视频。从 C 端的应用角度来看,一些成熟的视频大厂,以及基模厂商,都将会在 2025 年重点突破和关注这个方向。2025 年消费级AI手机逐步成熟,端侧大模型向企业场景渗透当前端侧大模型的场景出现的比较少,但是从未来的角度来说,尤其是在 2025 年,端侧大模型的渗透会呈现比较明显的增长趋势。原因之一:随着消费场景的变化,2025 年发售的手机将变成 AI 手机。端侧的大模型会成为AI手机的标配,模型量化技术的成熟度在 2025 年会越来越高,尤其是在手机的端侧模型中。原因之二:芯片厂商有足够强的芯片设计适配,目前模型厂商和芯片厂商也有一些比较好的组合方式,正在向手机厂商做端侧模型的输出。第一是一线人员的作业场景。过去人员作业是纸质的,有了手机之后变成移动终端,现在是从移动终端再一次升级成智能终端。第二是在设备作业场景。一线有大量的设备作业场景,跟人员作业的场景逻辑类似,面对设备自身的生产控制、设备自身的维修时,设备自身的智能化能力越强,便可以预见性的提前发现问题,包括生产过程中生产质量的自检,也可以成为端侧模型应用的方向之一。第三是围绕端侧的决策分析。典型的是设备能耗管理,或者车机端的辅助驾驶,或者人工交互展开的角色分析场景,也是比较好的应用方向。总的来说,从人员作业、设备作业和角色分析场景都是 2025 年比较好的应用和突破方向,同时降本的效果也会比较明显。02
2025 年,企业大模型落地趋势
首先是对企业模型支出方面的影响。2025 年会因为大环境的影响,企业IT预算会呈现微降的趋势。但从实际预算的投入项拆分来看,第一个传统的业务系统改造和升级依然是最大的支出项,第二个是国家要求的信创部分也是一大支出,第三个是大模型,也是唯一一个 it 预算正增长的方向。预估 2025 年实际支出的增速能够接近 100% ,做到 238 亿元的级别。从企业点角度会更加看重业务的短期收益,会在大模型软件和服务上占更高比例的投入,而在硬件层面投入会趋于平缓。同时一部分已经完成规划的企业,在大模型支出部分会维持在 5% ~ 10% 的it支出比例,这也可以给到正在做规划的企业一个参考。首先是落地的阶段,在 2025 年处于观望学习的企业不足30%,有 20% 的企业会到试点速赢的阶段,也就是从早期的探索可研到试点速赢的过程中。所以明年将是大模型产品跨越鸿沟的一年,也是比较关键的一年。其次是落地手段,没有太大的变化,大部分企业采取私有化部署开源模型+应用定制开发的落地手段。再从落地目的来看,围绕创造价值展开的增收还是比较困难的,所以最核心的创造价值还是围绕降本和提升利润展开。最后是大模型落地的风险点,当前准确性/幻觉是第一位,但也看到数据和知识质量的关注度有在迅速上升。这些是调研中定性层面的总结,从落地的实际业务场景中,我们核心看到产研和科研场景的价值已得到企业用户认可。产研和科研本来就是企业重点投入的方向,属于知识密集型和资金密集型的典型应用场景,与大语言模型的相关性和适应程度比较高,所以产研和科研是值得企业用户 2025 年重点尝试的场景。企业用户对大模型预期收益会在 2025 年会回归理性。我们调研中,对于已经落地大模型的企业,了解到项目预期收益达成情况中,少部分实现和完全未实现的占比28%,近 1/ 3。这其中可以看到大模型落地的实际价值,与企业用户的预期之间还是有一定差距的,在 2025 年时,这个差距会是比较良性的。同时在 2025 年也会出现一些大模型实际收益没有达到预期的场景案例,这其实对于整个行业的发展还是比较正向和健康的。第一个核心原因是 ROI 的问题,即投入太高以及对应产出太低。例如 10 倍算力的投入支出只带来了 KPI 提升的 10% ,这个就是典型的 ROI 太低的情况。而在 2025 年基本上已经能很稳健地去解决这个问题了,因为基础硬件设施的投入会缩减,企业用户会更注重些能看到立竿见影效果的场景应用,对于大规模、长周期见效的技术设施投入接受度会比较低,所以这是能自然而然随着企业用户对于 IT 预算分布和 IT 预算投项变化而直接能解决的问题。第二个是本地化部署和模型能力之间的掣肘与制约问题。比较典型的是测试的时候,用公有云的模型测试效果不错,但是本地化部署上线的手段会导致模型能力的下降,下降的比例或者下降的程度根据不同的项目有所区别,这是不及企业用户预期的另一个核心原因。而且本地化部署的落地手段不会因为效果不及预期从而发生任何变化,明年以及未来几年都会以本地化部署为导向。从完整的模型效果来讲,30%-40% 是由基础模型决定的,30%-40% 是由 RAG 决定的,剩下的 20%-30% 是由微调决定的。所以随着 RAG 的逐渐成熟,想要改善模型效果,一方面可以利用微调做一些补充,需要等待微调工具链的进一步成熟,这也是改善本地化部署与模型能力掣肘的有效方式。另外一方面是应用工程化的成熟度,随着企业搭建越来越多的应用,通用性会越来越强,可以将模型能力转移到应用中解决,不一定全部依托于模型能力,应用的工程化的、成熟度的提高也能解决预期收益达成的问题,但这个问题可能需要两年甚至三年的时间来长期解决。总的来看,大模型的预期收益会在 2025 年逐渐回归理性。⩓
毕业于清华大学及香港中文大学,杭州市金融科技创新项目应用案例专家评委,原投中集团副总裁。十余年金融行业从业经验,在爱分析媒体平台发文超过 500 篇,有很深的行业影响力。注:点击左下角“阅读原文”,领取专家完整版实录和分享课件。