剖解企业AI大模型建设路径,提升未来核心竞争力

原创 爱分析ifenxi 2024-09-12 11:59




AI大模型时代的到来,让很多企业都感受到了技术发展的魅力,但由于当前大环境,越来越多的企业对于IT的投入会更加谨慎,而根据过往经验,企业落地AI大模型确实会遇到一些问题,本文主要从大模型的建设路径与2个实际案例进行分析。

分享嘉宾|李喆 爱分析合伙人兼首席分析师

内容已做精简,如需获取专家完整版视频实录和课件,请扫码领取。


基于过去一年的交流经验,我们总结出目前企业对于 AI 大模型落地过程中的几个重点关注问题。


1、当前很多应用场景多处于 POC 验证阶段,因为其实际效果和最终收益的不确定性,所以成功落地案例尤为重要且备受关注。

2、落地和建设路径方面有几个问题较受关注,第一,是模型本身,研发能力不足的企业用户,是否自身要去做模型训练?现阶段是否一定要有企业内部专属大模型?第二,如果做训练和微调,现有的数据量是否足够?第三,算力是否需要投入?如果增加算力投入,整体项目预算量级会上升一个级别。第四,如何量化最终收益?第五,是项目可行性问题,大多数企业用户在过去一年都已经做过大模型尝试,准确性、幻觉问题一直存在,如何解决?
3、合规,模型本身是否自主可控?数据是否安全合规?信创要求。
4、选型,现在市面上第一类大模型由互联网大厂,像阿里、腾讯、华为等大厂研发的相关产品。那第二类是专注单点应用的小厂,比如专注于 Agent 平台和 Agent 应用开发。第三,现有垂直供应商。所有企业用户都会关注选型问题,虽然大模型大厂本身技术能力很强,但不一定特别理解企业自身业务场景,而现有的垂直厂商本身技术能力会受到多方质疑,所以选型是重点关注的问题。

建设路径的首要问题是模型本身落地问题,到底需不需要去做模型的训练和微调?

现在两种主要的落地方式,第一种是直接调用通用大模型能力,在上面加些提示词、思维链、外挂知识图谱、内部知识库,用 RAG 的方式实现。

应用层分成两类,1、直接嵌入传统 SaaS 应用或软件中,做个机器人实现,2、应用给到服务团队,比如内容生成、素材生成是非常大的应用场景,面向于营销端,靠服务团队解决,用Agent工具可以降低服务团队的成本,提升效率。用该方式解决幻觉,或者说最后一公里的兜底问题。

第二种落地方式是直接做微调训练或全参数预训练。有些企业选择精调,灌输行业或企业自己的数据集,给到技术大模型,精调后形成行业大模型或垂直大模型,基于之上提供服务,这两种是现在较常见的落地方式。

现阶段更建议选择直接调用大模型,这里有几点原因。第一,整个基础模型的迭代速度非常快,开源模型的能力在持续提升。对于很多场景,基于基础大模型做精调不够经济,花了很多成本和精力后,由于基础模型能力的提升,反而不需要太多精调,从模型本身的迭代速度来看,直接调用的效果与性价比更好。

第二,进行精调或微调的过程中,模型的泛化能力在下降。精调只是把模型在单点任务或特定任务场景能力做提升,但在其他场景的任务能力在下降,这意味着在场景探索和尝试阶段,做精调反而会损失很多能力,探索的可能性效果相对不佳。除非任务场景相对明确,这时通过大模型解决的问题才能够被定义得很清楚,而且一定时间内确定性不会转变,做精调才有价值。

对于大部分企业用户来说,目前处于基于基础模型的迭代和场景探索阶段,我们建议直接调用模型,也就是从模型本身的接入。

RAG 对企业而言是非常好的方式,现在企业面临的大部分场景是基于知识问答向上延伸的,比如设备维修、项目管理等案例,拆解成底层能力,本质上都会用到知识库检索。所以我们认为,RAG 是当前重要的落地实现手段。
大模型准确性很大程度上依赖于知识库,其影响远远大于微调。其中企业专有的知识积累非常关键。但企业具体需要积累哪些知识?因为企业原有的积累知识,很多时候并不能完全满足用户实业需求。
且现在RAG会做非常多工程化工作。比如设置拒答逻辑,让大语言模回答问题之后,完全只从知识库里检索,可以有效减少幻觉现象。包括合规、敏感词现象,都是工程化里较好实现的。
案例一:设备维修场景
简述下案例情况,当维修人员看到了些故障现象,需要根据现象诊断背后原因,同时基于原因给出维修方案和建议,定位更像是设备维修助手,辅助于工程师的场景。

该场景的技术架构底层用了模型与知识库,将知识库变成知识图谱,前端是问答页面,这是整个技术架构。
在实际落地中,案例是比较关键且当前阶段相对缺乏的。在实际跟客户交流的过程中,大家都具有基本的维修标准点检基准书。日常维修时,有一定制造规模的企业都具备工单数据,比如故障记录、巡检日检表等基本信息,但案例方面较为欠缺,案例的构成包括基于故障现象背后的原因及解决方案、维修结果。
大模型在调用知识库时最希望能出现这种案例,但目前大多企业的案例积累相较匮乏,这是接下来要重点积累的,在未来也会成为核心竞争力。
对于知识密集型的场景,资深人员和一般工程师的差别在于资深人员有一套自己的维修方法论,虽然不一定能将其精准表达,但关于维修的内部方法是烂熟于心的。老师傅见到问题多,对应的解决方案见得也多。这部分案例沉淀下来之后,对于设备工程师来说,也就具备了资深工程师的部分能力。
这部分案例对于企业用户非常关键,要持续积累,对于企业用户的长远发展,底层模型的价格在持续降低。案例本身会作为企业积累的专业知识库和内容,是企业未来落地时的核心竞争力,虽然当前阶段可直接调用大模型,但未来大模型技术相对成熟之后,企业开始做训练和微调时,这些案例非常关键。
实践当中大模型可以做案例的积累和反馈,大多企业用户常用的模型基本具备简单的点、采功能,本质上是做案例的反馈,模型可记录好的案例,比如针对某现象的无效维修方案,哪些现象会导致无效结果,反面案例的积累会持续更新底层设备的知识库和知识图谱,模型能力会越用越强。
大语言模型对于传统 NLP 或知识图谱而言,大模型处理非结构化数据的能力更强,可自动化实现案例的处理和沉淀。GRAPH RAG 架构最近的热度很高,该架构本质上是把知识图谱和知识库分开的形式,如果未来能够联动到一起,真正实现自动化处理知识库,形成知识图谱、持续迭代。
目前,企业用户都较关注准确性的问题,大模型与过传统 NLP 有很大的区别,大模型具有有效的反问机制。企业用户基于知识图谱的检索的过程中会遇到多个故障,其中能检测到具体故障的准确率,如果用传统方式,只能以概率最大地去回答结果,结果准确率无法保证。这时如果有反问机制,能够基于底层知识图谱之外确认故障的结果,反问机制是对比传统 NLP 知识图谱的优势。在设备、问数场景,好的方案和案例都能帮助我们解决问题。
案例二:项目助理场景
很多公司都上线项目管理系统,是为了更好地管控项目,保证管理人员日了解项目进度,项目经理可按照项目 SOP 执行,管控流程和项目风险。但实际落地的过程中,对于一线项目经理,可能不愿意填写系统,因为系统的日常工作是填写大量、繁琐的表单,包括定期填写周报、日报文件。但从公司管控角度来说,这又是必要的工作。每次项目经理在结项前,因为公司的要求需要一股脑将信息填进去,所以项目管理系统基本失去了实际价值。

因为大模型擅长处理非结构化数据,客户落地项目经理为了进行交流和沟通,一类通过大量邮件交互,另一类是通过钉钉、飞书群工具。只需要助理快速处理邮件和钉钉群中的信息。一方面自动化将更关注的信息形成项目管理系统需填写的表单和文件,降低重复性劳动。另一方面,其中包含大量信息,信息的查找并不容易,可通过项目助理的交互,定期了解文档、项目的进度与风险点等信息。

对于项目经理来说,能够帮助解答问答、降低劳动工作量、提升效率。从管理人员角度,真实性、时效性比原来有所提升。相对真实地反馈项目进度,数据对于管理人员来说是非常关键的,而系统里会存储时效性强的真实数据。
项目助理背后会挂知识库,可以把项目经理的经验沉淀下,经验本身可以复用到其他项目。同时项目管理系统中的数据是真实的,可以做项目端的洞察,这些都具有价值,所以大模型的落地案例与现有数字化系统是很好的补充。
项目助理类或助理类的 Agent 应用,第一出发点还是认为未来会作为入口,替换原有的数字化系统。但在落地时,我们认为其可行性不高,因为对于业务新人来说,熟悉新系统难度较大,所以当前阶段更好的方式是增强现有系统的能力,真正让一线人员便捷使用数字化系统或过往信息化管理系统,提升使用体验,这意味着可以存储更多真实数据,更真实地反馈实际情况,使系统未来的价值度更高。
大模型擅长非计划数据处理,不擅长做数值计算,所以围绕着邮件、 IM 信息的处理是大语言模型擅长的。案例中体现的更多是对邮件内容的处理,包括加入自动化 RPA 工具,做自动转发,以及对于风险情况自动打标。

基于企业用户的过往经验发现,知识库积累不够的原因有二:

第一点,知识库维护成本高,知识库的知识采集和处理过程,工作量较大,过往无论是用 NLP 或是知识图谱的搭建,有大量规则需要人为衡量,这个难度较大,这是大语言模型擅长的点。

第二,知识库消费场景少。知识库建设好后,如何进行消费,图谱如何投入使用,该场景过往并不清晰,原因在于新员工对于企业内部的很多信息并不清楚,需要查知识库,但对于工龄较久的人来说,知识库里的他更清楚,很少会用到知识库,所以知识库的消费场景过往使不具备的。

但有了大语言模型后,项目经理的知识库创建过程完全自动化,创建和维护的成本大大降低。第二,知识库有了实际应用效果,知识库本身会不断被消费,本身可以持续迭代和更新。通过沉淀知识经验和案例的共享,企业能力会提升,未来也具有更大的应用场景价值,如培训、项目审核等。
本文基于设备和项目助理两个案例介绍,探讨大多企业关注建设路径问题。
第一,现阶段直接调用模型就好,不用训练。
第二,现在最关键的是案例积累,本身需要企业用户找场景上线,因为案例积累是项目上线后,在运行过程当中持续做案例积累。
第三,算力投入方面,当前场景中基本 20B 参数的模型可以解决。
大部分企业直接用公务云模式最好,算力投入很低。并发量不是很大的情况下,算力有 4-8 张 3090 或 4090 的显卡就足够,所以投入其实不是很大。最终收益量化方面,我们建议从提效角度,从节省时间的角度考虑项目可行性、准确性,要用 RAG 的方式提升准确性,这是较好的解决方案。

以上是本次分享的全部内容,如需获取专家完整版视频实录和课件可扫码领取。

长按二维码,领取完整版视频实录和课件

毕业于清华大学,曾任职于亿利集团等上市公司金融事业部,近10年金融与私募股权投资领域分析咨询经验,专注于科技研究,对于云计算、大数据、人工智能等众多领域有着深入的研究与思考。

注:点击左下角“阅读原文”,领取专家完整版实录和分享课件


爱分析ifenxi 爱分析是一家中国领先的数字化市场研究与咨询机构。
评论
  •     为控制片内设备并且查询其工作状态,MCU内部总是有一组特殊功能寄存器(SFR,Special Function Register)。    使用Eclipse环境调试MCU程序时,可以利用 Peripheral Registers Viewer来查看SFR。这个小工具是怎样知道某个型号的MCU有怎样的寄存器定义呢?它使用一种描述性的文本文件——SVD文件。这个文件存储在下面红色字体的路径下。    例:南京沁恒  &n
    电子知识打边炉 2025-01-04 20:04 32浏览
  • 自动化已成为现代制造业的基石,而驱动隔离器作为关键组件,在提升效率、精度和可靠性方面起到了不可或缺的作用。随着工业技术不断革新,驱动隔离器正助力自动化生产设备适应新兴趋势,并推动行业未来的发展。本文将探讨自动化的核心趋势及驱动隔离器在其中的重要角色。自动化领域的新兴趋势智能工厂的崛起智能工厂已成为自动化生产的新标杆。通过结合物联网(IoT)、人工智能(AI)和机器学习(ML),智能工厂实现了实时监控和动态决策。驱动隔离器在其中至关重要,它确保了传感器、执行器和控制单元之间的信号完整性,同时提供高
    腾恩科技-彭工 2025-01-03 16:28 164浏览
  • 车身域是指负责管理和控制汽车车身相关功能的一个功能域,在汽车域控系统中起着至关重要的作用。它涵盖了车门、车窗、车灯、雨刮器等各种与车身相关的功能模块。与汽车电子电气架构升级相一致,车身域发展亦可以划分为三个阶段,功能集成愈加丰富:第一阶段为分布式架构:对应BCM车身控制模块,包含灯光、雨刮、门窗等传统车身控制功能。第二阶段为域集中架构:对应BDC/CEM域控制器,在BCM基础上集成网关、PEPS等。第三阶段为SOA理念下的中央集中架构:VIU/ZCU区域控制器,在BDC/CEM基础上集成VCU、
    北汇信息 2025-01-03 16:01 175浏览
  • 随着市场需求不断的变化,各行各业对CPU的要求越来越高,特别是近几年流行的 AIOT,为了有更好的用户体验,CPU的算力就要求更高了。今天为大家推荐由米尔基于瑞芯微RK3576处理器推出的MYC-LR3576核心板及开发板。关于RK3576处理器国产CPU,是这些年的骄傲,华为手机全国产化,国人一片呼声,再也不用卡脖子了。RK3576处理器,就是一款由国产是厂商瑞芯微,今年第二季推出的全新通用型的高性能SOC芯片,这款CPU到底有多么的高性能,下面看看它的几个特性:8核心6 TOPS超强算力双千
    米尔电子嵌入式 2025-01-03 17:04 23浏览
  • 在快速发展的能源领域,发电厂是发电的支柱,效率和安全性至关重要。在这种背景下,国产数字隔离器已成为现代化和优化发电厂运营的重要组成部分。本文探讨了这些设备在提高性能方面的重要性,同时展示了中国在生产可靠且具有成本效益的数字隔离器方面的进步。什么是数字隔离器?数字隔离器充当屏障,在电气上将系统的不同部分隔离开来,同时允许无缝数据传输。在发电厂中,它们保护敏感的控制电路免受高压尖峰的影响,确保准确的信号处理,并在恶劣条件下保持系统完整性。中国国产数字隔离器经历了重大创新,在许多方面达到甚至超过了全球
    克里雅半导体科技 2025-01-03 16:10 121浏览
  • 本文继续介绍Linux系统查看硬件配置及常用调试命令,方便开发者快速了解开发板硬件信息及进行相关调试。触觉智能RK3562开发板演示,搭载4核A53处理器,主频高达2.0GHz;内置独立1Tops算力NPU,可应用于物联网网关、平板电脑、智能家居、教育电子、工业显示与控制等行业。查看系统版本信息查看操作系统版本信息root@ido:/# cat /etc/*releaseDISTRIB_ID=UbuntuDISTRIB_RELEASE=20.04DISTRIB_CODENAME=focalDIS
    Industio_触觉智能 2025-01-03 11:37 138浏览
  • 在测试XTS时会遇到修改产品属性、SElinux权限、等一些内容,修改源码再编译很费时。今天为大家介绍一个便捷的方法,让OpenHarmony通过挂载镜像来修改镜像内容!触觉智能Purple Pi OH鸿蒙开发板演示。搭载了瑞芯微RK3566四核处理器,树莓派卡片电脑设计,支持开源鸿蒙OpenHarmony3.2-5.0系统,适合鸿蒙开发入门学习。挂载镜像首先,将要修改内容的镜像传入虚拟机当中,并创建一个要挂载镜像的文件夹,如下图:之后通过挂载命令将system.img镜像挂载到sys
    Industio_触觉智能 2025-01-03 11:39 113浏览
  • 根据Global Info Research项目团队最新调研,预计2030年全球封闭式电机产值达到1425百万美元,2024-2030年期间年复合增长率CAGR为3.4%。 封闭式电机是一种电动机,其外壳设计为密闭结构,通常用于要求较高的防护等级的应用场合。封闭式电机可以有效防止外部灰尘、水分和其他污染物进入内部,从而保护电机的内部组件,延长其使用寿命。 环洋市场咨询机构出版的调研分析报告【全球封闭式电机行业总体规模、主要厂商及IPO上市调研报告,2025-2031】研究全球封闭式电机总体规
    GIRtina 2025-01-06 11:10 42浏览
  • 光耦合器,也称为光隔离器,是一种利用光在两个隔离电路之间传输电信号的组件。在医疗领域,确保患者安全和设备可靠性至关重要。在众多有助于医疗设备安全性和效率的组件中,光耦合器起着至关重要的作用。这些紧凑型设备经常被忽视,但对于隔离高压和防止敏感医疗设备中的电气危害却是必不可少的。本文深入探讨了光耦合器的功能、其在医疗应用中的重要性以及其实际使用示例。什么是光耦合器?它通常由以下部分组成:LED(发光二极管):将电信号转换为光。光电探测器(例如光电晶体管):检测光并将其转换回电信号。这种布置确保输入和
    腾恩科技-彭工 2025-01-03 16:27 162浏览
  • 物联网(IoT)的快速发展彻底改变了从智能家居到工业自动化等各个行业。由于物联网系统需要高效、可靠且紧凑的组件来处理众多传感器、执行器和通信设备,国产固态继电器(SSR)已成为满足中国这些需求的关键解决方案。本文探讨了国产SSR如何满足物联网应用的需求,重点介绍了它们的优势、技术能力以及在现实场景中的应用。了解物联网中的固态继电器固态继电器是一种电子开关设备,它使用半导体而不是机械触点来控制负载。与传统的机械继电器不同,固态继电器具有以下优势:快速切换:确保精确快速的响应,这对于实时物联网系统至
    克里雅半导体科技 2025-01-03 16:11 165浏览
  • 本文介绍Linux系统更换开机logo方法教程,通用RK3566、RK3568、RK3588、RK3576等开发板,触觉智能RK3562开发板演示,搭载4核A53处理器,主频高达2.0GHz;内置独立1Tops算力NPU,可应用于物联网网关、平板电脑、智能家居、教育电子、工业显示与控制等行业。制作图片开机logo图片制作注意事项(1)图片必须为bmp格式;(2)图片大小不能大于4MB;(3)BMP位深最大是32,建议设置为8;(4)图片名称为logo.bmp和logo_kernel.bmp;开机
    Industio_触觉智能 2025-01-06 10:43 41浏览
  • PLC组态方式主要有三种,每种都有其独特的特点和适用场景。下面来简单说说: 1. 硬件组态   定义:硬件组态指的是选择适合的PLC型号、I/O模块、通信模块等硬件组件,并按照实际需求进行连接和配置。    灵活性:这种方式允许用户根据项目需求自由搭配硬件组件,具有较高的灵活性。    成本:可能需要额外的硬件购买成本,适用于对系统性能和扩展性有较高要求的场合。 2. 软件组态   定义:软件组态主要是通过PLC
    丙丁先生 2025-01-06 09:23 38浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦