随着AI大模型时代的来临,企业需要聚焦降本增效,将数字化策略与战略经营目标对齐,激活非结构化数据价值,实现业务流程创新与自动化。这其中有哪些值得关注的落地应用成果,企业又该在当下时代做好大模型规划与建设?
本文整理自爱分析创始人&CEO金建华在“智进·AI 2024网易数智创新企业大会”上的分享,并结合爱分析在过去两年的企业客户咨询和大模型建设项目经验,为企业提供AI大模型时代的数字化趋势洞察和高价值场景落地实践案例。
分享嘉宾|金建华 爱分析创始人&CEO
内容已做精简,如需获取专家完整版课件,请扫码领取。
AI大模型时代的企业数字化趋势洞察与落地实践,其实前面再加一个百年变局,要从当前面临整个宏观环境下,结合企业自身战略和经营目标去考量,怎么开展数字化工作?作为企业一把手接下来的工作重心在哪里?应该在哪里?这里面增加了两个很重要的变量,一个是宏观环境和企业经营目标,第二个很重要的变量,就是AI大模型技术不断迭代,在很多企业落地实践。简单讲一下宏观环境,对所有企业来讲都是一样的,重点在影响企业经营层面,太大的不讲了,分享几组事实和数据,无论是央国企还是民企,面临的问题是什么问题?第一是中央企业,从2023年开始重点考核的是“一利五率”,一利五率里面的“一利”本质上讲是企业经营效益,就是利润总额、净利润协同增长。国资委近期公布的上半年央企经营情况,利润总额今年上半年增长是1.9%,营业总收入增长没有公布,我们大概判断是没有太多增长。第二是国资国企,从二十大三中全会决议里面看,定义是“做优做强做大”,把“做大”放到了最后,也就是说不追求规模的继续增长,重点追求是利润提升,利润提升的背后就是效率怎么提升上去,成本怎么降下来。近期财政部公布的今年上半年国资国企大概营业总收入增长1.9%,但是利润总额增长是-0.6%。最后看下中国最优秀企业群体,A股全体上市公司,今年上半年所有财报出来之后,大概五千多家,今年整体营业收入增长-1.41%,归母净利润整体增长-2.37%。如果把央国企及金融企业刨除,剩下的就是民营企业,估算一下民营企业的增长,不论是营收还是利润,应该都不会特别好看。所以无论是央国企还是民营企业,面临的问题都是在营收增长乏力或无望时,如何降本增效,怎么提升企业经营效益,提升净利润水平。回到数字化工作。我们讲,企业数字化建设必须跟企业战略和经营目标对齐,如果不对齐的话数字化工作跟领导层关心的工作就脱节,一脱节工作就无效。按照这个逻辑下来,数字化建设真正要关心的问题是如何为企业创造价值,尤其是重点关注业务收益。另外一个变量是AI,尤其是大模型技术,能力在不断迭代增强,也在不少企业内部落地,那么AI大模型对企业数字化建设的影响会是什么?
上图右侧,是企业数字化战略和愿景地图。数字化必须跟企业业务目标、财务目标对齐,中间这层是数字化更好地支撑和重塑企业业务,最底下是建立全新的数字化能力。从长远考虑,企业必须把整个IT、数字化团队作为一项企业级能力去建设,不能只当成一个一个项目去建设。CIO应该成为董事长的左膀右臂,最终给企业提供的价值,是建立起为企业实现持续竞争优势的一系列能力,这些能力包括技术能力、数据能力,基于数字化敏捷运营能力,以及组织和文化等。这些数字化能力建设背后,AI大模型技术在逐渐渗透过程中,我们总结了一下有四点现在看得到的影响:第一,数据层面。传统AI更多是用好结构化数据,在大模型技术逐渐成熟落地的过程中,大模型可以更好更大的激发企业内部大量的非结构化数据,比如研发生产性企业的图纸、设计和知识类文档,这些知识在传统AI时代没法用,大部分靠人去用,没法用到模型里面,大模型来了之后企业内部大量非结构化数据能够得到激活和有效的应用,反过来能更好促进数据在企业内部持续沉淀产生价值。第二,技术层面,我们认为大模型将逐渐具备更强的自学习、自进化能力。传统AI相对来讲算法模型比较固定,而且都是单点,更多的起辅助作用,AI大模型将更高程度上提升决策能力,帮助企业获得更高精度的洞察和决策,提升决策效率和业务价值。
第三,流程层面,我们预期大模型将对业务流程逐渐实现更大程度上的创新和自动化,这个跟传统数字化或AI差别比较大。传统数字化无论是ERP、CRM、OA系统,是基于某一类企业的最佳实践固化为流程或系统后,组织和人本身要去适应系统,这过程有个较大的改造成本。大模型将具备较强的流程创新和自动化能力,让业务流程适应组织,而不是让人和组织去适配系统,这也是未来会有比较大改变的地方。第四,体验层面,大模型的泛化能力,无论是营销的千人千面,还是智能问答,无论是面向消费者,还是企业员工,能够提供高度个性化产品和服务,跟传统AI时代差别也比较大。这四点只是我们实践中的总结,AI大模型在企业内部渗透过程中,它的价值应该会越来越多。第二部分简单介绍一下我们持续跟踪调研的企业,他们在企业内部落大模型的反馈。这个调研从2023年上半年开始做,一到两个季度会滚动一次,这里面企业样本绝大部分收入规模在百亿级别以上,样本量大概有近200家。
左上角分了四个落地阶段,到目前为止,已经有2/3调研企业采纳了大模型,开始在企业内部做探索、试点,去年同期调研时,我记得有50%以上处于观望学习阶段,我自己当时见了很多IT总和CIO,确实有大量CIO对大模型没有那么感冒,比较极端的一个说法是,估计大模型差不多两三年就凉了,跟元宇宙一样,一阵风而已。当时认为大模型跟元宇宙概念差不多,我估计大有人在,现在看起来远远不是。左下角是落地方式,分成三类:标准软件、应用定式、模型定式。在这个里面有两个结论,第一个结论是,大部分企业落大模型时,采用私有化部署开源模型,做应用开发,大概有60%多;另一个比较重要的结论是,模型定制,也就是对基础模型进行预训练或微调的占比比较低,我们大概统计也就十来家,而且这十来家每年IT预算投入很高,大央企为主,这是落地的情况。右侧是关于应用大模型目的和场景,调研结果第一是降低运营成本,这个结论跟实际企业的经营目标和面对的宏观环境的情况是一致的;第二是产品与服务体验创新,大家更期望在面客场景产生价值,而不仅仅是内部知识库、内部客服等。右侧是应用场景,应用场景分成两大类,一类是类似于像知识库和数据分析,例如ChatBI,一般企业讲问数会讲多一点,这两类是目前在落大模型的过程中最主要的两个方式,另外还有一个智能体Agent,目前普及、渗透的越来越多。从职能部门需求来看,销售、营销还是大家最关心的场景。此外比较重要的是研发场景,研发占了40%,我们调研了很多无论是大型民企,还是央国企,对大模型的预期在研发生产环节,不仅仅是在通用的职能部门,类似化学品、药物等研发,有大量知识积累,非结构化数据量很大,对人的经验和知识依赖度很高,这个场景可以把大模型能力发挥的比较好。这说明有很多企业对大模型在某些层面的能力预期还是比较高的。
关于大模型的行业层面的落地进展,简单结论,能源、金融落地比较快。为什么?第一,预算相对比较多,所以在能源和金融行业落的相对比较快。第二,整体数字化基础设施做得比较好,原来系统建设、数据能力建设做的比较领先,或者比较系统。制造业在调研过程中排的不是很靠前,不过,我们认为接下制造业是预期比较重要的行业。首先业务相对比较稳定和成熟,不会像互联网企业一样变化很快,第二,制造业沉淀了大量的非结构化数据,这些数据原来没法用上,经验、知识这些东西都在人身上,对人身上的知识、经验依赖比较多,无论是知识沉淀,还是企业在人脑子里面的经验怎么变成企业自身的能力,这也是制造业很重要可以落大模型的动力。第三,制造业原来做了很多传统AI小模型的渗透和尝试,有比较好的基础。看到像设备维修、项目管理、安全生产等领域里面,这些场景都在落一些项目。这些项目整体预算投入不是特别高,大概在百万级别。在不同场景中,大模型能力和实现价值有较大差别。如果讲的更直观一点,一种类型叫辅助、增强类智能,另外一种是偏决策类的,或者我们叫自动化智能,所以这两类目前看大部分还是偏辅助类的为主,决策类、自动化类相对来讲落地探索过程还是有一定的时间,像我们看到的电力仿真系统、智能排查中,比如电网在落,不确定什么时候落地为成功案例或者最佳实践。前面场景里面,巡检、客服、维修、售前咨询这些都相对成熟,有成功案例。
第三部分讲一下落地怎么落,落的过程中面临的挑战。挑战很多,只要开始考量这个事情问题就一大堆。第一个问题一般会问,业务收益在哪里?第二个问题是跟领导要了预算,领导被朋友圈忽悠了一通,对大模型落地充满了很高的期待,怎么管理好领导预期?短期投入和效果,以及企业长期建立起来能力之间,如何平衡?第三个问题会问,如果在这个场景下落项目,有没有成功案例?同业里面有没有做的特别好的,在类似的行业里面有没有成功的,成功之后效果怎么样?后面是我们的实践总结,给出了一定的建议供大家参考。
从落地方式来看有两种,一种是能力建设,一种是应用建设。能力建设针对年预算在几十亿级别的,一般是大型央企,相对投入预算比较大,建设周期也比较长。应用建设适合绝大部分企业,绝大部分都是基于开源大模型再调用,要不然直接用API。应用建设相对来讲短期内投入成本会比较低,无论花大几十万、上百万,相对来讲压力不会那么大,同时周期比较短,在几个月周期里面会看到一些效果,要管理好上面领导的预期,不要让他们预期太高。譬如ChatBI问数,理论上来讲第一期上线后,准确率不会超过80%,70%-80%准确率是大概的区间,要花一定时间去调优,从80%逐渐提升到85%、90%。我们讲应用建设是绝大部分企业可以采取的落地方式。能力建设的技术架构,重点讲几点:
第一,企业做大模型能力建设,不建议拿千亿级模型做预训练或者微调。逻辑比较简单,第一,无论开源闭源,基础模型的能力还在不断迭代增强。大家知道GPT5还没出来,但是现在已经有风声了,GPT5的能力大概是4的几百倍,至少是几十倍,包括它的框架和学习效率也在不断优化。所以,大模型能力迭代还处于高频的周期里面,这个不合适去训练,训练的成本太大了。第二,模型训练或者微调完了成果很难复用,不同的场景和不同的业务场景,甚至不同的场景里面最后效果差别很大。第三,SFT所需算力高,对于央国企来讲,本地化算力稀缺。此外,如果企业拿百亿级参数模型作为能力建设基础,我们也不建议做,毕竟百亿参数级模型的能力边界和可拓展性较差。关于中间层。一般情况下企业做应用建设,A场景做的过程中会用到Agent,B场景会用到知识工程工具,我们还是建议在多场景的应用建设时,逐渐把中间层三件套进行统一建设,如果分开建设的话问题跟原来做烟囱式的问题是一样的,每个系统都要各自的数据积累,到时候上面还要重新架构一个中台,这个看怎么考量,短期内就想做统一建设,还是先做一两个场景再考虑,这是企业内部自身考虑的。关于应用建设。怎么落?首先考虑场景规划,做场景规划的过程中有两点要做:
第一,建议企业内部先做场景地图,基于业务流程、客户旅程或职能部门进行场景拆解,同时去一线做调研、访谈,跟业务部门、领导、基层管理人员、员工尽量多交流,找到实际业务过程中碰到的问题、痛点。调研完了之后大概会圈出一些比较重要的场景,在这个过程中做两个评估,一个是业务收益评估,另外是技术可行性评估。技术可行性、业务收益评估,不同人有不同的视角,最后数值相差很大,建议组建跨部门小组,必须有业务部门领导和业务骨干、业务专家,必须有高层领导级别的人,同时有IT技术专家,或者引入外部专家。这个过程中虽然是看起来比较简单,核心是对齐管理层、业务部门和IT部门的共识,本质是通过一套方法流程,让大家共同认为这个事很重要,确认场景的优先度。业务收益评估和技术可行性评估里面有很多方法,今天就不展开讲了。技术成熟度里面还是适当考量行业成功案例或者最佳实践,我觉得这个是很有必要的,但有些是探索性的,比如今年有500万预算,其中500万里面有两三百万允许承担一定风险,我觉得有些探索性的方案可以去落。
应用建设里面还有一个比较重要的,业务收益怎么设定,也就是把这个项目跟领导汇报时,如何获得领导层的支持,如何把这个项目收益跟业务部门讲清楚,让业务部门支持你,同时跟一线员工讲清楚,业务收益设定这个事是项目准备建设时怎么让大家重视这个项目,一起把这个项目往前推,更好地落地。实际项目怎么做和怎么去设定不一定完全一致。第一个是业务流程,一般建议做项目业务收益的时候,原则上来讲,端到端的业务流程是最有效的,但是实际在落的过程中,很难把完整端到端的流程打通,作为试点或第一期,很可能是某一个环节开始,这是能源类的央企,设备检修有六个点,比如修复排障方案,这是第一个点,因为这个点在试点里面效果最好,但是跟业务部门和领导讲这个项目产生业务收益的时候,要把完整端到端的价值讲清楚,不能讲一个,讲一个他觉得这个没有什么价值,原来方案要用手写的或者原来就有,只是让机器人调取出来,或者把不同的方案整合一下出来一个结果,觉得没有什么用,只有把端到端的方案讲清楚,才能得到上面领导和业务部门的支持,这个工作很重要。第二个,一般在找场景和定项目过程中,项目终端用户是谁很重要,第一类是管理层,第二类是业务部门负责人,第三类是一线的执行团队,按照项目收益价值度来排序,职位越高价值率越高。比如数智董事会,为了让领导重视,所以把场景筛到董事会场景,每年有大量的议案和投资决策,有大量合规性的问题,对于董事长和董事领导们来讲是手头最重要的,所以这个项目推起来很容易。第三个,讲人效的问题。以能源企业来讲,设备点检、巡检场景会分为前、中、后不同的团队,点检、巡检是在前台现场,中间有中控部门,主要去做工单的分发,后台是工程师、技术专家。前台人员会很多,巡点检的人员上万,中台只有几百人,后台人更少一点,大模型在设备维修场景里面起到的作用是直接服务几万一线员工,尤其是现场员工,这是第一点,第二点企业业务业务扩张,但同时配备的前中后台人员降低,人效明显提升,这是关于业务收益怎么设定的问题。应用建设的时候要不要训练,其实结论是很清楚的,如果预算很充足,就训练基础模型,一般情况下建议直接调用基础上做应用建设。
关于应用建设中,如何提升准确率和安全合规。绝大部分业务场景下,大家对问答结果的准确性和安全合规的要求都很高,大模型本身天生有幻觉,有很多不可解释的过程,我们不建议通过微调。目前比较有效的方案是,通过RAG技术实现。最后讲一下大模型应用如何推广。大模型技术在推广中有很多阻力,其中很多一线员工担心自己会被革掉,所以天然会抗拒,业务部门负责人也有这样的问题,绝大部分大企业里面都会有地盘意识,这是很现实的问题,不仅仅在项目建设之后考量推广的问题,更多在前期就应该把业务部门一起拉进来参与到建设过程中,参与到最后采纳推广过程中。
这些问题现在碰到的企业相对不是特别多,大部分在做试点,有些稍微有点意识的,相对比较传统的企业这些问题特别明显,发现一些部门和一线员工不配合,哪怕获得了领导的支持也没用。具体怎么解决,分成几个层面:提高用户接受度、设计可复用方案、构建大模型项目驾驶舱、塑造AI文化。
第一,领导站台。高层领导在公开场合支持标杆项目,并予以肯定,强调为什么大模型项目对于公司如此之重要。第二,“雷锋”传递。从业务部门视角,设计有感染力的故十,一定是有情感、有画面干的故事,而非客观、冷冰冰的说明。同时在外部找一些专家一起,也许会更好。第三,效果测量。定期披露标杆项目运行情况与业务收益,并公开予以激励。项目的日活、月活等运行数据与业务收益同样重要。第四,能力建设。建设培训体系,确保业务部门具备基础知识与技能。讲一个案例,在组织内部找到雷锋后,业务调研阶段就要参与进来,同时把HR资源调动起来。HR作用非常重要,绩效最直接,除了绩效之外,做一些额外的激励。据介绍,网易内部有一个比较好的制度是记工分,用工具过程中根据绩效有一些额外的积分,积分会影响奖金,但事实拿到奖金觉得很有用,看上去很简单粗暴但是很有用,但需要领导协调资源配合工作。在推的过程中比较好的经验,在企业落的过程中看到比较好的效果。
像维修助手比较简单,集团有集团的想法,子公司有子公司的想法,一线员工有一线员工的想法,怎么能够把大家对于这个项目本身收益预期对齐,实现终端用户的自身诉求。从技术实践来讲难度不是特别大,无非是平衡好各方诉求。最后,简单介绍下爱分析。我们是一家为企业客户提供数字化咨询和技术落地的服务商,我们的核心能力更多是在AI和数据领域,当前最主要的是大模型应用建设,帮助企业提供项目规划咨询到技术落地。
爱分析对于企业的价值,更多的基于复杂场景的数字化建设,或者创新技术入大模型的应用建设,提供解决方案并落地实施。当前,企业数字化已经过了只采购软件就能解决问题的阶段,我们更多的是基于企业特定的需求制定解决方案,我们有大量的有实践经验的专家,在项目规划阶段,帮企业设定项目目标、实现路径和方案,然后推动内部立项,再进行落地实施。以上是本次分享的全部内容,如需获取专家完整版课件可扫码领取。
⩓
爱分析创始人&CEO,毕业于清华大学,清华企业家协会成员,曾任投中集团CEO,拥有十余年中国股权投资与研究咨询市场经验,作为国内最早批产业数字化行业从业者和观察者,对数字化领域有着独到的见解和思考。注:点击左下角“阅读原文”,领取专家完整版实录和分享课件。