利用大模型知识库,发挥智能客服双倍价值

原创 爱分析ifenxi 2024-07-03 18:05




大模型知识库凭借着落地速度快、上层应用场景丰富、成本&算力可控等优势,已经成为企业优先考虑以及选择比较多的能力场景。今天将邀请行业专家,带来客户服务场景下大模型和知识库的联合应用,分享过往的落地经验。包括如何理解知识库,以及如何在业务场景中结合大模型来应用。

分享嘉宾|沈晓明 网易云商智能化产品负责人

内容已做精简,如需获取专家完整版视频实录和课件,请扫码领取。


01

知识库的应用场景

企业的各类业务中,都会有信息互通和知识流转的需求,知识库就是过程中的桥梁。职能部门生产的知识不仅要满足自己,还会在不同的场景下交叉使用,这时会对知识的生产提出要求。比如一份产品说明书,在面向消费者时和面向服务团队时,它的要求是截然不同的,知识对内和对外有很显著差异。随着产品不断迭代,功能参数越来越丰富,也会越来越复杂,也会对知识的维护有明确的要求。

总结一下,知识库的构建有四个要素。第一是完善性,决定了知识库的应用场景覆盖度。第二是准确性,是解决问题的基础。第三是简洁性,提高知识理解,避免混淆。第四是易读性,合理的结构能帮助阅读者更快地理解知识。

02

为什么是大模型+知识库

现在大模型技术在不同领域内,都产生了巨大的影响,甚至是颠覆。在知识库的构建和维护中,大模型也有很多结合点。

经过长时间的积累,我们在应用场景中总结出了大模型结合知识库的两类用法。
第一类是大模型应用知识库。大模型是一种全新的能力,可以很好的运用知识,知识库可以让大模型发挥更大的作用。
第二类是大模型帮助知识库构建。结构化的知识库,在使用时的一系列痛点,可以通过大模型来改善。
传统的知识库形式有两种:纯文档知识库、结构化知识库。


传统知识库在实际应用中,还是存在着一些问题。为了满足智能化的要求和更多场景的使用需要,知识的生成和管理需要符合 NLP 的能力要求,但这并不符合知识原生的生产方式,所以中间需要经过一道复杂的加工。以产品说明书为例,为了实现智能化,不仅需要写一份面向消费者的,还要再整理一份可以被机器学习和使用的。

在实际落地过程中,这种知识库的冷启动成本很高,更新迭代的速度很慢,甚至在不同部门协同之后,会出现内容和知识的割裂,业务部门负责知识输出,技术部门负责知识库落地实施,中间难免会产生知识传递的偏差。所以原生的知识文档,在应用时会有很大的局限性。

因此企业更期望知识库可以根据原生的生产方式,以工作逻辑来生产内容,同时生产的内容又可以直接或者完全符合各种场景的使用,免去中间加工的过程。

在实践中会发现,结合大模型的知识库是可以改善不少问题的。

从知识原始的生产模式来看,大模型知识库的应用优点有 5 个。

  • 在知识构建部分,大模型从原生文档中,直接抽取结构化的知识,改变了知识的处理方式。

  • 在知识校对过程中,过去会对抽取后的知识校对和查错分多个步骤,由不同的人进行操作,大模型赋能后可以快速便捷地完成。

  • 在知识运营过程中,大模型通过知识的对比,来实现知识的更新和保鲜。

  • 在知识应用过程中,大模型能力让知识对内外部、问答等场景的应用面覆盖更广泛。

  • 甚至在安全合规方面,也有很强的助力,实现对内容安全的审核,可以规避绝大多数已知的问题。

利用大模型的能力,完成原本庞大的、复杂的、持续的工作,让知识的维护和应用变得更加简单。

03

大模型+知识库的应用

当然大模型并不是万能的,在应用过程中,也需要面对因幻觉导致的可控性和准确性问题,需要有相应的策略逐步来应对和解决。下面将结合具体的应用案例,分享我们是如何应对这些挑战的。

3.1 第一步,从容错率较高的内部场景入手,进行知识构建。

组织内各个职能部门都会产生很多的原始文档,很多时候并不是苦于没有知识,而是知识没有被消化或使用起来,通过大模型可以很方便地应用知识,可以直接提高团队知识的流通率和使用率。

案例 1 :某集团 SSC 项目

SSC( Share Service Center ,共享服务中心)是企业日常接触最多的场景之一,更多是对内服务,包括 HR 、财务、IT 等。该场景对专业度要求非常高,知识点非常多,对于知识的使用者或者查询者,会因为不同区域、不同公司、不同工种,甚至在不同时间查询的内容,所得到的答案都可能是不一样的。

在实际知识库落地的过程中,最头痛的就是冷启动问题,知识分不同领域,如何从文档转变为结构化的知识是难点。另外对于不同部门产出的专业文档,需要进行加工,甚至还要分不同的库,将多个库的知识联合应用。再就是知识既专业又复杂,变动更新也会比较多,需要做对应的知识更新。而每个职能的知识是单独维护的,最后汇总到某个组织或者某个部门后再做知识更新,这其实是很大的挑战。

没有用大模型之前,虽然技术上也有可行之法,但是落地成本很高。结合大模型能力后,可以使用一套组合能力改善这些问题。

  • 首先各个职能部门提供原始文档,由大模型根据结构化知识库的标准,抽取对应知识生成标准的问答,这个过程中还可以通过答案扩写,或者精简和润色的能力,改善回答的易读性和简洁性,符合知识认知的几个维度。

  • 其次在检测答案一致性的时候,因为文档内容非常专业,也会有相应的版本管理,利用大模型对不同知识进行校对,避免原生文档存在版本差,保证前后知识的一致性,减少出错。

  • 最后通过大模型对检测后的标准问答生成相似问题,扩充各种不同的问法,达到使用场景中更高的可用性及匹配度,来提升最终的知识应答率。

这样操作下来, SSC 场景下的冷启动就变得容易很多,包括后续的维护和运营也会更简单。这个案例中,大模型作为工具,能够帮助结构化的知识库,在冷启动时以便捷的方式去落地,也是结合知识库应用的价值体现。
案例 2 :某业务产品信息查询

软件服务商有很多的产品,产品往往功能复杂而且迭代很快,产品文档更新也快,组织内不同职能的伙伴也会相互协同,除了日常的培训以外,协作伙伴也需要了解产品。以前只能通过相应的产品文档,或者找更了解的伙伴询问。产品经理需要花费大量的时间进行解答。那么是否可以把产品知识也维护到知识库里面?

经过我们的尝试,答案是行不通的。因为产品迭代非常快,两周到三周有一次迭代,每次迭代都有非常多的功能点上线,把这部分内容放到知识库里,实施人员会发现刚处理完第一波,第二波就来了,根本做不过来,而且产品文档往往是滞后的,就算产品经理补充了,也会因为知识库更新不及时,导致无法使用。

这个场景中的核心就是知识库的构建和维护,因为是对内的场景,基于大模型的文档问答能力,即使应答率不高,也不会有什么问题。直接把产品手册和常见问答丢给大模型学习。对于用户提问,大模型可以根据知识边界回答已知问题,未知问题可以由产品经理做答,这样可以节省产品经理很大一部分精力的投入。
但是这种程度还是不够的,怎么样能够让这套机制变得更聪明,更灵活?如何将产品经理的回答,帮助知识库形成一个自动更新的闭环,使得知识库在一问一答的过程中自动的更新、迭代?
后来我们利用大模型的总结和归纳能力,把咨询过程中无法应答的问题找出来,通过产品经理进行人工回答,然后把获得咨询者认同和认可的答案梳理出来,作为新的标准问答,再写入到文档中,给到大模型进行调用,这样大模型会采集到更多问题和与之匹配的答案,形成知识库智能化迭代的闭环。这套机制不仅利用了大模型的能力,还可以实现自学和自答得更好。
案例 3 :企业内部知识查询场景
在企业内部知识查询的场景中,知识门户上的知识搜索依旧可以使用大模型,实现增强检索,以改善搜索体验。
通过大模型生成检索者询问的内容,给出基于关键词或者自然语义匹配的知识文档和对应的内容切片,直接给出答案的同时,还可以对比原始文档,增强查询结果的信任,促进组织内的知识使用。
3.2 第二步,应用各类能力,解决难点+深入场景。
前面分享的是在可控的场景下,我们做的尝试和积累。最终还是希望把套能力,应用到真正一线的场景中。面对可控性和准确性的挑战,虽然不能完全避免,但是可以把大模型当作一种能力,合理的去应用。
案例 1 :某品牌商品咨询
品牌零售行业的售前或售后场景,商品信息相关的咨询量非常大,包括商品本身的信息、活动信息、库存等。以我们的经验来看,品牌零售业的咨询占比可以达到 30% ~ 50% ,大部分答案是可标准化的。
这种业务场景下,通过机器人来回答,从而降低客服人员的负担,是很有效的一种做法,大部分企业也是这么做的。但往往会卡在知识库的构建和维护上。
很多企业内部有非常强大的产品信息说明和维护,产品部门会输出产品信息,运营部门和市场部门会输出活动等配套信息,最终利用图文并茂的方式,输出的非常专业,本意是希望给使用者有更好的阅读和理解体验。
但放在机器人问答的场景下,举个例子:某 3C 数码客户的, SKU 将近有 7, 000 多个,参数非常复杂,图文并茂的优秀说明文档让机器人难以处理。此外,产品对外推广的时候,会有很多“ xx 同款”“ xx 热门款”等相似的昵称,用户也会自发的给产品取别称,表达对产品的支持和喜爱。
在服务过程中,很少有用户按照产品标准名称来咨询,以及有些产品名称之间,差异很小,那么在机器人服务的过程中,机器人就找不到对应的说明来应答,解决率就会很低。
面对这种情况,大模型是一个很好的解法。但直接应用大模型的能力,对实际效果来说还是过于开放,比如出现幻觉,答案不完整,出现信息错配等,还需要给予一定的约束。
通过对该领域大量的用户咨询数据进行对比,我们找到了一定的规律性,整个过程是相对标准的,并且可以尝试引导用户如何获取想了解的信息,比如产品的什么参数、订单的什么动作(比如发货)等。
这种情况可以尝试使用 Agent 的能力,基于 NLP 或者 FAQ 的问答做应用。在和客户会话时,触发产品咨询意图后,可以通过大模型获取客户意图,识别想询问的是什么产品,具象到具体的产品上,再关联到实体。比如通过昵称具象到所代表的产品,然后提取关联的产品信息,再关联到产品的属性,比如相关联的推荐产品,或者订单信息。再通过 Agent 能力查询商品库对应的商品信息,拿到返回的信息后,再把信息和客户的问法一起给到大模型来生成相应的回答。
在这个过程中是有几个边界的,比如只针对某一具体的商品找到产品说明文档,基于产品说明文档进行解析,找到对应的属性或信息内容切片,再基于切片做应答。这样几个边界就切得非常清楚,以此来解决错配、应答幻觉等问题。
Agent 可以把工作流组合得更加丰富些,加入新的可能性,比如相关商品推荐、活动推荐,甚至推动客户下单等等,都是可以实现的。在这个过程中,还可以发挥客服部门更大的业务价值,把客服部门的价值从被动解答问题往主动营销层面走。
案例 2 :某企业服务分流
下面的案例是一家集团企业,为客户提供的服务类型很多,因为企业品牌较大,很重视客户服务的体验,所以每个业务,不同的客户,有不同的服务标准。但是,为了统一品牌形象,服务入口是统一的。
这时会产生较大的问题:很多访客在咨询进线的时候,并不能清楚地描述问题属于哪个业务哪个场景哪个流程,按照常规的客服做法是填写询前表单,来分配合适的客服技能组。如果遇到访客点错了,就会出现错配,客户被不同的客服技能组反复转接,体验差了,客服的服务效率也有很大影响。

这里同样可以利用大模型+知识库,再关联技能组和咨询分类的实体。

在访客和机器人互动的环节中,访客在表述问题和输出信息时,机器人可以做两件事,除了应答之外,还可以尝试收集访客的信息。根据信息的理解对应到不同业务、不同场景、不同流程中,做好咨询的分类,以此实现转人工之后,实现不同技能组的指定分流,解决前面所说的错配流转问题,客服效能提升,访客的满意度也会提高。这个案例不是通过大模型解决客户确切的问题,而是为某个服务环节提供了价值。
大模型知识库在客服场景中有很多发挥价值的机会点,有待去挖掘和发现,但核心还是两块:怎么样通过大模型把知识库用起来,怎么样通过大模型把知识库构建好,这也是最能帮助企业去解决问题的两个点。

以上是本次分享的全部内容,如需获取专家完整版视频实录和课件可扫码领取。

长按二维码,领取完整版视频实录和课件
拥有10年以上产品领域实战经验。2012年加入网易,从0到1参与多款To B和To C产品的市场研究、产品规划、交互设计,推动产品商业化,对于大数据在服务和营销场景的应用,以及客户体验的提升,有着深刻的理解。2019年开始负责网易云商旗下智能外呼、智能客服等多款智能化产品。2023年9月,和团队共同完成客服大模型应用“商和”从0到1的孵化,在超百家企业中,验证了大模型在坐席辅助、知识库、客户之声分析等客服场景的应用效果。

注:点击左下角“阅读原文”,领取专家完整版实录和分享课件


爱分析ifenxi 爱分析是一家中国领先的数字化市场研究与咨询机构。
评论
  • 习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习笔记&记录学习习笔记&记学习学习笔记&记录学习学习笔记&记录学习习笔记&记录学习学习笔记&记录学习学习笔记记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记
    youyeye 2024-12-11 17:58 91浏览
  • 全球智能电视时代来临这年头若是消费者想随意地从各个通路中选购电视时,不难发现目前市场上的产品都已是具有智能联网功能的智能电视了,可以宣告智能电视的普及时代已到临!Google从2021年开始大力推广Google TV(即原Android TV的升级版),其他各大品牌商也都跟进推出搭载Google TV操作系统的机种,除了Google TV外,LG、Samsung、Panasonic等大厂牌也开发出自家的智能电视平台,可以看出各家业者都一致地看好这块大饼。智能电视的Wi-Fi连线怎么消失了?智能电
    百佳泰测试实验室 2024-12-12 17:33 70浏览
  • 时源芯微——RE超标整机定位与解决详细流程一、 初步测量与问题确认使用专业的电磁辐射测量设备,对整机的辐射发射进行精确测量。确认是否存在RE超标问题,并记录超标频段和幅度。二、电缆检查与处理若存在信号电缆:步骤一:拔掉所有信号电缆,仅保留电源线,再次测量整机的辐射发射。若测量合格:判定问题出在信号电缆上,可能是电缆的共模电流导致。逐一连接信号电缆,每次连接后测量,定位具体哪根电缆或接口导致超标。对问题电缆进行处理,如加共模扼流圈、滤波器,或优化电缆布局和屏蔽。重新连接所有电缆,再次测量
    时源芯微 2024-12-11 17:11 119浏览
  • 在智能化技术快速发展当下,图像数据的采集与处理逐渐成为自动驾驶、工业等领域的一项关键技术。高质量的图像数据采集与算法集成测试都是确保系统性能和可靠性的关键。随着技术的不断进步,对于图像数据的采集、处理和分析的需求日益增长,这不仅要求我们拥有高性能的相机硬件,还要求我们能够高效地集成和测试各种算法。我们探索了一种多源相机数据采集与算法集成测试方案,能够满足不同应用场景下对图像采集和算法测试的多样化需求,确保数据的准确性和算法的有效性。一、相机组成相机一般由镜头(Lens),图像传感器(Image
    康谋 2024-12-12 09:45 88浏览
  • 铁氧体芯片是一种基于铁氧体磁性材料制成的芯片,在通信、传感器、储能等领域有着广泛的应用。铁氧体磁性材料能够通过外加磁场调控其导电性质和反射性质,因此在信号处理和传感器技术方面有着独特的优势。以下是对半导体划片机在铁氧体划切领域应用的详细阐述: 一、半导体划片机的工作原理与特点半导体划片机是一种使用刀片或通过激光等方式高精度切割被加工物的装置,是半导体后道封测中晶圆切割和WLP切割环节的关键设备。它结合了水气电、空气静压高速主轴、精密机械传动、传感器及自动化控制等先进技术,具有高精度、高
    博捷芯划片机 2024-12-12 09:16 89浏览
  • 本文介绍瑞芯微RK3588主板/开发板Android12系统下,APK签名文件生成方法。触觉智能EVB3588开发板演示,搭载了瑞芯微RK3588芯片,该开发板是核心板加底板设计,音视频接口、通信接口等各类接口一应俱全,可帮助企业提高产品开发效率,缩短上市时间,降低成本和设计风险。工具准备下载Keytool-ImportKeyPair工具在源码:build/target/product/security/系统初始签名文件目录中,将以下三个文件拷贝出来:platform.pem;platform.
    Industio_触觉智能 2024-12-12 10:27 84浏览
  • RK3506 是瑞芯微推出的MPU产品,芯片制程为22nm,定位于轻量级、低成本解决方案。该MPU具有低功耗、外设接口丰富、实时性高的特点,适合用多种工商业场景。本文将基于RK3506的设计特点,为大家分析其应用场景。RK3506核心板主要分为三个型号,各型号间的区别如下图:​图 1  RK3506核心板处理器型号场景1:显示HMIRK3506核心板显示接口支持RGB、MIPI、QSPI输出,且支持2D图形加速,轻松运行QT、LVGL等GUI,最快3S内开
    万象奥科 2024-12-11 15:42 88浏览
  • 一、SAE J1939协议概述SAE J1939协议是由美国汽车工程师协会(SAE,Society of Automotive Engineers)定义的一种用于重型车辆和工业设备中的通信协议,主要应用于车辆和设备之间的实时数据交换。J1939基于CAN(Controller Area Network)总线技术,使用29bit的扩展标识符和扩展数据帧,CAN通信速率为250Kbps,用于车载电子控制单元(ECU)之间的通信和控制。小北同学在之前也对J1939协议做过扫盲科普【科普系列】SAE J
    北汇信息 2024-12-11 15:45 115浏览
  • 应用环境与极具挑战性的测试需求在服务器制造领域里,系统整合测试(System Integration Test;SIT)是确保产品质量和性能的关键步骤。随着服务器系统的复杂性不断提升,包括:多种硬件组件、操作系统、虚拟化平台以及各种应用程序和服务的整合,服务器制造商面临着更有挑战性的测试需求。这些挑战主要体现在以下五个方面:1. 硬件和软件的高度整合:现代服务器通常包括多个处理器、内存模块、储存设备和网络接口。这些硬件组件必须与操作系统及应用软件无缝整合。SIT测试可以帮助制造商确保这些不同组件
    百佳泰测试实验室 2024-12-12 17:45 76浏览
  • 首先在gitee上打个广告:ad5d2f3b647444a88b6f7f9555fd681f.mp4 · 丙丁先生/香河英茂工作室中国 - Gitee.com丙丁先生 (mr-bingding) - Gitee.com2024年对我来说是充满挑战和机遇的一年。在这一年里,我不仅进行了多个开发板的测评,还尝试了多种不同的项目和技术。今天,我想分享一下这一年的故事,希望能给大家带来一些启发和乐趣。 年初的时候,我开始对各种开发板进行测评。从STM32WBA55CG到瑞萨、平头哥和平海的开发板,我都
    丙丁先生 2024-12-11 20:14 81浏览
  • 天问Block和Mixly是两个不同的编程工具,分别在单片机开发和教育编程领域有各自的应用。以下是对它们的详细比较: 基本定义 天问Block:天问Block是一个基于区块链技术的数字身份验证和数据交换平台。它的目标是为用户提供一个安全、去中心化、可信任的数字身份验证和数据交换解决方案。 Mixly:Mixly是一款由北京师范大学教育学部创客教育实验室开发的图形化编程软件,旨在为初学者提供一个易于学习和使用的Arduino编程环境。 主要功能 天问Block:支持STC全系列8位单片机,32位
    丙丁先生 2024-12-11 13:15 71浏览
  • 习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习笔记&记录学习习笔记&记学习学习笔记&记录学习学习笔记&记录学习习笔记&记录学习学习笔记&记录学习学习笔记记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记
    youyeye 2024-12-12 10:13 52浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦