在强调低成本、高效率的市场环境下,利用AI Agent助力企业数字化转型,实现业务流程自动化和管理决策智能化,已成为当前备受关注的大模型应用场景。然而想要真正落地智能体AI Agent,依然需要解决诸多挑战。
本次分享主要围绕AI Agent在企业内的实践路径和各场景实践案例展开。
分享嘉宾|孙鹏飞 出门问问 研发总监
内容已做精简,如需获取专家完整版视频实录和课件,请扫码领取。
本次分享将分为三个部分。第一部分主要阐述AI Agent的基本概念,并探讨AI Agent如何为企业提供全面的支持和助力;第二部分将详细陈述AI Agent的实践路径;第三部分则重点介绍在不同场景下AI Agent实践的成功案例。
01
首先,让我们先来认识一下Agent的全貌。所谓Agent,实际上是一种基于大语言模型为核心动力的、拥有自我认知、自我规划及记忆能力的,能够独立完成各种复杂任务的系统。当用户提出问题时,我们可以通过Agent自行理解问题,选择适当的工具进行任务处理,然后将相应的结果反馈给用户。Agent的发展历程相对较短,随着大模型崭露头角,它才逐渐成为了业界关注的焦点。在今年3月16日,微软发布365 Copilot,引发了业界的热烈反响,它提出的基于LLM的应用范式如今已成为行业内的共识。自此,Agent进入了一个飞速发展时期,以AutoGPT为代表的Autonomous Agent热度迅速攀升。8月,Mate、GPT和AutoGen等多个多Agent项目相继发布,相较于单一的Agent,它们更能精准地解决复杂问题。在今年的11月16日,OpenAI的开发者大会上宣布推出Assistant API,这个工具赋予开发者更高效地基于GPT去构建Agent,这个也标志着Agent发展到了一个新的高度。在了解了Agent的发展历程后,我们来看看Agent如何为企业提供支持和助力。企业目前所需要解决的问题主要有以下几个方面:第一,降低人工成本,提供频繁且个性化的咨询服务,然而此类服务人员的成本颇高,因此我们需要为员工提供标准化、服务专业化的基础支持。第二,企业需要专家级的、具备标准性的咨询服务,例如咨询类的服务需要大量的知识储备,其对员工的专业要求自然也就较高。那么我们就需要有一种标准化且专业性的服务模式。第三,决策的辅助支持,通过与客户的互动去了解客户的难题,从中发掘客户的需求,进而协助客户解决相关问题。第四,通过AI赋能,提升企业的整体科技水平。随着企业的成长,它需要具备AI赋能和相应的技术革新能力。针对上述几点,我们需要看看是否能够找到解决方案,以及如何构建相应的应用场景。以企业全局视角出发,我们将企业现状划分为三部分。第一部分,产研。Agent的出现可以提高整体工作效率,处理大量重复、繁琐任务,例如数据录入、邮件筛选等,减轻员工的工作负担,从而提高整合的工作效率;第二部分,服务。Agent能够实时响应用户的需求,并且根据用户历史数据以及行为提供个性化的服务和建议;第三部分,运营。Agent可以通过数据分析及管理,优化企业资源配置,提升资源利用效率,继而降低运营成本。在了解了企业的痛点与需求后,我们将执行策略进行归纳总结为两点:首先,Agent需超越普通员工表现;我们认为客户并不期待Agent能达到专家级别的水准,只需在大多数场景中优于普通员工即可。因此,我们定义Agent所替代的对象并非高端专家或顶尖人才,而是月薪约几千元的普通员工。其次,Agent需要能开展多维数据分析。企业在传统的BI和数据分析中,往往基于结构化数据进行分析,但这种方式的维度较为单一,无法满足当前企业的需求。多维度数据分析已经在许多企业成功实施,并可以通过新的数据源,使企业能从中获取价值数据,进而转化为销售业绩和盈利点。AI Agent实践路径
在充分了解了企业的痛点和落地场景后,我们来探讨一下Agent实际操作中的问题。从交互和工作模式角度看,Agent的整体架构大致可分为三类:Single-Agent, Multi-Agent以及Agent-human,此次分享中我主要介绍前两类,第三类的当前探索仍在初期,虽有一些经验和成果,但尚不足以为大家进行详细分享。先来看一下单Agent,目前主流的通用框架其实是比较清晰的,它主要是以Agent为核心,具备以下四大能力。首先是记忆能力,包括短期记忆和长期记忆。其次是工具运用能力,Agent会充分利用外部所有可用工具,实现与外部环境的深度交互。再次是规划能力,它可以进行自我反思并进行子目标的细分,同时也具备一定的自我反馈功能。最后,Agent还有自我的行动能力,能够根据预先规划的路径,运用特定工具产生实际行动,进而实现整个任务的完成。目前企业面临的一大主要场景是数据分析,因此,我们构建了一款企业级数据分析助手DataAgent,它在大语言模型的基础上构建了一个数据分析智能体,重新定义了我们与数据交互的方式,无需冗长的开发流程以及繁琐的专业工具,只需运用自然语言进行对话即可。从全局角度考虑,我借鉴了ReAct整体的策略设计出如图所示的架构。在此架构中,可以清晰地发现我们继承了单Agent的四大模块——规划、执行、行动和工具运用。在工作场景中,数据分析无疑是核心内容。为此我们构建了三类主要工具。第一类工具是SQL,因为我们都知道企业中最多和数据量最广的一部分数据就是结构化数据,这些数据都是存在DB里的。第二类工具是API,现在一些企业除了结构化的数据,也有自己的BI系统,这些BI系统可以提供相关API,甚至还有一些非结构化的数据也通过一些搜索的方式可以去查询,这些都可以去作为API去接入到工具层中。第三类工具是Code Interpreter,主要是利用了text to Python或者text to代码的原理,把具体的自然语言转换成代码去进行相应的运行,从而完成任务。在DataAgent的整体思路中,我们首先借助ReAct中的来源,引入思考的这个环节,为接下来的行动做好相应的规划;接下来进入到实际操作阶段,利用实用的工具来完成任务;随后,我们会关注每个步骤的完成程度,通过多次迭代,最终实现整个任务目标。在这个框架里,我们可以明确地将四个关键组件串连起来,共同构成我们的数据代理系统。下面我们来分享一下AI Agent在具体场景的一些落地实践案例。第一个案例来自营销行业,我们为某知名保险公司及律师事务所定制了一款Agent工具,旨在解决特定场景下的一些问题。众所周知,保险与律所两大行业都有一个强需求场景,那就是对新人进行持续性的培训,即便是毕业于法律相关专业,缺乏实际经验的员工仍需进行长期而深入的培训,才能适应行业的要求。在发现这些场景存在的痛点后,我们采取了相关对策,开发了一款数字营销助手,借助Agent的理念将其转变为智能体,使其与业务场景紧密融合,从而协助企业推动在线与离线业务的协同发展。总的来看,我们将营销助手分为售前、售中及售后三个板块。在售前环节,营销助手能够快速上岗提供专业讲解,帮助员工创建数字人分身,实现零培训的快速上岗去介绍企业及相关产品。在售中环节,营销助手能够跟进数字接待线索,进行7*24小时的不间断服务,而且能够协助员工完成80%的简单重复工作。此外,在沟通过程中还可以借助人工智能的技术进行线索跟进,以便让销售人员实时了解客户或用户的关注焦点,为其提供相应的营销策略和思路。在售后环节,营销助手提供了一系列强化管理工具,通过数据看板、客户画像等功能模块协助企业全面了解市场,并强化销售管理,助力企业将销售线索和销售渠道转化为销售额。第二个案例是某石化企业在人力招聘场景的实践。该企业属于劳动密集型公司,需要聘用大量的加油工人和工厂员工,然而招聘成本非常高,并且缺乏有效的面试工具,导致招聘流程和效率极为低下。更为重要的一点是,他们没有一个完善的方法来评估应征者的能力,更多的是依靠面试官的主观判断,这种主观判断易于受到初次见面所形成的印象影响。为了解决上述问题,我们也是去构建了基于面试场景的Agent。在面试Agent中主要实施了两个核心模块:首先是在面试前会结合大模型能力对候选人的简历及其对应岗位的信息进行初步筛选,以帮助企业从众多简历中挑选出符合要求的候选人。其次是在面试过程中运用Agent理念帮助面试官进行辅助面试,可以从五个方面对候选人进行分析。第一,面试状态分析,包括候选人的表达能力、表现能力以及自信度等在内的多个维度进行分析。第二,性格分析,候选人的表述或回答都必然会反映其性格特征。第三,技术能力分析,在这方面主要分为两大模块:第一个模块是通用能力的评估,Agent会对候选人的优劣势和通用技能进行深度分析。第二部分是专业度的评估,针对特定场景,例如可以让候选人现场编写代码,并通过代码编写进而进行全面的性能分析,以便对候选人的整体能力做出全方位的评估。第四,录用建议,基于候选人表现以及模拟面试结果提供录用建议。第五,综合得分,对所有数据进行归纳总结,得出候选人的评分、综合评估以及优势与劣势评价,使面试评价环节更加清晰明了。上图是面试流程的示例,可以通过修改编辑栏来定义使用者是首轮、次轮还是HR轮的面试官。我们也专门构建了一个面试Agent的大模型,并结合了候选人上传的私域知识库,以此来迅速构建私域模型,构成完整的面试大脑机制。除了相应的大脑和角色配置外,还有对应形象的展示。因为面试过程中只让候选人看到冷冰冰的文字而没有良好的交互体验,那感受会非常差。因此,Agent提供了许多数字人形象和声音,来更好地为候选人提供面试服务,从而有效打破机器一贯冷冰冰的感觉。以上是本次AI Agent在企业内的实践路径和各场景实践案例分享的全部内容,如需获取专家完整版视频实录和课件可扫码领取。⩓
南京大学计算机系博士,自然语言处理及人工智能专家。目前在出门问问主导CoPilot和Agent相关研发工作,拥有20多项专利,在人工智能和自然语言处理国际顶级会议上发表多篇论文。曾任奇虎360算法负责人,苏宁易购总监。
注:点击左下角“阅读原文”,领取专家完整版视频实录和分享课件。