基于LLM架构的AIAgent平台的现状和未来预测

原创 爱分析ifenxi 2024-09-10 18:41




在当今人工智能飞速发展的时代,AI Agent正以其独特的方式重塑着企业的生产运营方式。澜码科技作为AI Agent领域的先行者,其创始人兼CEO周健先生分享了对大模型与AI Agent发展现状的深刻见解,以及这些技术如何赋能企业数智化转型的前瞻性思考。以下是对这次分享的详细实录,它不仅涵盖了AI Agent在不同行业落地的实践案例,还探讨了企业未来数智化发展的趋势和方向。

分享嘉宾|周健 澜码科技科技创始人兼CEO

内容已做精简,如需获取专家完整版视频实录和课件,请扫码领取。


01

大模型与AI Agent发展现状

去年年初,陆奇博士提到,大模型的发展带来了人机交互革命。他认为会出现三代系统,过去的数字化系统是感知系统或记录系统,负责把流程、物理世界的信息记录下来。大模型则是知识系统,把大量的数据通过压缩变成模型。我们还需要行动系统,它就像神经中枢,负责把大脑的输出拆解成物理世界及数字世界中的行动。从该视角出发,AI Agent、IT 数字化系统、大模型都有其定位,需要三者结合在一起才能形成未来的AGI。

从GPT3.5开始的过去一年半内,我们发现,AI Agent的成熟度依赖于大模型的能力,包括开源和闭源模型,以及多模态模型等。

现在的开源模型有几档,例如7B、13B、72B或者是千亿级模型,它们有不同的能力,也在不同场景中使用。我们相信未来会有更多尺度的模型,既会出现以GPT-5为代表的更大模型,在端侧也会出现更小的模型。
此外,也有其他两类模型,一类是多模态大模型,另一类是 GPT-4o那样的实时模型。现在的多模态大模型更多的是处理物理世界的图片、视频、音频,面对更加复杂的多模态内容,如 CAD 图纸、 UML 图纸等,目前仍然不能被用上。随着时间的推移,未来不断会有更多的开源模型变得成熟,并应用在 AI Agent的落地过程中。

从自动化视角出发,在企业内部业务流程中,特别是一线的员工,在执行某业务任务、活动时,主要在处理数据、文档、应用与流程。过去 RPA、低代码、BI,并不能够理解流程中的数据、文档、应用,只能做到简单的自动化任务处理。

如今,随着大模型的发展,尤其是相对成熟的纯文本大模型,提供了十分便宜的语言理解能力。当模型具备了理解能力之后,它们在信息抽取、指令遵循等任务执行能力得到提升,使得基于大语言模型的AI Agent的水平也远超传统的自动化系统,成为企业的“数字员工”。

02

专家知识是大语言模型落地的关键

澜码作为“模型中立”厂商,在过去18个月中,我们构建了企业级AI Agent平台,拥有内部评测工具,能够在特定场景下针对不断更新的开源模型进行实时评价,为企业客户在选择合适的应用场景和模型时提供有价值的决策建议。

另外,我们也强调企业内部知识的沉淀,我们的平台上有一个知识中心,可以把企业内各种 SOP、业务流程、规则、事实以及相应的领域知识沉淀下来。
AI Agent 公司本质上还是 AI 公司。我们认为,AI公司与传统软件公司最大的区别在于AI公司更加重视数据集。大模型虽然具有通用的语言理解能力,但在特定场景下仍然无法做到百分百准确。类似于不同教育背景的毕业生,无论是高中生、大专生还是大学本科生,参加工作都需要接受特定的入职培训,以获得财务、公司经营等特定方面的知识和技能。因此,需要AI Agent基于企业内的业务流程、数据构建专家知识库,从而赋能大模型能够解决复杂场景问题。

我们认为在企业级应用场景下,专家知识对大语言模型落地至关重要,大模型是底座,专家知识是天花板。
知识可以分为两类,一类是左边冰山上方可用自然语言描述的显性知识,包括过程性、规则性和事实性知识;另外一类是冰山下是隐性知识。专家可以凭借丰富的实践、经验,能够迅速适应并为不同行业和企业提供专业的指导。
AI Agent 则通过辅助员工实现自动化操作,并将收集到的实践性的经验数据、专家知识和企业内部的事务性数据结合在一起,进行数字化沉淀。
以招聘场景为例,现在有不少平台或者应用可以给校招生写简历,但对比行业内猎头为某特定岗位写出的简历,后者所能提供的业务价值比前者大 10 倍甚至 100 倍以上。因此,基于大语言模型的AI Agent,在拥有同样的数据、算力情况下,会因为专家知识的不同,发挥出不同的业务价值。
在实践落地过程中,面对一些复杂业务场景问题,澜码形成了一套综合、高效的系统化RAG(Retrieval-Augmented Generation)方案。
如上图左边的序列图所示,澜码的 RAG 与传统 RAG 的区别主要在于,面对用户的问题,传统 RAG 基本是直接把问题用Embedding 技术转换为向量数据,而澜码会使用大模型及Feature的方式对用户问题进行强拆解。举个例子,“北京银行跟招商银行成立日期哪个早?”该问句需要被拆解成三个问题,1、北京银行什么时候成立?2、招商银行什么时候成立?3、哪个日期更早?前两者可以通过检索文档回答,第三个问题需通过函数、代码解决。

另外一点区别是对文档的处理。文档发布通常承载着特定目的,同时包含很多的细节信息。例如,在公安部门需要合并民众办事指南的项目中,专家知识指哪些事项由哪些机构负责,国家、省、地方法案具体是如何规定等。其中,由于存在新旧法案更替的情况,新法案的颁布,若是与旧法案发生冲突,该如何解决?这些都是很深的专家知识,专家能够从底层的政策文档中抽取关键信息,AI Agent通过强化拆解与精细化的文档处理,能够大幅提升企业内部问答的准确率,确保信息的精确传递和高效应用。

03

AI Agent在不同行业的落地实践

下面来看几个澜码在不同企业中的AI Agent实践案例。

案例一:某保险经纪营销辅助助手

在这个场景中,企业内的专家会根据用户体检报告整理出产品推荐的专家知识,如描述具体病兆适合推荐哪些产品,有哪些合适话术等。
我们的Demo展示了如何将大健康体检报告转化为有用的信息,并结合专家的指导来处理这些报告,即用户上传一份体检报告,通过大模型 和Prompt 抽取信息,从保险产品手册中智能检索,提取与体检结果相关的保险条款,根据体检报告的关键信息和保险条款,推荐适合用户的保险产品,并生成对应的产品推荐报告。

在金融领域的实施方法论中,收集专家知识环节十分重要,包括样例数据,而样例数据更加强调用户问题。我们需要收集用户问题,并对问题进行拆解、处理和测试,使得AI Agent在实际场景中面对用户的问题提供更加有效、精准的回答。

以上是第一步,在收集到信息后,我们可以开始进行模型评估。初期我们会使用GPT-4进行试点,将用户的问题输入给GPT-4,使其扩写各种各样的变化问题,确保我们选择的模型在生成的数据集上展现出高准确率。同时,我们还需评估实际使用的每秒查询(QPS)对算力的需求,确保系统稳定运行。上线后,我们预计会进行一轮额外的调试,因为客户在实际使用生产系统时可能会遇到之前未预见的问题,这需要我们进一步的优化和回答。

案例二:某大型国有银行金融交易场景


该国有银行需要落地总行与分行的外汇平盘,我们梳理了交易过程中需要调用的 API,以确保有效获取数据;并根据专家知识整理出选型模型,进行工作流的搭建及优化。整个投产过程大概一个月,就能够做到上线即满足实际业务人员的需求。
04

企业未来数智化发展趋势

大模型的出现,为企业的IT基础设施带来了新的变革。过去所有 IT 基础绝大部分都在 CPU 之上,如今大模型在私有化部署过程中,对算力有了更高的要求,基本上都需要GPU。

在如今新的生态中,算力和AI基础设施,包括推理加速和模型管理服务等位于底层;在其之上是模型层,过去 18 个月不断有新模型推出,所以底层需要仿真工序,需要有工程技术,能够在不同情况下路由选择不同的模型,这样也能够节省算力的调度。澜码科技的AI Agent平台则处于中间层,需要具备针对特定场景匹配合适的大模型、调度不同工具的能力,如RAG、ABI、多Agent协作等,以达到连接人和系统的目标。

AI Agent作为中间层,它的工程框架至关重要,需要具备足够的灵活性和扩展性,以适应不同行业和场景的需求。尽管Agent产品可能类似于低代码平台,允许用户通过工作流、拖拉拽和上下游连线来实现功能,但低代码平台的真正竞争力在于其在多样化行业和场景中积累的能力。

当前,Agent已经集成了记忆功能、RAG(Retrieval-Augmented Generation)技术、数据分析指标库等先进功能,但如果没有多模态交互,比如文本生成图像(文生图)或视频,产品的功能在一定程度上就会受到限制。虽然这些功能可以简单集成,但卡片的丰富程度、参数的复杂性以及用户交互的便捷性,都会影响到文生图等多模态应用的准确率和用户体验。

总结完当前状态,后面再讲一些未来趋势。
从模型的智能化水平与成本效益角度来看,目前大模型的能力还处于“高中生”水平,预计明年年底,可能会出现“博士生”水平的模型。在目前的就业市场中,刚毕业的高中生与博士生的薪资差距大约是两倍,但大模型落地所产生的算力差距是十倍、百倍、甚至是千倍。
所以,基于上述图片,我们认为存在这样一条线,线之下的模型规模较小,通常用于生产与推理任务,线之上的模型规模大概在千亿级别左右,基本上用作场景验证。但当前大模型还处于“高中生水平”,直接投入生产会带来更高的资源和成本投入,并不划算。
未来,随着大模型如“GPT-5”的发展,它如果能够跟管理者互动,帮助管理者扩大管理半径,这个规律可能就会被打破。
这时的考量单位就不再是单个模型,而是团队整体。团队结构变为一个专家加上100个数据员工再加上一个Agent,相比于10个专家与100个数据员工的配置,成本效益曲线可能会发生变化。
从这个视角上,未来Agent或许能够从原来的辅助人到实现自治,能够自主形成一个团队,这将改变其在组织中的价值和作用。
上图是我们对AI Agent未来发展方向的设想:
现有的企业组织通过结构、人员、技能、业务流程来运作,并利用数字系统把过程记录下来,那么 AI Agent 在这一过程中,可以与人协作,进一步优化组织结构与流程,提高业务价值,赋能企业的数智化转型。
通常情况下,一线员工从新手到高级新手的过程中需要耗费大量的时间进行案例查询,而Agent能够通过RAG、API、ABI等方式辅助员工更好地执行;而从高级新手到胜任者的下一阶段,关键在于积累实践经验和学习案例,这对Agent的场景记忆——包括历史案例、具体做法、专家点评情况等提出了更高的要求。
我们期望AI Agent能够通过仿真和推演,帮助专家级人员无需亲自实践就能获得经验,让AI Agent能够提前封装业务能力、应用能力、数据能力和分析能力,能够提供更深入的数据洞察,并基于此提供系统操作能力,这种能力将改变企业内部未来的组织结构。

澜码期待在接下来的18个月内,基于文本模型、多模态模型、实时模型等底层大模型,不断地构建一个具备知识推理、记忆、反思能力的AI Agent系统,帮助企业进行知识治理,从而提升自动化水平,加速知识迭代,革新组织运作。

目前,我们也正在按照上述思路进行一些尝试。比如,我们正在与某股份制银行联合打造智能投顾助手。我们的AI Agent平台能够提供可组装能力,把CRM、数据仓库等传统的IT能力与大模型的能力组装在一起,变成更好的投资顾问助手。

以上是本次分享的全部内容,如需获取专家完整版视频实录和课件可扫码领取。

长按二维码,领取完整版视频实录和课件

毕业于上海交通大学计算机系学士、硕士,2002年获得ACM国际大学生程序设计竞赛世界冠军,是首个在此项竞赛夺冠的亚洲团队成员。2006年加入谷歌美国总部,负责中文网站搜索质量优化,此后历任阿里云、MediaV、依图科技、弘玑RPA等公司研发总监、CTO等;十年连续创业经验,作为依图10号员工、弘玑RPA公司CTO,在AI、大数据、企业服务领域 拥有丰富的经验和项目成功案例。

注:点击左下角“阅读原文”,领取专家完整版实录和分享课件


爱分析ifenxi 爱分析是一家中国领先的数字化市场研究与咨询机构。
评论
  • 物联网(IoT)的快速发展彻底改变了从智能家居到工业自动化等各个行业。由于物联网系统需要高效、可靠且紧凑的组件来处理众多传感器、执行器和通信设备,国产固态继电器(SSR)已成为满足中国这些需求的关键解决方案。本文探讨了国产SSR如何满足物联网应用的需求,重点介绍了它们的优势、技术能力以及在现实场景中的应用。了解物联网中的固态继电器固态继电器是一种电子开关设备,它使用半导体而不是机械触点来控制负载。与传统的机械继电器不同,固态继电器具有以下优势:快速切换:确保精确快速的响应,这对于实时物联网系统至
    克里雅半导体科技 2025-01-03 16:11 165浏览
  •     为控制片内设备并且查询其工作状态,MCU内部总是有一组特殊功能寄存器(SFR,Special Function Register)。    使用Eclipse环境调试MCU程序时,可以利用 Peripheral Registers Viewer来查看SFR。这个小工具是怎样知道某个型号的MCU有怎样的寄存器定义呢?它使用一种描述性的文本文件——SVD文件。这个文件存储在下面红色字体的路径下。    例:南京沁恒  &n
    电子知识打边炉 2025-01-04 20:04 32浏览
  • 光耦合器,也称为光隔离器,是一种利用光在两个隔离电路之间传输电信号的组件。在医疗领域,确保患者安全和设备可靠性至关重要。在众多有助于医疗设备安全性和效率的组件中,光耦合器起着至关重要的作用。这些紧凑型设备经常被忽视,但对于隔离高压和防止敏感医疗设备中的电气危害却是必不可少的。本文深入探讨了光耦合器的功能、其在医疗应用中的重要性以及其实际使用示例。什么是光耦合器?它通常由以下部分组成:LED(发光二极管):将电信号转换为光。光电探测器(例如光电晶体管):检测光并将其转换回电信号。这种布置确保输入和
    腾恩科技-彭工 2025-01-03 16:27 162浏览
  • 在快速发展的能源领域,发电厂是发电的支柱,效率和安全性至关重要。在这种背景下,国产数字隔离器已成为现代化和优化发电厂运营的重要组成部分。本文探讨了这些设备在提高性能方面的重要性,同时展示了中国在生产可靠且具有成本效益的数字隔离器方面的进步。什么是数字隔离器?数字隔离器充当屏障,在电气上将系统的不同部分隔离开来,同时允许无缝数据传输。在发电厂中,它们保护敏感的控制电路免受高压尖峰的影响,确保准确的信号处理,并在恶劣条件下保持系统完整性。中国国产数字隔离器经历了重大创新,在许多方面达到甚至超过了全球
    克里雅半导体科技 2025-01-03 16:10 121浏览
  • 在测试XTS时会遇到修改产品属性、SElinux权限、等一些内容,修改源码再编译很费时。今天为大家介绍一个便捷的方法,让OpenHarmony通过挂载镜像来修改镜像内容!触觉智能Purple Pi OH鸿蒙开发板演示。搭载了瑞芯微RK3566四核处理器,树莓派卡片电脑设计,支持开源鸿蒙OpenHarmony3.2-5.0系统,适合鸿蒙开发入门学习。挂载镜像首先,将要修改内容的镜像传入虚拟机当中,并创建一个要挂载镜像的文件夹,如下图:之后通过挂载命令将system.img镜像挂载到sys
    Industio_触觉智能 2025-01-03 11:39 113浏览
  • 本文介绍Linux系统更换开机logo方法教程,通用RK3566、RK3568、RK3588、RK3576等开发板,触觉智能RK3562开发板演示,搭载4核A53处理器,主频高达2.0GHz;内置独立1Tops算力NPU,可应用于物联网网关、平板电脑、智能家居、教育电子、工业显示与控制等行业。制作图片开机logo图片制作注意事项(1)图片必须为bmp格式;(2)图片大小不能大于4MB;(3)BMP位深最大是32,建议设置为8;(4)图片名称为logo.bmp和logo_kernel.bmp;开机
    Industio_触觉智能 2025-01-06 10:43 30浏览
  • 随着市场需求不断的变化,各行各业对CPU的要求越来越高,特别是近几年流行的 AIOT,为了有更好的用户体验,CPU的算力就要求更高了。今天为大家推荐由米尔基于瑞芯微RK3576处理器推出的MYC-LR3576核心板及开发板。关于RK3576处理器国产CPU,是这些年的骄傲,华为手机全国产化,国人一片呼声,再也不用卡脖子了。RK3576处理器,就是一款由国产是厂商瑞芯微,今年第二季推出的全新通用型的高性能SOC芯片,这款CPU到底有多么的高性能,下面看看它的几个特性:8核心6 TOPS超强算力双千
    米尔电子嵌入式 2025-01-03 17:04 22浏览
  • 自动化已成为现代制造业的基石,而驱动隔离器作为关键组件,在提升效率、精度和可靠性方面起到了不可或缺的作用。随着工业技术不断革新,驱动隔离器正助力自动化生产设备适应新兴趋势,并推动行业未来的发展。本文将探讨自动化的核心趋势及驱动隔离器在其中的重要角色。自动化领域的新兴趋势智能工厂的崛起智能工厂已成为自动化生产的新标杆。通过结合物联网(IoT)、人工智能(AI)和机器学习(ML),智能工厂实现了实时监控和动态决策。驱动隔离器在其中至关重要,它确保了传感器、执行器和控制单元之间的信号完整性,同时提供高
    腾恩科技-彭工 2025-01-03 16:28 164浏览
  • 车身域是指负责管理和控制汽车车身相关功能的一个功能域,在汽车域控系统中起着至关重要的作用。它涵盖了车门、车窗、车灯、雨刮器等各种与车身相关的功能模块。与汽车电子电气架构升级相一致,车身域发展亦可以划分为三个阶段,功能集成愈加丰富:第一阶段为分布式架构:对应BCM车身控制模块,包含灯光、雨刮、门窗等传统车身控制功能。第二阶段为域集中架构:对应BDC/CEM域控制器,在BCM基础上集成网关、PEPS等。第三阶段为SOA理念下的中央集中架构:VIU/ZCU区域控制器,在BDC/CEM基础上集成VCU、
    北汇信息 2025-01-03 16:01 175浏览
  • 根据Global Info Research项目团队最新调研,预计2030年全球封闭式电机产值达到1425百万美元,2024-2030年期间年复合增长率CAGR为3.4%。 封闭式电机是一种电动机,其外壳设计为密闭结构,通常用于要求较高的防护等级的应用场合。封闭式电机可以有效防止外部灰尘、水分和其他污染物进入内部,从而保护电机的内部组件,延长其使用寿命。 环洋市场咨询机构出版的调研分析报告【全球封闭式电机行业总体规模、主要厂商及IPO上市调研报告,2025-2031】研究全球封闭式电机总体规
    GIRtina 2025-01-06 11:10 37浏览
  • PLC组态方式主要有三种,每种都有其独特的特点和适用场景。下面来简单说说: 1. 硬件组态   定义:硬件组态指的是选择适合的PLC型号、I/O模块、通信模块等硬件组件,并按照实际需求进行连接和配置。    灵活性:这种方式允许用户根据项目需求自由搭配硬件组件,具有较高的灵活性。    成本:可能需要额外的硬件购买成本,适用于对系统性能和扩展性有较高要求的场合。 2. 软件组态   定义:软件组态主要是通过PLC
    丙丁先生 2025-01-06 09:23 36浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦