DeepSeek赋能AIAgent,挖掘智能应用新潜能

原创 爱分析ifenxi 2025-03-24 18:38



DeepSeek作为人工智能领域的创新先锋,凭借其突破性技术为现有AI Agent赋予了更强大的任务执行与决策支持功能。而企业接入DeepSeek将带来哪些创新与实践价值,DeepSeek该如何打破发展瓶颈,其落地场景与效果表现如何等问题仍需探索。

本文将结合数势科技的实践,探讨如何通过DeepSeek和现有大模型的整合,推动企业在数字化经营中的新变革。

分享嘉宾|岑润哲 数势科技 数据智能产品总经理
内容已做精简,如需获取专家完整版视频实录和课件,请扫码领取。

01
DeepSeek的到来,对于大数据分析和应用领域,是“天然的利好” 
数据应用赛道中,DeepSeek带来了诸多改变与优势。在数据分析领域,DeepSeek接入后,其在数学及编程能力的增强具有显著优势,极大地提升了对复杂数据的处理、统计与分析力。在数据应用领域,代码能力与数学能力至关重要。DeepSeek到来后,无论是前期的数据清洗和特征挖掘,中期构建指标体系与指标语义层,还是后期的数据可视化及报告生成等环节,其数学能力与推理能力的提升,对数据应用的全链路机制都产生了积极影响。特别是在复杂数据清洗、数据可视化以及深度报告生成方面,DeepSeek都带来了诸多利好。

从技术视角来看,其思维链对数据分析极为有利。在数势服务的众多金融机构中,以往大模型存在一个问题:虽然能给出答案,但答案的推导过程是黑盒化的。而在DeepSeek的论文中,能够从V3的基础模型做强化模型成为DeepSeek-R1-Zero,强化学习不仅奖励准确性,还注重过程与结构的规范性。这一机制的优势在于,不仅能准确进行数据分析,还能将条理清晰的推理思路总结呈现给用户。例如,用户进行企业经营分析时,应该从哪些维度选取何种指标,DeepSeek能将思考过程以步骤的形式呈现出来。这种激励机制,极大地增强了数据分析报告的说服力,是数据应用领域的一大亮点。

作为推理模型,R1在推理时十分注重Token输出,输出的Token越多,思考越细致,出错概率越低。在进行复杂代码生成、数据数学计算及决策时,R1的表现明显优于蒸馏后的版本或千问模型。然而R1存在速度慢的问题,因为处理复杂任务需要消耗更多Token进行思考。因此可以采用结合的思路,即使用蒸馏后的相对小参数量(如32B)的模型,先进行任务分类与实体抽取,该模型在这方面与R1效果相差不大,且速度更快。然而,当用户的数据分析任务极为复杂时,可能会调用如R1这类推理模型进行深度推理与规划,以更好地满足用户的分析需求。

通过近期就模型选用问题与多家金融机构进行的交流来看,若场景主要是满足用户的快速数据检索需求,例如询问今年某月份的余额增速情况,此时无需调用R1这类长推理模型进行复杂任务拆解,使用V3模型进行读取识别与要素解析,即可快速提取数据。但如果用户的分析需求并非简单的数据提取,而是像撰写信贷报告或详细的银行信贷资产增速分析报告,这类高阶的数据推理或行动计划输出任务,V3模型的快速思考可能无法很好地完成。这种情况下,R1的推理模型更为适用,它能够将任务进行拆解。比如在分支行业绩对比复盘时,确定应关注的指标,并将任务细化为具体步骤。因此,现在很多主流AI产品都会设置“是否启用深度思考”的按钮。从某种意义上讲,这是通过产品的功能操作,让用户能够选择此次是进行快思考还是慢思考。未来,此类融合方案或许会成为众多产品的标配。

02
数势SwiftAgent的革新与应用
目前数势在SwiftAgent中加入了“深度思考”按钮,一旦用户开启该按钮,便会调用R1模型进行深度推理与分析。数势的工具主要面向一些头部企业,通过接入DeepSeek后对部分能力特性进行了升级,从四个方面极大地提升了大模型的能力。

前端代码生成能力极为出色。实验得出,直接让R1基于原始数据生成代码,此时它在前端快速获取可视化呈现的能力非常强。以往,大家更多地是借助BI工具来配置一系列看板或驾驶舱,而现在,直接将原始数据交给R1生成H5或JS代码,其表现十分出色,这极大地增强了可视化能力。
其次推理能力显著提升了报告的深度。以往模型可能只能给出一些较为基础、缺乏深度的表述,而现在它能够真正思考指标是否存在问题,是否需要进行假设推断等,这大幅提升了报告的质量和深度。数据分析报告的难点在于,指标口径的准确性至关重要,结论需基于指标异常进行推断,甚至有时还需结合企业内部知识库或相关文档生成合理建议。当数据需要可视化呈现,如转化为表格以进行对比,或进行异常结论挖掘时,相较于以往如千问模型的思考深度更优,且整个过程对用户具有可观测性。
以财务数据异常分析为例,用户输入财务数据,模型能够明确告知用户,因某指标下降故而进行异常分析,其思考过程中的每一个节点都能直观地向用户解释分析的原因。如此一来,在呈现报告时,用户能够清晰理解报告撰写的逻辑,而不像以往大模型输出结果时,虽有内容却难以理解分析的依据。从这个层面来看,大模型思考过程的白盒化是一项重大变革,极大地增强了用户对结果的可信度,也提升了数据解读报告的能力。过去报告可能仅有纯文字,如今则可融入图片、表格等数据可视化元素,为用户带来更好的使用体验。

此外哪些能力适合由大模型直接生成代码去完成,哪些更适合通过工具调用。目前大模型写代码的能力很强,但有时仍需编写Function Code,而非直接让大模型生成代码。这主要分为两种情况:
如果代码的范式能够固化,此时大模型直接写代码的准确率会非常高 。所谓固化范式,以图表为例,基本图表具有固定范式,从数据分析可视化的角度来看,其模式早已固定,无论何时,饼图的呈现方式基本一致。在这种情况下,大模型编写代码时表现出色,基本不会出错。
然而,对于业务逻辑灵活的代码,大模型则不太适合直接编写。业务逻辑通常涉及数据库中事实表与维度表的关联,这种关联具有很强的业务逻辑,且不同公司内部表与表之间的关系各不相同。若让大模型强行编写涉及三到四个表的复杂关联代码,其生成的代码往往会出现问题。所以建议通过指标平台的API取数接口,实现指标维度的拼接来获取数据,这种方式更为妥当。

03
金融行业案例与展望
以下将详细分享某城市商业银行开展智能数据分析的成功案例,近期该银行将内部的千问模型替换为DeepSeek V3和R1后,取得了一定的效果提升。该客户产品面临的主要问题是解决行领导在数据提取和分析方面的痛点。这家银行以往依靠分析师角色,通过人工提取数据表格的方式,为领导提供诸如收入、存贷款情况、同业负债情况等报表。对于银行领导而言,其数据需求较为灵活,今日可能关注几个分支行的余额增速,明日则可能关注业绩排名。然而,银行缺乏足够的分析师来满足这些多样化需求。
因此,银行期望通过自然语言查询机制,一方面释放分析师的时间,提升取数效率;另一方面,为领导提供更敏捷的归因分析及报告分析能力,以便洞察行内指标变化的异动原因,从而显著提升工作效果与效率。项目完成后的第一周,领导们提交了数千条查询请求,系统使用率较高。同时,结合指标语义层,数据准确性高,从问询到输出数据的时间基本仅需5秒左右。

这家银行开展此项目,以及众多企业寻求类似服务,本质上源于两个问题。
  • 需求与供给的错配。即便头部银行或大型企业拥有分析师及ETL人员,但随着业务不断拓展,需求持续增长,企业不可能招募等量工程师编写脚本以满足所有需求,导致人力供给与需求不匹配。因此,企业期望借助AI agent满足日常取数和用数的分析诉求,解放人力。
  • 指标口径层面存在黑盒问题。不同部门对同一指标名称可能存在不同理解,在底层数仓中口径不一致。所以,构建指标语义层,统一指标口径,使部门间拥有共通的数据语言,成为亟待解决的问题。

在实施方案中融合了大模型能力与指标语义层交互能力。当用户提出问题时,首先由大模型进行判断。若任务复杂,如需要生成深度归因报告,则通过路由将需求转至DeepSeek R1处理;若只是简单的数据提取,如按时间、机构、贷款余额等条件提取数据,使用V3或更快的模型即可。即先由大模型进行意图理解,若为复杂任务,则进入任务规划阶段,由规划层进行多任务编排。
在指标查询环节,通过指标语义层,提取用户自然语言中的要素。例如用户询问各分支行业绩情况,其中分支行为维度,过去三个月为时间,业绩对应若干指标,存在一套映射逻辑。最后将这些指标语义逻辑翻译成SQL语句执行,并通过R1这样的推理模型对报告进行总结,反馈给用户。目前大模型在完整的数据提取方面能力有限,因为其对SQL底表逻辑的理解存在局限,不过大模型在任务识别与报告生成方面表现出色。因此,将大模型擅长与不擅长的部分区分开来,进行方案融合,以更好地实施相关项目。

该银行的技术团队曾尝试直接使用R1模型生成SQL。当表结构较为简单,例如查询近7日资产时,R1生成的SQL能够正常运行。然而,当问题中的任务指令较多,不仅需要提取数据,还涉及归因分析以及报告撰写等任务时,单纯通过代码生成工具来完成就较为困难。此时会先利用R1进行多任务规划,第一个任务可能是取数,第二个任务通过归因分析小模型进行维度归因,最后借助知识库生成报告。通过这种结合Agent架构与Function Code形式,能够更好地满足业务方在真实复杂业务场景下的分析需求,这些需求不仅包括数据提取,还涵盖高阶的数据洞察、归因、异常检测以及报告撰写等,这也是企业实际会面临的问题。
在为该金融机构提供服务时,采取分场景推进的方式。因为不可能一开始就覆盖所有场景。在项目一期,首先解决行领导对行内业绩指标对比的自然语言分析与报告生成需求。到了项目二期,则聚焦于实际业务,如信贷、对公贷款业务,进行风险评估、财务分析或信用卡分析等,从总部视角逐步扩展到各个业务线的领域和场景。
项目一期上线后,用户体验良好。以往,无论是行长还是分支行领导,数据提取流程都是向分析师提出需求,由分析师进行加工,这个过程来回可能需要4个小时。而现在,算法能够主动帮助用户发现指标问题,例如告知用户行内不良率或贷款余额近期的变化,提醒领导关注。领导若想进一步了解各机构业务表现不佳的原因,进行详细的数据归因洞察,可按照分支行、产品类型、客户类型等维度进行问询。最后,若领导需要向总行领导汇报,系统可结合企业已有的数据库和知识库生成包含异常原因及应对措施等内容的简单报告。在接入DeepSeek后,该银行认为其思维链生成及数据解读模块得到了显著增强。以往报告可能只有纯文字,现在则融合了表格、副文本、图表与文字,大大提高了报告的易读性和可解释性,这也是DeepSeek接入后的优势所在。

最后分享一下对于DeepSeek的未来,尤其是推理模型演进方向的展望。
第一,DeepSeek的出现实现了AI平权。这一成果意义重大,意味着无论是头部企业还是中型企业,都具备了部署开源模型的资源与能力,在这一点上,大企业和小企业处于同等地位,这是AI平台发展的体现。未来,数据应用组件将以DeepSeek为核心,分析组件作为执行部分协同运作,这样能使强大的核心与不同的技能池有效配合,更好地满足企业需求。

第二,目前DeepSeek仍无法掌握企业内部的私域知识及数据编织逻辑。在此情况下,数据应用产品需承担“翻译器”的角色。即在推理模型与企业级复杂数据结构之间构建语义层,以此作为连接用户自然语言与底层数据表格架构的桥梁,但这是大模型的通用能力所无法实现的。原因在于,DeepSeek当前的上下文处理能力为64K或128K,然而企业实际数据量,大型机构通常可达几十PB甚至上百PB。显然,无法将全部数据输入模型进行分析。因此,未来其64K或128K的上下文更适合用于推理,将任务细致拆解,再由“手脚”组件逐一执行,获取数据、开展相关分析,并将结果反馈给核心进行总结报告,这种模式更具有可行性。
第三,目前在使用R1时,存在无法控制思维链长度的问题,这导致其输出有时较为啰嗦。若R1未来取得进展,希望它能够实现对模型输出的控制。例如能够在某些场景下将Token控制在1000个以内,而在另一些场景下,允许2000个Token的输出。如果未来能够实现对Token的控制,那么在众多应用场景中,将能够灵活选择输出风格。比如,选择“谨慎型”输出,回答问题更加严谨;或者选择相对活泼、简洁的输出风格。

长按二维码,领取完整版视频实录和课件

现任数势科技数据智能产品总经理,前头部互联网公司资深量化运营负责人,多年零售与金融行业数据挖掘与用户运营策略设计经验,曾为多家大型企业搭建从目标设定、数据诊断、策略设计到优化复盘的全链路数字化运营平台。
注:点击左下角“阅读原文”,领取专家完整版实录和分享课件

爱分析ifenxi 爱分析是一家中国领先的数字化市场研究与咨询机构。
评论 (0)
  • 文/Leon编辑/cc孙聪颖‍“无AI,不家电”的浪潮,正在席卷整个家电行业。中国家电及消费电子博览会(AWE2025)期间,几乎所有的企业,都展出了搭载最新AI大模型的产品,从电视、洗衣机、冰箱等黑白电,到扫地机器人、双足机器人,AI渗透率之高令人惊喜。此番景象,不仅让人思考:AI对于家电的真正意义是什么,具体体现在哪些方面?作为全球家电巨头,海信给出了颇有大智慧的答案:AI化繁为简,将复杂留给技术、把简单还给生活,是海信对于AI 家电的终极答案。在AWE上,海信发布了一系列世俱杯新品,发力家
    华尔街科技眼 2025-03-23 20:46 75浏览
  • 在智慧城市领域中,当一个智慧路灯项目因信号盲区而被迫增设数百个网关时,当一个传感器网络因入网设备数量爆增而导致系统通信失效时,当一个智慧交通系统因基站故障而导致交通瘫痪时,星型网络拓扑与蜂窝网络拓扑在构建广覆盖与高节点数物联网网络时的局限性便愈发凸显,行业内亟需一种更高效、可靠与稳定的组网技术以满足构建智慧城市海量IoT网络节点的需求。星型网络的无线信号覆盖范围高度依赖网关的部署密度,同时单一网关的承载设备数量有限,难以支撑海量IoT网络节点的城市物联系统;而蜂窝网络的无线信号覆盖范围同样高度依
    华普微HOPERF 2025-03-24 17:00 177浏览
  • 在嵌入式语音系统的开发过程中,广州唯创电子推出的WT588系列语音芯片凭借其优异的音质表现和灵活的编程特性,广泛应用于智能终端、工业控制、消费电子等领域。作为该系列芯片的关键状态指示信号,BUSY引脚的设计处理直接影响着系统交互的可靠性和功能拓展性。本文将从电路原理、应用场景、设计策略三个维度,深入解析BUSY引脚的技术特性及其工程实践要点。一、BUSY引脚工作原理与信号特性1.1 电气参数电平标准:输出3.3V TTL电平(与VDD同源)驱动能力:典型值±8mA(可直接驱动LED)响应延迟:语
    广州唯创电子 2025-03-26 09:26 73浏览
  • 在人工智能与物联网技术蓬勃发展的今天,语音交互已成为智能设备的重要功能。广州唯创电子推出的WT3000T8语音合成芯片凭借其高性能、低功耗和灵活的控制方式,广泛应用于智能家居、工业设备、公共服务终端等领域。本文将从功能特点、调用方法及实际应用场景入手,深入解析这款芯片的核心技术。一、WT3000T8芯片的核心功能WT3000T8是一款基于UART通信的语音合成芯片,支持中文、英文及多语种混合文本的实时合成。其核心优势包括:高兼容性:支持GB2312/GBK/BIG5/UNICODE编码,适应不同
    广州唯创电子 2025-03-24 08:42 158浏览
  • 无论你是刚步入职场的新人,还是已经有几年经验的职场老手,培养领导力都是职业发展中一个至关重要的环节。拥有良好的领导能力不仅能让你从人群中脱颖而出,也能让你在团队中成为一个值得信赖、富有影响力的核心成员。什么是领导力?领导力并不仅仅意味着“当老板”或者“发号施令”。它更多地是一种能够影响他人、激发团队潜能,并带领大家实现目标的能力。一位优秀的领导者需要具备清晰的沟通能力、解决问题的能力,以及对人心的深刻理解。他们知道如何激励人心,如何在压力下保持冷静,并能在关键时刻做出正确的决策。如何培养领导力?
    优思学院 2025-03-23 12:24 94浏览
  •        当今社会已经步入了知识经济的时代,信息大爆炸,新鲜事物层出不穷,科技发展更是一日千里。知识经济时代以知识为核心生产要素,通过创新驱动和人力资本的高效运转推动社会经济发展。知识产权(IP)应运而生,成为了知识经济时代竞争的核心要素,知识产权(Intellectual Property,IP)是指法律赋予人们对‌智力创造成果和商业标识等无形财产‌所享有的专有权利。其核心目的是通过保护创新和创意,激励技术进步、文化繁荣和公平竞争,同时平衡公共利益与
    广州铁金刚 2025-03-24 10:46 75浏览
  • 在智能终端设备开发中,语音芯片与功放电路的配合直接影响音质表现。广州唯创电子的WTN6、WT588F等系列芯片虽功能强大,但若硬件设计不当,可能导致输出声音模糊、杂音明显。本文将以WTN6与WT588F系列为例,解析音质劣化的常见原因及解决方法,帮助开发者实现清晰纯净的语音输出。一、声音不清晰的典型表现与核心原因当语音芯片输出的音频信号存在以下问题时,需针对性排查:背景杂音:持续的“沙沙”声或高频啸叫,通常由信号干扰或滤波不足导致。语音失真:声音断断续续或含混不清,可能与信号幅度不匹配或功放参数
    广州唯创电子 2025-03-25 09:32 66浏览
  • 核心板简介创龙科技 SOM-TL3562 是一款基于瑞芯微 RK3562J/RK3562 处理器设计的四核 ARM C ortex-A53 + 单核 ARM Cortex-M0 全国产工业核心板,主频高达 2.0GHz。核心板 CPU、R OM、RAM、电源、晶振等所有元器件均采用国产工业级方案,国产化率 100%。核心板通过 LCC 邮票孔 + LGA 封装连接方式引出 MAC、GMAC、PCIe 2.1、USB3.0、 CAN、UART、SPI、MIPI CSI、MIPI
    Tronlong 2025-03-24 09:59 184浏览
  • WT588F02B是广州唯创电子推出的一款高性能语音芯片,广泛应用于智能家电、安防设备、玩具等领域。然而,在实际开发中,用户可能会遇到烧录失败的问题,导致项目进度受阻。本文将从下载连线、文件容量、线路长度三大核心因素出发,深入分析烧录失败的原因并提供系统化的解决方案。一、检查下载器与芯片的物理连接问题表现烧录时提示"连接超时"或"设备未响应",或烧录进度条卡顿后报错。原因解析接口错位:WT588F02B采用SPI/UART双模通信,若下载器引脚定义与芯片引脚未严格对应(如TXD/RXD交叉错误)
    广州唯创电子 2025-03-26 09:05 77浏览
  • 人形机器人产业节奏预估:2024年原型机元年,2025年小规模量产元年。当宇树科技H1人形机器人以灵动的手部动作在春晚舞台上演创意融合舞蹈《秧Bot》,舞出"中国智造"时,电视机前十几亿观众第一次深刻意识到:那个需要仰望波士顿动力的时代正在落幕。*图源:宇树科技短短数周后,宇树G1机器人又用一段丝滑的街舞在网络收割亿级播放量,钢铁之躯跳出赛博朋克的浪漫。2月11日,宇树科技在其京东官方旗舰店上架了两款人形机器人产品,型号分别为Unitree H1和G1。2月12日,9.9万元的G1人形机器人首批
    艾迈斯欧司朗 2025-03-22 21:05 137浏览
  • 在智能终端设备快速普及的当下,语音交互已成为提升用户体验的关键功能。广州唯创电子推出的WT3000T8语音合成芯片,凭借其卓越的语音处理能力、灵活的控制模式及超低功耗设计,成为工业控制、商业终端、公共服务等领域的理想选择。本文将从技术特性、场景适配及成本优势三方面,解析其如何助力行业智能化转型。一、核心技术优势:精准、稳定、易集成1. 高品质语音输出,适配复杂环境音频性能:支持8kbps~320kbps宽范围比特率,兼容MP3/WAV格式,音质清晰自然,无机械感。大容量存储:内置Flash最大支
    广州唯创电子 2025-03-24 09:08 192浏览
  •       知识产权保护对工程师的双向影响      正向的激励,保护了工程师的创新成果与权益,给企业带来了知识产权方面的收益,企业的创新和发明大都是工程师的劳动成果,他们的职务发明应当受到奖励和保护,是企业发展的重要源泉。专利同时也成了工程师职称评定的指标之一,专利体现了工程师的创新能力,在求职、竞聘技术岗位或参与重大项目时,专利证书能显著增强个人竞争力。专利将工程师的创意转化为受法律保护的“无形资产”,避免技术成果被他人抄袭或无偿使
    广州铁金刚 2025-03-25 11:48 125浏览
  • 今年全国两会期间,“体重管理”和“育儿”整体配套政策引发了持久广泛关注。从“吃”到“养”,都围绕着国人最为关心的话题:健康。大家常说“病从口入”,在吃这件事上,过去大家可能更多是为了填饱肚子,如今,消费者从挑选食材到厨电都贯彻着健康的宗旨,吃得少了更要吃得好了。这也意味着在新消费趋势下,谁能抓住众人的心头好,就能带起众人的购买欲望,才能在新一轮竞争中脱颖而出。作为家电行业的风向标,在2025年中国家电及消费电子博览会(AWE)上,这两个话题也被媒体和公众频繁提及。深耕中国厨房三十余年的苏泊尔再次
    华尔街科技眼 2025-03-22 11:42 83浏览
我要评论
0
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦