融合企业内部数据,赋能工业场景多模态智能决策

原创 爱分析ifenxi 2024-08-09 13:28




工业场景内,结构化数据与非结构化数据多散落在内部系统里,数据孤岛会造成企业分析决策的一大瓶颈,严重阻碍发展进程。如何利用好多模态数据进行分析是工业场景的重中之中,本文将从四个方面对其进行介绍。

分享嘉宾|胡也畅  Fabarta 企业智能分析平台(ArcPilot)产品负责人

内容已做精简,如需获取专家完整版视频实录和课件,请扫码领取。


01

多模态决策智能的现状与路径

1.1工业场景下的多模态数据现状

根据 IDC 报告显示,目前企业结构化数据仅占到全部数据量的 20%,其余 80% 都是以文件形式存在的非结构化和半结构化数据。该现状在工业场景下只多不少,横向观察工业场景的数据现状:

1、结构化数据已经实现一定程度上的数据智能(BI)。以可视化监造、 TPM 、 MES 、 IoT 系统 、通用仪表大盘为典型代表。结构化数据通过数据智能或者商业智能在一定程度上实现了智能性表达。
2、非结构化、半结构化数据的分析与决策还在非常早期阶段。非结构化数据的代表是以文件为主的传统知识库,包含设备部件参数、设备操作手册、故障运维手册等等。非结构化数据部分对大多企业来说,还处于早期阶段,多数仅有内部知识库产品,把相应手册、文档材料往上放,供内部人员使用和分享。
3、在决策智能场景下,将结构化数据和非结构化数据融合,可以进一步放大数据融通后的价值,提供更多的决策支持。在未来,无论是面向不同任务意图的大小模型串联,或是根据智能体构建的相关工具进行编排和调用等触发智能决策,目前都处于初期阶段,这也是本文重点讨论的内容。
1.2结构化数据的智能决策之路
从上世纪80 开始,以 Oracle 、 PG 数据库为代表的经典数据库,再到 2010 年代大数据产品的爆炸和兴起,以及在同一时间兴起的工业界 IoT 相关传感器数据,长期都以 BI 作为数据的出口。
在 BI 领域,有句话是“得益于 BI 的同时苦于 BI ”, 主要因为 BI 的开发周期相对较长,而业务迭代快。部分制造业客户反馈,“业务迭代速度 3- 6 个月左右,但等到 BI 报表开发出来,业务窗口已经过半。”另外 BI 的业务逻辑、口径较复杂,一旦业务逻辑和口径理解不一致,会直接导致最后的数值偏差大。在此过程中,数据的消费者从传统数据开发者逐步过滤到业务用户,这是当前数据的现状。
大模型的兴起使其逐步成为传统BI的挑战者。无论是通过 text2SQL 将自然语言转化成数据库的查询语言,还是通过 text2metrics 依托于现有指标系统将自然语言转化为指标系统的查询方法,亦或是通过 text2API 将自然语言转化为不同数据库或系统的 API 调用,这些技术都致力于将自然语言转化为数据查询。网上有很多 Demo 搭建教程,但搭建 Demo 很容易,然而将 Demo 的落地却很困难,最常见的难题是问不准。主要原因有三个:
首先,在询问具体事件时,语义模糊会影响整个识别过程以及最后的结果。其次,问题类自然语言较为复杂,有时人都不能百分百理解准确,大模型也不能理解。例如“总量”这个概念在不同企业和不同场景定义都不一样,有时是加权,有时是求和。最后一点,大模型给出的结果缺乏可解释性。当企业用户对数据产生质疑时,便会对整个系统产生质疑。这三点是利用大模型进行数据决策时会遇到的问题。

枫清科技(Fabarta)去年专注解决问得准的问题,目前已经有比较完备的解决方案,但同时也遇到了新的问题。我们发现,业务用户对于“问得准”需求后的满足时间阈值只有 3- 6 个月。之后客户会提出新的需求:如何让数据准确引导决策?举个例子,当我们已经解决“某某工厂的产量与能耗分别是多少”这个问题,接下来领导层会更加关注以下几个问题:哪个工厂能耗最高?哪个最低?能耗高的原因是什么?哪些方面的改进能够减少能耗?同时,客户也会关注,在获取数据后能否将企业内部已经有的机器学习、 AI 学习模型或者生产制造中的机理模型串联起来,并根据问题将结果生成对应的报告,让大模型参与落地和自主执行。这部分更多是大模型落地的深水区,我们也在不同的角度反复自问:

  • Infra Ready for AI ?在大模型自主判断的场景时,数据基础设施是否准备就绪?

  • Data Ready for AI ?准备判断的数据本身是否值得信任,质量是否过关?

  • AI Ready for Apps ?当前以上两个问题都被解决了以后,要更深入地思考 AI 的自主决策是否能够实际帮助到线上的业务系统,业务应用能否直接产生价值。

1.3非结构化数据的智能决策之路

非结构化数据与结构化数据的智能决策稍有不同。非结构化数据以知识库产品为代表。根据观察,大部分中国制造业企业处于 1.0 阶段,内部有类似于 Sharepoint 的文档管理系统,将不同部门的文档进行上传,在文档之间做检索。一般而言没有语义理解的搜索产品,更多的还是文档归档和分发。

随着深度学习技术的出现,有了更多的基于深度学习和图谱的知识问答—— KGQA ,也就是2.0时代。过去利用深度学习训练一些 BERT 语言模型,进行意图识别、对话识别。同时会遇到两个瓶颈性问题:一是小模型的泛化能力较弱,一旦数据与问题发生了变化,回答的准确度很有可能无法覆盖。二是如果采用了 KGQA 图谱问答方案,企业会耗用大量时间在图谱构造的标注工作上。
大模型在企业落地的最经典场景是大模型加外挂知识库,同时也是我们所说的 3.0 时代。目前企业有望于直接从 1.0 时代跃迁到 3.0 时代,主要有以下几个原因:首先,在大模型的泛化推理能力显著增强,我们没有必要拿着相同的逻辑重复训练大模型。其次,随着大模型能力的加强,对非结构化数据的解析有了极大程度的提升。举个例子,做大数据相关产品时,有一句话“ trash in trash out ”,当系统位数据质量非常低,或系统无法理解时,往往系统无法给出建设性答复或分析,而大模型在非结构化数据解析和理解上有了很大程度的提高。所以很多企业逐步采用大模型的外挂知识库来解决对非结构化数据的理解问题。
在实际业务落地中,基于简单的 RAG 的检索问答方案,无法检索复杂文档之间的关联关系,从而导致检索精度相对较低,检索出的内容有大量噪音,导致回答出现幻觉以及不准确。这也是我们在 3.0 时代致力解决的问题。

对于非结构化数据如何参与到企业决策智能,其中最重要是需要把海量文档间的关系进行梳理,包括文档之间、文档作者之间、文档中细节知识片段的关系,在整个检索增强链路中都会取到非常重要的联系,提高知识问答的准确率。对于如何通过内容的理解参与决策,例如利用知识库里的标准内容对上传的方案进行分析,甚至给到修改建议,这些都是建立在对海量知识理解的基础之上做决策。最终决策方案将与业务系统做深度的融合,赋能已有的制造业领域系统。

02

多模态决策智能的数据基础

回到制造业行业,该行业的特点在于数据分散,设备相关手册与资料存在于众多系统里。当多模态数据无法融合时,知识本质上会以一个个知识孤岛的形式存储在不同的业务系统中。知识孤岛成为了大部分企业进行业务分析的瓶颈。

2.1 Data Ready for AI: 统一语义层

做好数据基础设施的要点之一是统一语义层。谈到统一语义层时会涉及到元数据,元数据是描述数据的数据。有了语义层后,无论哪种数据来源,首先都会用元数据进行收口,同时用更智能的方式补齐元数据,发现、构建元数据之间的关联关系,最终将相似的语义进行统一,实现面向业务的语义层。
有了面向业务的语义层后,可以帮助大模型更好的感知,当遇到特定任务、话题后,将采取哪些语义层数据解决问题,统一语义层再分发到具体的数据源上获取相应的数据,实现大模型理解数据意图能力的进步。统一语义层中有两个功能分支较为重要。

  • 元数据 for AI 。提供规范的元数据,让大模型更好地理解元数据、更好地落地。

  • AI for 元数据。半结构化、非结构化数据的元数据质量相对较差,利用 AI 技术帮助异构元数据进行智能补齐与关联发现。从而为统一层的梳理提供更好的基础表达。

2.2 图+向量的融合方案
相比于传统的向量解决方案,对于有关联、确定性知识,我们提供是“图+向量”融合的解决方案。这里的“图”并不是指传统意义的图片,而是存储关联关系的图数据库。在大模型领域,大家对向量数据库普遍比较熟悉,因为向量数据库可以处理许多基于概率的信息,而大模型多基于概率进行推演。另外,前文所提到所有的关联关系,更适用于原生存储在图数据库系统里,图数据库更多关注多源异构数据之间的关系,可解释的智能。有了向量数据库和图数据库两种技术加持,可更好地将数据转化成图和向量融合的知识。

企业内部数据进入向量数据库与图数据库的判断标准是什么?对于数据间的关联关系,比如说元数据、结构化数据、非结构化数据的关联关系,都可以作为确定性知识存储在图数据库中;同时,将文本、图片、音频等多模态数据存储在向量数据库当中。当确定性知识和概率性知识融合后,多模态智能引擎作为 AI 数据基础设施,可以显著优化大模型实际场景落地的质量。

03

实际落地案例

3.1统一语义层增强的多模态知识融合分析
统一的语义层如何助力多模态知识的融合和分析?这是较经典的知识库场景,假设企业存在上万文档,而一个话题背后对应的潜在切片能达到百万甚至千万级别。这种情况下,普通 RAG 会召回非常多的相关片段,直接导致回答不准确。当有了统一元数据的加持以后,效果明显更准确。首先当用户登录到系统里后,可以准确识别其身份,用户问道“某设备的具体参数分别是什么?”,与其直接做向量数据召回,更多要思考问题和提问者背后的关联属性,如:
  • 结构化数据:如提问人所属工厂的信息。

  • 非结构化数据:如相关的设备参数文档。

  • 语义关联拓扑:如设备类型、生产商、文档信息。

有了数据表达后,能更精准定位到关联关系,如提问人所属具体工厂、问了哪些设备。来自哪些生产商以及相关文档等。虽然 Bad case 和 Good case 都可以给出回答,但是只有 Good case ,数据来源基于语义和数据的关联关系,更为精准,这种方案才能显著提升回答的质量和精准程度。

上图的例子中还需强调一点,用户提问到某起重机的具体参数,虽然在该提问者工作的工厂知识库中没有找到相关资料,但是在其他工厂有该设备的材料。系统会将这些资料根据其所属的工厂进行分门别类地进行回答和摘要总结,并不像普通 RAG 把所有资料打包直接输出。所以有了关联关系后,可以对知识本身进行扩展,进行更加准确的分析、理解和表达。

3.2统一语义层增强决策智能体
以问数为例,语义可以显著提升系统的智能化程度。在问数领域,大模型原生的理解能力,不管是对数据的理解能力,还是对 SQL 的理解能力,大概只能解决 30% - 50% 的问数常见问题,距离生产可用仍有非常大的差距。
首先,我们会在大模型原生能力基础之上加入对于语义的基础描述如表与字段的含义,完成后准确率会提升到 70%- 80% 级别,相比于原生理解能力有了很大的进步。但仍不足以保证生产可用,所以需进一步引入基于语义的业务含义描述,包括动态少样本学习、思维链。有了语义描述后,将准确率提升至 85% 甚至以上。在我们刚结束的一个  POC 项目中,已实现 100% 业务语义覆盖度。统一语义以及基于语义的业务描述会对智能决策产生非常显著的影响。

只有解决了问数、取数才可以迈向下一阶段,也就是数据的归因分析与自主决策。

第一要解决问的到与问的准,很难实现一线用户都能使用学术性词汇表达自己的问题。所以我们不仅会对关键词做模糊匹配,同时问题涉及多个可能的字段,也会做一个澄清,说明具体含义。

第二要解决问得清和看得明。当用户提问的同时还需要另外两个指标,这里都能提供正确回答,这时会有类似 BI 的需求,我们不仅仅能给用户生成智能图表,把数据库的数据进行原始表达,也能基于对业务语义的理解生成对应的图表展示,包括摘要总结,能够在会话里获得更多信息和资料。

04

大模型智能体应用构建平台

大模型智能体应用构建平台,从产品定位角度而言,向下更多会做大模型的能力支持,包括通用基础大模、专业领域小模型。向上则通过平台对接大模型的典型场景,如智能对话、应用助理、数据分析、行业领域的决策支撑等。同时对接企业里不同数据,把数据全部都融汇到私有记忆体中,为所有决策分析提供数据保障。

枫清科技(Fabarta)正在进行和落地的案例之一:引入智能体解决高阶复杂的制造业问题。在智能体领域,核心解决方案是利用内外循环思路。问与查都是较简单的数据表达,复杂情况需要智能体能力进行数据调度。为解决复杂问题,利用外循环规划 Agent  实现任务拆解,再根据不同任务在内循环中选择合适的调用工具,包括反思。整个这个过程同步反馈到计划的主智能体,由智能体进行迭代学习、反思,对任务进行修改。

举个较简单的例子,当用户问:“明天天气怎么样?”,这个问题对于人类而言非常简单。但把问题进行逐一拆解,首先在外循环中对问题的解决做明确主题计划,要明确用户所在地,通过问询、 IP 、网络信号等获得,还要获得需要查询天气的日期。只有以上两个条件都确定后,最终才会执行天气的查询。每个任务都会进入到内循环状态,实时对任务、工具的选择进行感知。在实际工业场景中,智能体方案落地时,往往会带来大量的工具反复调用,包括工具间串行和并行的执行,这也是深水区解决复杂任务的最大挑战。

以上是本次分享的全部内容,如需获取专家完整版视频实录和课件可扫码领取。

长按二维码,领取完整版视频实录和课件

Fabarta 企业智能分析平台(ArcPilot)产品负责人。专注于以产品连接业务需求与技术实现,以用户为中心驱动产品的商业化进程。原阿里云机器学习平台 PAI、图计算服务 Graph Compute 产品经理。原 IBM 认知计算解决方案研究院产品经理,负责 IBM 咨询团队在大中华区相关软件资产的产品设计。

注:点击左下角“阅读原文”,领取专家完整版实录和分享课件


爱分析ifenxi 爱分析是一家中国领先的数字化市场研究与咨询机构。
评论
  • 村田是目前全球量产硅电容的领先企业,其在2016年收购了法国IPDiA头部硅电容器公司,并于2023年6月宣布投资约100亿日元将硅电容产能提升两倍。以下内容主要来自村田官网信息整理,村田高密度硅电容器采用半导体MOS工艺开发,并使用3D结构来大幅增加电极表面,因此在给定的占位面积内增加了静电容量。村田的硅技术以嵌入非结晶基板的单片结构为基础(单层MIM和多层MIM—MIM是指金属 / 绝缘体/ 金属) 村田硅电容采用先进3D拓扑结构在100um内,使开发的有效静电容量面积相当于80个
    知白 2025-01-07 15:02 57浏览
  • PLC组态方式主要有三种,每种都有其独特的特点和适用场景。下面来简单说说: 1. 硬件组态   定义:硬件组态指的是选择适合的PLC型号、I/O模块、通信模块等硬件组件,并按照实际需求进行连接和配置。    灵活性:这种方式允许用户根据项目需求自由搭配硬件组件,具有较高的灵活性。    成本:可能需要额外的硬件购买成本,适用于对系统性能和扩展性有较高要求的场合。 2. 软件组态   定义:软件组态主要是通过PLC
    丙丁先生 2025-01-06 09:23 82浏览
  • 这篇内容主要讨论三个基本问题,硅电容是什么,为什么要使用硅电容,如何正确使用硅电容?1.  硅电容是什么首先我们需要了解电容是什么?物理学上电容的概念指的是给定电位差下自由电荷的储藏量,记为C,单位是F,指的是容纳电荷的能力,C=εS/d=ε0εrS/4πkd(真空)=Q/U。百度百科上电容器的概念指的是两个相互靠近的导体,中间夹一层不导电的绝缘介质。通过观察电容本身的定义公式中可以看到,在各个变量中比较能够改变的就是εr,S和d,也就是介质的介电常数,金属板有效相对面积以及距离。当前
    知白 2025-01-06 12:04 163浏览
  • 根据Global Info Research项目团队最新调研,预计2030年全球封闭式电机产值达到1425百万美元,2024-2030年期间年复合增长率CAGR为3.4%。 封闭式电机是一种电动机,其外壳设计为密闭结构,通常用于要求较高的防护等级的应用场合。封闭式电机可以有效防止外部灰尘、水分和其他污染物进入内部,从而保护电机的内部组件,延长其使用寿命。 环洋市场咨询机构出版的调研分析报告【全球封闭式电机行业总体规模、主要厂商及IPO上市调研报告,2025-2031】研究全球封闭式电机总体规
    GIRtina 2025-01-06 11:10 102浏览
  • 根据环洋市场咨询(Global Info Research)项目团队最新调研,预计2030年全球无人机锂电池产值达到2457百万美元,2024-2030年期间年复合增长率CAGR为9.6%。 无人机锂电池是无人机动力系统中存储并释放能量的部分。无人机使用的动力电池,大多数是锂聚合物电池,相较其他电池,锂聚合物电池具有较高的能量密度,较长寿命,同时也具有良好的放电特性和安全性。 全球无人机锂电池核心厂商有宁德新能源科技、欣旺达、鹏辉能源、深圳格瑞普和EaglePicher等,前五大厂商占有全球
    GIRtina 2025-01-07 11:02 58浏览
  • 在智能家居领域中,Wi-Fi、蓝牙、Zigbee、Thread与Z-Wave等无线通信协议是构建短距物联局域网的关键手段,它们常在实际应用中交叉运用,以满足智能家居生态系统多样化的功能需求。然而,这些协议之间并未遵循统一的互通标准,缺乏直接的互操作性,在进行组网时需要引入额外的网关作为“翻译桥梁”,极大地增加了系统的复杂性。 同时,Apple HomeKit、SamSung SmartThings、Amazon Alexa、Google Home等主流智能家居平台为了提升市占率与消费者
    华普微HOPERF 2025-01-06 17:23 141浏览
  • 彼得·德鲁克被誉为“现代管理学之父”,他的管理思想影响了无数企业和管理者。然而,关于他的书籍分类,一种流行的说法令人感到困惑:德鲁克一生写了39本书,其中15本是关于管理的,而其中“专门写工商企业或为企业管理者写的”只有两本——《为成果而管理》和《创新与企业家精神》。这样的表述广为流传,但深入探讨后却发现并不完全准确。让我们一起重新审视这一说法,解析其中的矛盾与根源,进而重新认识德鲁克的管理思想及其著作的真正价值。从《创新与企业家精神》看德鲁克的视角《创新与企业家精神》通常被认为是一本专为企业管
    优思学院 2025-01-06 12:03 113浏览
  • By Toradex 秦海1). 简介嵌入式平台设备基于Yocto Linux 在开发后期量产前期,为了安全以及提高启动速度等考虑,希望将 ARM 处理器平台的 Debug Console 输出关闭,本文就基于 NXP i.MX8MP ARM 处理器平台来演示相关流程。 本文所示例的平台来自于 Toradex Verdin i.MX8MP 嵌入式平台。  2. 准备a). Verdin i.MX8MP ARM核心版配合Dahlia载板并
    hai.qin_651820742 2025-01-07 14:52 36浏览
  • 大模型的赋能是指利用大型机器学习模型(如深度学习模型)来增强或改进各种应用和服务。这种技术在许多领域都显示出了巨大的潜力,包括但不限于以下几个方面: 1. 企业服务:大模型可以用于构建智能客服系统、知识库问答系统等,提升企业的服务质量和运营效率。 2. 教育服务:在教育领域,大模型被应用于个性化学习、智能辅导、作业批改等,帮助教师减轻工作负担,提高教学质量。 3. 工业智能化:大模型有助于解决工业领域的复杂性和不确定性问题,尽管在认知能力方面尚未完全具备专家级的复杂决策能力。 4. 消费
    丙丁先生 2025-01-07 09:25 74浏览
  • 本文介绍Linux系统更换开机logo方法教程,通用RK3566、RK3568、RK3588、RK3576等开发板,触觉智能RK3562开发板演示,搭载4核A53处理器,主频高达2.0GHz;内置独立1Tops算力NPU,可应用于物联网网关、平板电脑、智能家居、教育电子、工业显示与控制等行业。制作图片开机logo图片制作注意事项(1)图片必须为bmp格式;(2)图片大小不能大于4MB;(3)BMP位深最大是32,建议设置为8;(4)图片名称为logo.bmp和logo_kernel.bmp;开机
    Industio_触觉智能 2025-01-06 10:43 87浏览
  • 每日可见的315MHz和433MHz遥控模块,你能分清楚吗?众所周知,一套遥控设备主要由发射部分和接收部分组成,发射器可以将控制者的控制按键经过编码,调制到射频信号上面,然后经天线发射出无线信号。而接收器是将天线接收到的无线信号进行解码,从而得到与控制按键相对应的信号,然后再去控制相应的设备工作。当前,常见的遥控设备主要分为红外遥控与无线电遥控两大类,其主要区别为所采用的载波频率及其应用场景不一致。红外遥控设备所采用的射频信号频率一般为38kHz,通常应用在电视、投影仪等设备中;而无线电遥控设备
    华普微HOPERF 2025-01-06 15:29 122浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦