本文来源于装备质量
陆云峰 LU Yun-feng;张清晨 ZHANG Qing-chen;李鸣宇 LI Ming-yu
(航天工程大学,北京101416)
摘要:知识图谱作为一项前沿的集大数据和人工智能于一体的研究数据之间关联关系的综合技术,能有效展示错综复杂数据之间的关联关系。面对目前我国航天装备质量数据孤立、标准不一、关联性差、单个数据使用价值不高、无法发挥出数据最大效能等现状。尝试把知识图谱引入航天装备质量领域,在概要介绍知识图谱的基础上,阐述了航天装备质量知识图谱的构建思路和步骤,并介绍它在精准搜索、辅助决策、检测质量故障等方面的典型应用。
关键词:航天装备质量;知识图谱;模式层;数据层
航天装备具有技术密集、系统复杂、生命周期长等典型特点,在其立项论证、方案设计、工程研制、试验定型、生产订购、调配保障、运行维护、退役报废等全寿命周期的各个阶段都会产生大量的数据。这些数据分属于装备设计方、研制方、生产方、试验方、使用方等不同单位,数据孤立、标准不一、关联性差、单个数据使用价值不高,无法在航天装备质量管理中发挥出最大效能。怎样处理和利用这些海量的数据来提升航天装备质量,是每一个航天质量人认真思考的问题。知识图谱作为一项前沿的集大数据和人工智能于一体的研究数据之间关联关系的综合技术,能有效展示错综复杂数据之间的关联关系。针对航天装备质量大数据特点,本文研究探讨知识图谱在航天装备质量领域的典型应用。
知识图谱是一种描绘实体之间关系的语义网络 [1],是人工智能重要研究领域——知识工程的主要表现形式之一。知识图谱本质上是语义网络,是一种基于逻辑和图的数据结构,由“节点”和“边”组成。在知识图谱里,每个节点表示现实世界中存在的“实体”(如:装备,研制单位),每条边表示实体与实体之间的关系(如:可靠性,安全性)。知识图谱是关联关系最有效的表示方式。
知识图谱通过三元组(RDF),即“实体—关系—另一实体”或“实体—属性—属性值”集合的形式,阐述世间万物之间的关系。三元组是知识图谱最基本的知识单元,三元组经过知识融合和数据推理,把非线性世界中的知识信息结构化,形成维度和层次更为复杂的关系网,达到认识世界实体的目的(如图1 所示)。
图1 知识图谱阐述万物关系的模式
通俗地讲,知识图谱就是把所有不同种类的信息连接在一起而得到的一个关系网络[2]。知识图谱提供了从“关系”的角度去分析问题的能力。
知识图谱从架构上分,可分为逻辑架构和技术架构。
1.2.1 逻辑架构
知识图谱在逻辑上可以分为模式层和数据层两个层次。数据层是以三元组为表现形式的客观事实集合,知识以事实为单位进行存储,而模式层是它的“上层建筑”,主要是通过本体库来规范数据层的一系列事实表达,是积累沉淀的知识集合。本体是一种概念化的明确的规范说明,用来描述某个领域内的概念及概念间关系,是在共享的范围内大家共同认可的、明确的、唯一的定义。简单地说,构建知识图谱本体库就是定义数据关系规则。
按照逻辑架构的构建顺序,知识图谱构建方式可分为自底向上和自顶向下两种。“自底向上”的方式是指从数据层入手,利用机器学习,通过对现实世界海量庞杂的知识数据进行初步分析,根据数据特点抽象出与之相匹配的知识图谱模式层,即先构建底层数据层进而推演出顶层模式层。这种构建方式常用于通用领域知识图谱的构建,因为通用领域知识图谱对数据关系发掘的深度大多要求不高;“自顶向下”的方式是在领域知识体系成熟完备的条件下首先进行知识图谱模式层的构建,进而补全相应数据层。即先定数下根据专业体系先定义描述数据关系和属性的规则,再抽取符合规则的数据生成知识图谱。这种构建方式适用于需要深度挖掘数据关系的特定专业领域知识图谱的构建。
1.2.2 技术架构
从技术实现路径上讲,知识图谱构建从数据源开始,需经历知识抽取、知识融合、知识加工等步骤[3]。原始的数据通过知识抽取或数据整合的方式转换为三元组形式,然后大量的三元组数据再经过实体对齐(统一不同信息源中同一实体的不同标签),加入数据模型,形成标准的知识表示,过程中如产生新的关系组合,通过知识推理形成新的知识形态,与原有知识共同经过质量评估,完成知识融合,最终形成完整形态上的知识图谱。知识图谱的技术架构如图2 所示。
图2 知识图谱技术架构
航天装备质量知识图谱是基于图2 结构的航天装备质量知识库。它通过形式化描述航天装备质量领域概念、实体、属性,以及之间关系的方式,将概念、实体、属性相互连接,构成航天装备质量领域知识的立体网状结构图,进而在航天装备质量领域实现知识图谱的精准搜索、智能问答、辅助决策等相关功能。
构建航天装备质量知识图谱,旨在将多阶段、多领域的装备质量数据层层分解并关联起来,整合以往离散的、分段的、关联性差的不同层面的质量数据来实现共同反映航天装备质量的整体面貌。同时,通过知识图谱辅助决策、诊断质量问题等应用来提高航天装备全过程、全要素、全寿命周期质量管理能力。
航天装备质量知识图谱构建包括数据源获取、数据层和模式层构建。由于航天装备之间的关系和属性分析需要航天装备质量领域的专业支撑,因此航天装备质量知识图谱构建主要采用自顶向下的方式进行,知识图谱框架设计如图3 所示。
图3 航天装备质量知识图谱构建框架
2.2.1 数据源获取
航天装备在从立项研制到退役报废全寿命周期的各个阶段都会产生大量的质量数据,这些数据分属不同单位拥有。由于每个单位关注装备质量的重点不一样,造成各单位的质量数据格式标准不一、关联性不强,加上航天装备保密要求高,事实上很难形成数据共享和实现数据的整体价值。为获得构建航天装备质量知识图谱所需的海量数据,首先必须由军方牵头,把参与各型航天装备工作的军地单位所拥有的质量数据统一起来,建立涵盖主要航天装备及装备设计质量、生产质量、试验质量、订购质量、维修质量、在轨运行质量等全寿命周期各个阶段的质量数据库,规范质量数据采集、分发和存档的格式,尽量形成结构或半结构化数据源,供构建知识图谱使用。
2.2.2 模式层构建
采用本体方法构建模式层,包括本体构建、关系构建和属性构建。航天装备质量知识图谱本体构建实际上就是规范化描述航天装备质量系统的过程。
航天装备种类各异、型号众多,首先可以将航天装备作为一个本体进行概念抽象和分析,以此确定本体构建的范围。按照装备功能可以把航天装备分为信息支援、态势感知、战场环境、发射测控、空间对抗等五大类型。每一类装备又可以作为一个本体分为若干小类。比如天基信息支援类装备包含卫星子类,卫星则又包含侦测、预警、通信等各种类型,在每一种类型卫星里又包含很多型号,型号还分为更细粒度的分系统、零部件和元器件。
对于具体的航天装备,本文在征询专家意见的基础上,选取功能需求、功能指标、功能故障三个概念来描述和定义装备的质量。功能需求是指航天装备需要具备的功能,包含航天装备技战术功能和装备通用质量(可靠性、维修性、测试性、安全性、保障性、环境适应性等)方面的要求;功能指标是反映装备功能的战技术指标和装备通用质量指标。质量故障是指装备功能需求和实际功能指标不符而导致的装备质量问题。
明确本体(概念)后,构建本体库还需要定义本体之间的关系和属性。本文结合航天装备使用的实际情况,借助专家的经验和智慧。对本体关系和属性分析作出如下定义:航天装备之间的关系用组成、配套、搭载、支援等概念来描述,如火箭和卫星的搭载关系;功能需求和功能指标之间的关系用匹配、互斥、竞争等概念来定义。匹配是指功能指标正好反映功能需求,互斥是指某些指标在特定功能实现上是不相容的,竞争是指某些指标对于特定功能实现是此消彼长的;质量故障用故障发生时间段(装备全寿命周期的某个阶段)、故障部位(分系统、元器件等)、责任单位、故障指标表现特征、影响分析、处理措施、归零情况等字段来描述和抽取故障的属性。为了验证这些关系和属性定义是否科学可行,可以利用仿真模拟手段加以验证。验证合格后,把它转化为机器语言即形成航天装备知识图谱的模式层。
2.2.3 数据层构建
根据上述本体层构建的关系和属性定义,利用自然语言处理技术,对军队牵头建设的包含航天装备全寿命周期各个阶段的结构化、半结构化和非结构化质量数据进行实体抽取、关系抽取和属性抽取。对于符合条件的数据便以知识的形式存储形成航天装备知识图谱的数据层。
2.2.4 对齐和加工
知识图谱中的每一个实体只能有一个身份代码。航天装备全寿命周期种不同阶段的质量数据,有可能指向同一个实体,所以对于多源异构数据形成的知识,还必须进行实体对齐,即合并和消除歧义。在有新的数据源加入时,机器借助聚类算法等技术进行机器学习和推理,可能形成新的知识。新知识正确与否,需要人工对其质量加以评估,评估合格后才能加入到数据层形成新的知识,完成知识图谱更新。数据层的知识以图的形式展示出来便构成了航天装备质量知识图谱。
精准查询是航天装备质量知识图谱最基本的应用。和基于统计分析的搜索不一样,我们常见的网上搜索结果出来的都是网页,是否真正符合我们的需要尚需进一步查看验证。但知识图谱由于实现了细粒度、多维度、多层次关联,且机器能实现对自然语言的理解、分析,所以,当需要查找某阶段、某方面的航天装备质量数据时,可以非常便捷、精准地搜索到我们想要的结果,搜索效率极大地提高。
航天装备的质量既不是生产出来的,也不是设计出来的,而是需要整体考虑装备全寿命周期整体的质量状况。当开展同类航天装备迭代升级型号设计时,需要考虑装备生产、使用、维修、报废等各个阶段的质量状况,利用知识图谱,可以很容易地发现装备在不同阶段所存在的质量问题,从而科学决策新型号的建设方案,科学分配各项指标;装备主管机关利用知识图谱,可以了解装备的整体质量状况,有针对性地定下决心抓装备质量建设。航天装备质量重大研讨活动,专家团队借助知识图谱可以充分占据“知识”资料,辅助决策。
对于在轨航天器的运行,输入在轨运行数据,利用知识图谱中的同型号航天器功能需求和功能指标的匹配程度可以监测发现装备运行状况是否正常。若出现异常,可对照知识图谱中质量故障发生异常的部位、时间段、责任单位、异常指标表现特征、后果影响等提示,采取处置措施,避免出现严重质量事故。
知识图谱的概念由谷歌于2012 年提出[4],随后在商业领域取得了长足发展。把知识图谱引入航天装备质量领域是应用大数据技术的一次大胆尝试。航天装备质量知识图谱建设的难点在于受装备种类繁多、数据类型庞杂、数据标准不一、数据保密要求高等因素的影响,只能主要采用自顶向下的方式构建。这种方式在关系和属性的定义上仍然依赖人工的参与,可以说构建过程复杂、难度很大。但作为大数据处理和利用的前沿技术,知识图谱在航天装备质量领域大有用武之地。
参考文献:
[1]沈华,熊开宇,闫斌,邱桃荣.知识图谱的用户兴趣向量化方法及应用[J].南昌大学学报(理科版),2020,44(06):610-616.
[2]赫中翮.面向中文知识图谱构建的知识抽取方法研究与实现[D].国防科学技术大学,2019.
[3]喻凡坤,胡超芳,罗晓亮,梁秀兵.无人系统故障知识图谱的构建方法及应用[J].计算机测量与控制,2020,28(10):71-76.
[4]杭婷婷,冯钧,陆佳民.知识图谱构建技术:分类、调查和未来方向[J].计算机科学,2021,48(02):175-189.
Application of Knowledge Graph in Quality Management of Space Equipment
(Space Engineering University,Beijing 101416,China)
Abstract: As a cutting-edge comprehensive technology integrating big data and artificial intelligence to study the association relationship among data, knowledge graph can effectively display the association relationship between complex data. In a long time, the quality data of space equipment in China was isolated, the standards were different, the relevance was poor, the value of single data was not enough, and the data can't be given full play to the maximum efficiency. To solve the problems mentioned above, the knowledge graph was introduced into the field of space equipment quality. Based on the brief introduction of the knowledge graph, the construction ideas and steps of the knowledge graph of space equipment quality are described. The typical applications in precision search, decision-making assistance and quality fault detection are introduced.
Key words: space equipment quality;knowledge graph;model layer;data layer
中图分类号:F407.5
文献标识码:A
文章编号:1006-4311(2021)32-173-03 doi:10.3969/j.issn.1006-4311.2021.32.056
作者简介:陆云峰(1975-),男,湖南邵阳人,讲师,硕士,研究方向为航天工程管理;张清晨(1993-),男,重庆人,助理工程师,硕士生,研究方向为项目质量管理;李鸣宇(1993-),男,吉林九台人,助理工程师,硕士生,研究方向为工程风险管理。
长按二维码识别关注我们