智能运维数据中台,协助华夏银行持续激活数据价值|案例研究

原创 爱分析ifenxi 2023-11-27 18:05

在银行数字化转型进入深水区的当下,保障业务的连续稳定运营,并在出现异常时,确保快速定位根因,及时恢复业务运行,降低损失是IT运维业务的重点目标。但是随着新技术、新业务的不断涌现,银行运维系统繁多,运维数据量大且结构复杂,运维数据烟囱效应明显,导致出现问题后,根因定位缓慢,业务稳定性难以保证。在此背景下,为了实现高可用性,运维数据平台化治理已经成为当务之急。
华夏银行截至2023年6月,已经实现了资产规模超过4万亿元的目标,在数字化转型方面,华夏银行紧扣“一流智慧生态银行”的转型目标。2023年从七大重点工程扩容至十大工程,共涉及123项重点任务。神盾工程作为七大重点工程之一,以强化智慧运行与安全管理项目群作为目标,提高安全运营能力。在此期间,华夏银行与擎创科技分别作为甲乙方牵头单位,共同推动《金融机构信息系统运维数据治理能力成熟度评估规范》的制订工作,并以华夏银行信息系统为样本,对银行运维数据的治理方法和平台搭建技术等开展了合作研究。在此背景下,擎创科技搭建了运维数据治理平台,依托智能大数据处理和分析能力,通过建立数据治理体系、建设数据治理平台、提供数据应用价值,从而提供更有效、更高效的数据管理手段和治理方法。
运维数据管理:运维数据管理不规范,运维数据无生命周期管理标准,存储取用对数据安全造成影响。
现状:现阶段银行对于运维数据没有统一的管理规范,各部门数据使用权限定义模糊,数据生命周期管理混乱。
问题:缺乏统一的运维数据管理规范,导致在数据取用后,存储位置、存储时间、何时删除、何时归总以及数据被用于何处等方面都没有明确的定义。同时,运维类数据中某些信息对于安全管理具有高度敏感性,例如日志类数据可能包含大量敏感信息。运维数据生命周期管理混乱对安全性提出了极大挑战。
运维数据标准:运维数据标准不统一,数据取用链条长且沟通消耗时间长,导致取用效率低。
现状:运维数据的含义属性、业务规则等标准不统一,数据取用时沟通成本高,重复性治理工作较多。
问题:由于缺乏统一的运维数据标准,在获取相关数据时,很难明确描述数据的具体内容,数据口径无法统一。这导致了大量的人员沟通、协调以及开发工作,从而使得整个流程变得缓慢且繁琐。
数据资产状况:银行业务系统庞杂,运维数据孤岛效应明显,运维数据资产状况模糊。
现状:随着银行业务系统日趋复杂,节点调用链关系也随之变得复杂,网状的关联结构带来了大量的复杂数据。同时,随着银行系统全面上云,分布式云计算,云原生架构逐步开始应用,银行内新老运维产品并行使用,且云上、云下架构并行,致使运维系统复杂程度逐渐上升,运维工作的历史包袱严重影响运维效率。
问题:在银行硬件设施及软件系统不断增加、升级的背景下,随着运维数据量不断攀升、数据种类日趋多样化以及数据变更愈发频繁,加之现阶段各运维产品数据需要独立处理,且数据之间未建立有效链接。致使数据孤岛效应明显,运维数据的基础质量不清晰,分布状况不明确,关联影响模糊,大幅增加了运维工作的复杂性。
为解决上述痛点,各银行急需从根源,转变运维数据的管理与使用模式,从被动的运维数据取用模式,向主动且规范的运维数据管理方式演进,最终实现高效的智能运维分析。
运维数据管理与标准:为了统一运维数据的管理与应用,首先需要与运维数据相关方共同制定数据治理体系,满足数据取用需求。
对于数据平台项目,首要任务并非直接处理数据,而是先建立健全的数据治理体系,包括数据管理规范与数据治理标准。只有在基础工作完成后,才能持续推进数据平台建设工作。在此过程中,首先,需确保涉及的相关人员明确目标,统一需求。在组织层面,应优先建立数据管理组织与制度,成立专门的管理组织,明确其管理职责和范围,并制定数据管理规范与数据治理标准。随后,通过明确的数据治理过程规范,实现数据质量、数据安全、数据生命周期、数据服务的管理能力。通过统一数据标准化规范,实现数据标准的对齐,包括标准指标体系,元、主数据模型、数据标签体系等。最终保证数据取用过程标准化,满足各方数据取用需求。
数据资产状况:为了实现运维数据资产的全面盘点,银行需要从数据源头出发,建立完整的指标体系将运维数据进行关联。
数据资产盘点需要从数据采集源头入手,通过统一采控底座实现数据的统一纳管,打破数据孤岛,拉通运维全域数据。原先,各个业务的运维数据源由各自分别维护,采集完成度无法监控,采集指标参差不齐。例如哪些设备需要监控哪些指标这类常规问题,无法给出全面标准的答案。为了打造运维数据平台基座,银行需要通过标准化指标体系,将指标采集完成程度,指标相关描述,指标采集粒度,指标阈值设定等进行标准化设定,从源头保证运维数据采集完成,且采集数据质量高度可用。在此过程中,加入指标映射,统一建立数据对象,将运维数据进行关联,并将原来的300多个指标优化至100个。实现运维数据资产盘点,为运维数据取用奠定可靠基座。
标准指标体系按照数据分类、指标分类分层划分如下图所示。
在华夏银行与擎创科技的合作案例中,整体项目落地实施分为四大阶段,战略规划阶段、治用并举阶段、场景丰富阶段、智能创新阶段。
首先,在战略规划阶段,通过与运维领导层,一线员工的深度沟通,输出统一的数据治理体系。明确数据管理方,生产方,消费方,保证在数据管理规范与数据治理标准达成一致。由于运维数据涉及取用方横跨价值链,为捋清各方应用要求,保证数据治理体系高度可用,擎创科技用了3个月的时间进行需求梳理。从运维数据管理方出发,明确数据权限控制与数据取用各方角色,随后与数据生产方、消费方进行多方访谈,明确数据生命周期管理需求(包括生产,存储,解析,消费,销毁等)、数据等级、数据口径标准、存储周期等细节。最初版本输出了近20万字的数据治理体系。最后经过多方调研,精简至几万字。
其次,在治用并举阶段,以点破面,从结构化数据入手,首先形成示范效应,再通过治用并举,拓展场景。在华夏银行案例中,擎创科技通过运维数据应用场景调研,最终决定以人行运维数据上报这一紧急应用场景做为抓手,推进落地。在这一场景中,大量运维数据需要在90秒内进行上传。当时银行在此面临两大问题,首先,数据源多、业务逻辑和处理流程复杂,导致海量数据处理过程复杂,处理效率较低。其次,算力不足导致上传无法满足时延要求。在此背景下,为保证项目示范效果,需要先将数据治理一体化平台结构搭建起来,满足人行数据上报时间窗口标准,在组织内部做出效果。随后,进行治用并举,即保证已治理场景稳定应用的同时,从业务数据,性能数据入手,逐渐加入新的数据应用场景,快速提供较为典型的,或者紧急应用的场景,如交易量数据,成功率,响应时间,与银联或支付宝等平台结算等应用场景。
未来,运维数据平台将在丰富场景的同时,引入算法,实现智能运维。通过逐步接入半结构化数据以及非结构化数据,运维数据平台将进一步丰富应用场景。如接入流程管理数据、告警平台数据、自动化执行数据等。同时,进行智能化探索,引入人工智能进行运维数据分析,比如进行数据自动打标,分辨数据表征,如周期性、峰值等。
在疫情期间,该项目用时近一年完成,目前仍在下一阶段建设中。现阶段,数据标准化中心实现了标准元数据、主数据、数据源、指标体系等核心标准化能力。其中指标体系从原来的300个缩减至100个,剔除了大量类似、冗余的指标,数据的标准化大幅提高了数据开发效率。同时,该平台的数据处理中台具备高效编排复杂解析任务的处理能力,将数据服务开发流程从天级缩短至小时级。处理能力特性包括:流批一体、在线任务编排、在线任务调试、可视化管道任务编排等。

在数据应用方面,为方便一线运维人员的数据取用,增加使用效率,数据应用中心提供了大量开箱可用的数据处理算子,实现了数据服务场景的管理,数据服务场景整体上可以归纳为数据治理、运维分析、运维决策三类场景。提供了灵活且自助式的应用场景定制能力。

在落地过程中,擎创科技总结了该运维数据平台的关键成功要素。即从数据治理制度规范入手,以统一数据标准为基石,结合客户需求,以点破面,形成示范效应,最后横向拓展场景,纵向深挖智能运维能力,实现智能运维。

第一,制度先行:运维数据治理成功的前提是要有管理规范,使运维数据在采集,储存,分析,管理,应用过程中有规则可依。将治理的理念贯穿于整个平台和数据的全生命周期中,形成一套完整的管理规范。
第二,标准统一:数据标准统一是治理成功的基础。数据对象和指标的标准化将直接影响最终的数据应用、数据洞察效果。数据标准不统一的运维数据平台,不仅无法达到降本增效的目标,还会影响智能运维平台的最终效果,影响系统平稳运营。
第三,以点破面:实施阶段,需要结合客户需求,以紧急且重要的使用场景为突破点,首先搭建运维数据平台框架,推广使用效果,让相关方了解使用效果,为后续配合工作搭建基础。
第四,治用并举:运维数据平台的落地过程中,需要治用并举。即按照场景优先级加入运维数据平台,新场景开发与已开发场景使用并行。在试点场景落地后,根据数据的重要程度、应用频率及数据价值的高低,对运维数据应用场景的重要性以及紧急性进行排序。按照场景优先等级进行逐个落地推广。

活动推荐

爱分析ifenxi 爱分析是一家中国领先的数字化市场研究与咨询机构。
评论
  • 「他明明跟我同梯进来,为什么就是升得比我快?」许多人都有这样的疑问:明明就战绩也不比隔壁同事差,升迁之路却比别人苦。其实,之间的差异就在于「领导力」。並非必须当管理者才需要「领导力」,而是散发领导力特质的人,才更容易被晓明。许多领导力和特质,都可以通过努力和学习获得,因此就算不是天生的领导者,也能成为一个具备领导魅力的人,进而被老板看见,向你伸出升迁的橘子枝。领导力是什么?领导力是一种能力或特质,甚至可以说是一种「影响力」。好的领导者通常具备影响和鼓励他人的能力,并导引他们朝着共同的目标和愿景前
    优思学院 2025-01-08 14:54 93浏览
  • HDMI 2.2 规格将至,开启视听新境界2025年1月6日,HDMI Forum, Inc. 宣布即将发布HDMI规范2.2版本。新HDMI规范为规模庞大的 HDMI 生态系统带来更多选择,为创建、分发和体验理想的终端用户效果提供更先进的解决方案。新技术为电视、电影和游戏工作室等内容制作商在当前和未来提供更高质量的选择,同时实现多种分发平台。96Gbps的更高带宽和新一代 HDMI 固定比率速率传输(Fixed Rate Link)技术为各种设备应用提供更优质的音频和视频。终端用户显示器能以最
    百佳泰测试实验室 2025-01-09 17:33 81浏览
  • 在当前人工智能(AI)与物联网(IoT)的快速发展趋势下,各行各业的数字转型与自动化进程正以惊人的速度持续进行。如今企业在设计与营运技术系统时所面临的挑战不仅是技术本身,更包含硬件设施、第三方软件及配件等复杂的外部因素。然而这些系统往往讲究更精密的设计与高稳定性,哪怕是任何一个小小的问题,都可能对整体业务运作造成严重影响。 POS应用环境与客户需求以本次分享的客户个案为例,该客户是一家全球领先的信息技术服务与数字解决方案提供商,遭遇到一个由他们所开发的POS机(Point of Sal
    百佳泰测试实验室 2025-01-09 17:35 75浏览
  • 1月7日-10日,2025年国际消费电子产品展览会(CES 2025)盛大举行,广和通发布Fibocom AI Stack,赋智千行百业端侧应用。Fibocom AI Stack提供集高性能模组、AI工具链、高性能推理引擎、海量模型、支持与服务一体化的端侧AI解决方案,帮助智能设备快速实现AI能力商用。为适应不同端侧场景的应用,AI Stack具备海量端侧AI模型及行业端侧模型,基于不同等级算力的芯片平台或模组,Fibocom AI Stack可将TensorFlow、PyTorch、ONNX、
    物吾悟小通 2025-01-08 18:17 66浏览
  • 在智能网联汽车中,各种通信技术如2G/3G/4G/5G、GNSS(全球导航卫星系统)、V2X(车联网通信)等在行业内被广泛使用。这些技术让汽车能够实现紧急呼叫、在线娱乐、导航等多种功能。EMC测试就是为了确保在复杂电磁环境下,汽车的通信系统仍然可以正常工作,保护驾乘者的安全。参考《QCT-基于LTE-V2X直连通信的车载信息交互系统技术要求及试验方法-1》标准10.5电磁兼容试验方法,下面将会从整车功能层面为大家解读V2X整车电磁兼容试验的过程。测试过程揭秘1. 设备准备为了进行电磁兼容试验,技
    北汇信息 2025-01-09 11:24 79浏览
  • 光伏逆变器是一种高效的能量转换设备,它能够将光伏太阳能板(PV)产生的不稳定的直流电压转换成与市电频率同步的交流电。这种转换后的电能不仅可以回馈至商用输电网络,还能供独立电网系统使用。光伏逆变器在商业光伏储能电站和家庭独立储能系统等应用领域中得到了广泛的应用。光耦合器,以其高速信号传输、出色的共模抑制比以及单向信号传输和光电隔离的特性,在光伏逆变器中扮演着至关重要的角色。它确保了系统的安全隔离、干扰的有效隔离以及通信信号的精准传输。光耦合器的使用不仅提高了系统的稳定性和安全性,而且由于其低功耗的
    晶台光耦 2025-01-09 09:58 51浏览
  • 一个真正的质量工程师(QE)必须将一件产品设计的“意图”与系统的可制造性、可服务性以及资源在现实中实现设计和产品的能力结合起来。所以,可以说,这确实是一种工程学科。我们常开玩笑说,质量工程师是工程领域里的「侦探」、「警察」或「律师」,守护神是"墨菲”,信奉的哲学就是「墨菲定律」。(注:墨菲定律是一种启发性原则,常被表述为:任何可能出错的事情最终都会出错。)做质量工程师的,有时会不受欢迎,也会被忽视,甚至可能遭遇主动或被动的阻碍,而一旦出了问题,责任往往就落在质量工程师的头上。虽然质量工程师并不负
    优思学院 2025-01-09 11:48 92浏览
  • 故障现象一辆2017款东风风神AX7车,搭载DFMA14T发动机,累计行驶里程约为13.7万km。该车冷起动后怠速运转正常,热机后怠速运转不稳,组合仪表上的发动机转速表指针上下轻微抖动。 故障诊断 用故障检测仪检测,发动机控制单元中无故障代码存储;读取发动机数据流,发现进气歧管绝对压力波动明显,有时能达到69 kPa,明显偏高,推断可能的原因有:进气系统漏气;进气歧管绝对压力传感器信号失真;发动机机械故障。首先从节气门处打烟雾,没有发现进气管周围有漏气的地方;接着拔下进气管上的两个真空
    虹科Pico汽车示波器 2025-01-08 16:51 108浏览
  • 在过去十年中,自动驾驶和高级驾驶辅助系统(AD/ADAS)软件与硬件的快速发展对多传感器数据采集的设计需求提出了更高的要求。然而,目前仍缺乏能够高质量集成多传感器数据采集的解决方案。康谋ADTF正是应运而生,它提供了一个广受认可和广泛引用的软件框架,包含模块化的标准化应用程序和工具,旨在为ADAS功能的开发提供一站式体验。一、ADTF的关键之处!无论是奥迪、大众、宝马还是梅赛德斯-奔驰:他们都依赖我们不断发展的ADTF来开发智能驾驶辅助解决方案,直至实现自动驾驶的目标。从新功能的最初构思到批量生
    康谋 2025-01-09 10:04 69浏览
  • 职场是人生的重要战场,既是谋生之地,也是实现个人价值的平台。然而,有些思维方式却会悄无声息地拖住你的后腿,让你原地踏步甚至退步。今天,我们就来聊聊职场中最忌讳的五种思维方式,看看自己有没有中招。1. 固步自封的思维在职场中,最可怕的事情莫过于自满于现状,拒绝学习和改变。世界在不断变化,行业的趋势、技术的革新都在要求我们与时俱进。如果你总觉得自己的方法最优,或者害怕尝试新事物,那就很容易被淘汰。与其等待机会找上门,不如主动出击,保持学习和探索的心态。加入优思学院,可以帮助你快速提升自己,与行业前沿
    优思学院 2025-01-09 15:48 65浏览
  • 根据环洋市场咨询(Global Info Research)项目团队最新调研,预计2030年全球中空长航时无人机产值达到9009百万美元,2024-2030年期间年复合增长率CAGR为8.0%。 环洋市场咨询机构出版了的【全球中空长航时无人机行业总体规模、主要厂商及IPO上市调研报告,2025-2031】研究全球中空长航时无人机总体规模,包括产量、产值、消费量、主要生产地区、主要生产商及市场份额,同时分析中空长航时无人机市场主要驱动因素、阻碍因素、市场机遇、挑战、新产品发布等。报告从中空长航时
    GIRtina 2025-01-09 10:35 71浏览
  •  在全球能源结构加速向清洁、可再生方向转型的今天,风力发电作为一种绿色能源,已成为各国新能源发展的重要组成部分。然而,风力发电系统在复杂的环境中长时间运行,对系统的安全性、稳定性和抗干扰能力提出了极高要求。光耦(光电耦合器)作为一种电气隔离与信号传输器件,凭借其优秀的隔离保护性能和信号传输能力,已成为风力发电系统中不可或缺的关键组件。 风力发电系统对隔离与控制的需求风力发电系统中,包括发电机、变流器、变压器和控制系统等多个部分,通常工作在高压、大功率的环境中。光耦在这里扮演了
    晶台光耦 2025-01-08 16:03 86浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦