实现成本最优的一体化管理,新一代数据平台的建设方式丨爱分析调研

原创 爱分析ifenxi 2023-12-27 20:30




1.当前,企业在大数据和数据中台建设上取得成果,但数据开发管理仍具挑战性(成本、效率、复杂度)。

2.随数据平台领域成熟,厂商应结合自身需求,重新思考基于开源自建数据平的重资产模式与购买云上成熟数据产品”的轻资产模式。

3.组装式数据架构逐渐老旧。建议企业采用一体化为特点的新一代数据平台,能更好地解决成本优化、平台扩展性等问题,并可将更多资源投入到业务创新中。

十年数据平台建设,企业用户依然面临重重挑战。2013-2017年大数据平台建设,2018-2022年数据中台建设,两轮大规模数据平台建设后,企业用户取得一定成果,“数据驱动业务”理念深入人心,但在实际落地时,数据开发管理难度依然很大,数据需求响应速度依然不足。
DataFabric、DataOps、数据资产入表等多种解决方案兴起,从工具、流程、制度等维度去解决上述问题。这些方案都聚焦于数据开发管理这一层,更加贴近数据团队的日常工作,底层平台架构问题被掩盖,但同样需要关注
01 企业的业务发展和精益管理对数据平台架构提出更高要求
宏观经济下行,“精益发展“成为多数企业经营策略后,企业用户数据平台建设现状已经暴露出诸多问题,需要新一代数据平台架构解决。
第一, 数据平台日益复杂多样,数据开发运维难度日益增长。
数据应用场景愈发复杂,针对单一应用构建数据平台模式不可持续。
从早期的数据报表,到敏捷BI自助分析、再到以机器学习和LLM为代表的AI应用,数据应用场景越来越复杂。
过往企业用户习惯于面向单个数据应用构建一套数据平台,无形之中形成了新的“数据烟囱”现象。同时,业务与技术的深度融合,单个业务问题往往需要多个数据应用方式组合解决,使得数据运维管理成本呈现指数级增长。
离线实时并存,多种数据处理方式促使平台运维管理难度大幅增加。
“数据驱动业务增长“理念在越来越多企业真正落地,管理层和业务部门对数据应用的实时性提出更高要求。新数据应用的响应速度要求从天级、小时级逐步提升至分钟级、秒级,而原有T+1跑批任务依然需要支持,这让数据平台运维管理难度越来越大。
第二,更多IT预算投入到直接产生业务收益的场景,数据基础设施需要更具”性价比“。
2023年,“降本增效“成为主流,企业IT投资分布出现非常大的调整,更多预算投入到业务场景,投入到能够直接看到业务收益的场景,2024年将延续这一趋势,这意味着数据基础设施建设需要更具”性价比“。
减少数据平台重复建设,提升数据基础设施ROI。
数据平台重复建设一方面是增加平台本身运维管理成本,另一方面会造成存储/计算资源的浪费。如果采取统一数据平台,可以大大提升底层计算/存储资源的利用率,从整体提高数据基础设施的投资回报率。
更多人力资源投入到业务场景,建设统一数据平台架构,提升数据开发运维管理效率。
不论是企业用户自身IT人员还是外部供应商的服务人员,都被企业用户更多投入到业务项目中,很多大企业甚至在2023年出现裁撤纯运维人员,补充IT业务人员的态势。
这意味着企业用户的IT部门/数据部门需要用更少的团队来维持同等规模甚至不断扩大规模的数据平台,必须要从架构层面进行优化和迭代,提升运维管理人效,才能支撑越来越复杂、越来越重要的数据平台。
第三,以大模型为代表的AI应用爆发式发展,对数据平台提出更高要求。
非结构化数据价值提升,数据平台需要同时满足多数据类型运维管理需求。
大量AI应用需要基于企业内部非结构化数据进行训练,这类数据呈现出海量、低价值密度等特点。采取结构化数据的存储计算处理方式非常不经济,但又需要跟结构化数据进行统一管理,因为很多应用是“规则引擎+机器学习+LLM“多技术融合实现。
AI应用落地对企业数据基础设施提出更高要求。
AI技术一般是上接业务系统,下接数据平台,只有业务系统和数据平台都相对成熟,才能真正发挥AI价值,这意味着,全公司级统一的知识库、数据资产目录、数据模型、数据字典成为必备条件,这些对数据架构提出更高要求。
02 成本优化难、平台扩展性差是当前中大型企业数据平台主要问题

针对数据平台建设,爱分析调研了快消、消费电子、制造、地产、物流等领域头部企业,现将部分问题呈现如下:

基于调研成果,爱分析总结出当前中大型企业在数据平台架构的普遍性问题有以下两点

第一,数据计算存储成本高,现有技术架构无法实现成本优化。

企业用户希望数据平台成本可控的前提下,实现数据处理能力和业务支撑能力的增长,但实际情况不尽如人意。中大型企业多数选择自建数据平台,由于自建需要锁定资源,因此不得不预留一部分能够满足业务高峰期的资源池,这就推高了日常资源成本。
同时,这是一个业务流程发展迭代越来越快的时代,需要的业务实时性越来越高,固定资源模式就会面临扩容或缩容便利性的问题。便利性不仅仅是购买机器加入集群,还涉及到数据的重新排布、数据业务的改造等。
第二,数据量日益增长,现有数据平台架构的横向和纵向拓展升级能力不足。
由于数据技术创新加快,现有数据平台建设和运维团队受限于投入不能跟进每一个技术热点,从维护HDFS、Hive,到Atlas、Hudi、Presto等链路,需要熟悉运维管理十几个数据组件,又面临新技术比如联邦计算、数据湖、实时数仓,AI整合、DataFabric等冲击。
很多企业用户为了避免“技术绑架”,选择在当前开源体系上进行改造或者直接使用开源商业化产品,技术红利逐渐已经被挖掘完毕,存在较低的“效果上限”,遇到天花板。比如hadoop开源体系组件化发展的特征缺乏统一架构的整合,这样整体优化方向比较困难,局部的优化又难以解决整体问题。
03 一体化、开放、弹性是新一代数据平台架构的主要特点
不论是从企业业务管理视角出发,还是从解决当前数据平台的普遍性问题,企业用户需要采用一体化、开放、弹性的新一代数据平台架构,局部“修修补补“只能缓解问题,并不能从根本上来解决。
基于调研,爱分析发现数据平台厂商在这个领域价值凸显。
海外在一体化数据平台领域,如Snowflake,专注于提供多云之上的数据仓库服务。该公司成立于2012年,以其数据云平台帮助企业整合数据、构建数据分析闻名。此外海外还有如Databricks,提供开放且一体的数据平台,近年和AI服务进一步整合。

国内以云器为代表的数据平台厂商,提供一体化代数据平台,并已经在不少互联网和传统企业落地。

一体化数据架构的特点包括:
  • 数据存储层面,由湖仓一体架构承接Data+AI的统一数据底盘,同时满足结构化数据和非结构化数据的高性价比存储需求。

  • 数据分析层面,以“增量计算模式”统一批、流、交互三种计算模式,解决组装式Lambda架构存在的问题。

  • 应用支撑层面,基于湖仓一体底盘向上迭代,与下层存储及数据分析引擎实现融合计算,服务于机器学习模型的训练和推理环节。

湖仓一体和增量计算是新一代数据平台架构的核心技术能力,增量计算在解决实时离线一体化、计算成本高、低成本下提升更多数据新鲜度等问题比传统计算模式有着显著增强。
04 新一代数据平台建设路径、难点及业务收益

新一代数据平台建设一般分成三个阶段,关键问题确认及解决方案设计、场景确认及POC验证、生产交付实施。其中,第一阶段和第三阶段存在不少难点。
第一阶段最大难点是如何收敛问题,实现对关键问题的重点突破。
当前市场环境,数据平台建设需要兼顾长期建设目标和短期业务收益,需要企业用户和数据平台顾问仔细分析拆解数据业务场景中所遇到的数据问题和数据平台问题,先圈定一两个场景,从关键问题切入,再逐渐替换其它场景。
同时,重点考量成本及风险。除了平台核心计算能力成本,还要考虑迁移的成本,包含时间、人力成本以及迁移风险。
第三阶段最大难点是从现有平台如何平稳迁移到新的数据平台,需要企业用户的IT部门、数据部门、业务部门和数据平台厂商深度配合,主要是以下问题:
1)存量任务迁移:数据迁移往往比较简单,有很多自研工具或者生态工具可以使用,任务迁移往往挑战比较多,以云器的产品为例,云器LH语法层面兼容Spark3 SQL语法标准并在其上做了很多扩展,如果是RDD开发/Java开发/其他方言SQL,会涉及到语法转换问题,存在一定工作量。
2)企业用户资源投入:迁移实施过程中企业用户需要投入足够资源支撑,特别是在正确性/性能等指标等验收确认工作,资源不足会导致项目进度延期。
3)生产业务切换:涉及到企业用户的业务部门配合,存在大量沟通协调工作,在传统企业会存在“部门墙”等阻力。
基于实现路径和难点的分析,不难看出如何明确业务收益是影响新一代数据平台建设的关键因素。一方面明确业务收益能够有效评估成本高低,进而衡量数据平台建设的ROI;另一方面,明确业务收益能够帮助IT部门/数据部门更加容易获取管理层和业务部门的认可和资源支持,有助于部门之间深度配合,保证平台建设如期完成和上线。

基于实际企业用户落地案例,爱分析总结出以下几点业务收益。

注:点击左下角“阅读原文”前往爱分析官网了解更多内容。



爱分析ifenxi 爱分析是一家中国领先的数字化市场研究与咨询机构。
评论
  • 80,000人到访的国际大展上,艾迈斯欧司朗有哪些亮点?感未来,光无限。近日,在慕尼黑electronica 2024现场,ams OSRAM通过多款创新DEMO展示,以及数场前瞻洞察分享,全面展示自身融合传感器、发射器及集成电路技术,精准捕捉并呈现环境信息的卓越能力。同时,ams OSRAM通过展会期间与客户、用户等行业人士,以及媒体朋友的深度交流,向业界传达其以光电技术为笔、以创新为墨,书写智能未来的深度思考。electronica 2024electronica 2024构建了一个高度国际
    艾迈斯欧司朗 2025-01-16 20:45 388浏览
  • 嘿,咱来聊聊RISC-V MCU技术哈。 这RISC-V MCU技术呢,简单来说就是基于一个叫RISC-V的指令集架构做出的微控制器技术。RISC-V这个啊,2010年的时候,是加州大学伯克利分校的研究团队弄出来的,目的就是想搞个新的、开放的指令集架构,能跟上现代计算的需要。到了2015年,专门成立了个RISC-V基金会,让这个架构更标准,也更好地推广开了。这几年啊,这个RISC-V的生态系统发展得可快了,好多公司和机构都加入了RISC-V International,还推出了不少RISC-V
    丙丁先生 2025-01-21 12:10 105浏览
  • 本文介绍瑞芯微开发板/主板Android配置APK默认开启性能模式方法,开启性能模式后,APK的CPU使用优先级会有所提高。触觉智能RK3562开发板演示,搭载4核A53处理器,主频高达2.0GHz;内置独立1Tops算力NPU,可应用于物联网网关、平板电脑、智能家居、教育电子、工业显示与控制等行业。源码修改修改源码根目录下文件device/rockchip/rk3562/package_performance.xml并添加以下内容,注意"+"号为添加内容,"com.tencent.mm"为AP
    Industio_触觉智能 2025-01-17 14:09 161浏览
  •  光伏及击穿,都可视之为 复合的逆过程,但是,复合、光伏与击穿,不单是进程的方向相反,偏置状态也不一样,复合的工况,是正偏,光伏是零偏,击穿与漂移则是反偏,光伏的能源是外来的,而击穿消耗的是结区自身和电源的能量,漂移的载流子是 客席载流子,须借外延层才能引入,客席载流子 不受反偏PN结的空乏区阻碍,能漂不能漂,只取决于反偏PN结是否处于外延层的「射程」范围,而穿通的成因,则是因耗尽层的过度扩张,致使跟 端子、外延层或其他空乏区 碰触,当耗尽层融通,耐压 (反向阻断能力) 即告彻底丧失,
    MrCU204 2025-01-17 11:30 179浏览
  • 现在为止,我们已经完成了Purple Pi OH主板的串口调试和部分配件的连接,接下来,让我们趁热打铁,完成剩余配件的连接!注:配件连接前请断开主板所有供电,避免敏感电路损坏!1.1 耳机接口主板有一路OTMP 标准四节耳机座J6,具备进行音频输出及录音功能,接入耳机后声音将优先从耳机输出,如下图所示:1.21.2 相机接口MIPI CSI 接口如上图所示,支持OV5648 和OV8858 摄像头模组。接入摄像头模组后,使用系统相机软件打开相机拍照和录像,如下图所示:1.3 以太网接口主板有一路
    Industio_触觉智能 2025-01-20 11:04 147浏览
  • 高速先生成员--黄刚这不马上就要过年了嘛,高速先生就不打算给大家上难度了,整一篇简单但很实用的文章给大伙瞧瞧好了。相信这个标题一出来,尤其对于PCB设计工程师来说,心就立马凉了半截。他们辛辛苦苦进行PCB的过孔设计,高速先生居然说设计多大的过孔他们不关心!另外估计这时候就跳出很多“挑刺”的粉丝了哈,因为翻看很多以往的文章,高速先生都表达了过孔孔径对高速性能的影响是很大的哦!咋滴,今天居然说孔径不关心了?别,别急哈,听高速先生在这篇文章中娓娓道来。首先还是要对各位设计工程师的设计表示肯定,毕竟像我
    一博科技 2025-01-21 16:17 95浏览
  • Ubuntu20.04默认情况下为root账号自动登录,本文介绍如何取消root账号自动登录,改为通过输入账号密码登录,使用触觉智能EVB3568鸿蒙开发板演示,搭载瑞芯微RK3568,四核A55处理器,主频2.0Ghz,1T算力NPU;支持OpenHarmony5.0及Linux、Android等操作系统,接口丰富,开发评估快人一步!添加新账号1、使用adduser命令来添加新用户,用户名以industio为例,系统会提示设置密码以及其他信息,您可以根据需要填写或跳过,命令如下:root@id
    Industio_触觉智能 2025-01-17 14:14 121浏览
  • 数字隔离芯片是一种实现电气隔离功能的集成电路,在工业自动化、汽车电子、光伏储能与电力通信等领域的电气系统中发挥着至关重要的作用。其不仅可令高、低压系统之间相互独立,提高低压系统的抗干扰能力,同时还可确保高、低压系统之间的安全交互,使系统稳定工作,并避免操作者遭受来自高压系统的电击伤害。典型数字隔离芯片的简化原理图值得一提的是,数字隔离芯片历经多年发展,其应用范围已十分广泛,凡涉及到在高、低压系统之间进行信号传输的场景中基本都需要应用到此种芯片。那么,电气工程师在进行电路设计时到底该如何评估选择一
    华普微HOPERF 2025-01-20 16:50 73浏览
  • 日前,商务部等部门办公厅印发《手机、平板、智能手表(手环)购新补贴实施方案》明确,个人消费者购买手机、平板、智能手表(手环)3类数码产品(单件销售价格不超过6000元),可享受购新补贴。每人每类可补贴1件,每件补贴比例为减去生产、流通环节及移动运营商所有优惠后最终销售价格的15%,每件最高不超过500元。目前,京东已经做好了承接手机、平板等数码产品国补优惠的落地准备工作,未来随着各省市关于手机、平板等品类的国补开启,京东将第一时间率先上线,满足消费者的换新升级需求。为保障国补的真实有效发放,基于
    华尔街科技眼 2025-01-17 10:44 221浏览
  • 百佳泰特为您整理2025年1月各大Logo的最新规格信息,本月有更新信息的logo有HDMI、Wi-Fi、Bluetooth、DisplayHDR、ClearMR、Intel EVO。HDMI®▶ 2025年1月6日,HDMI Forum, Inc. 宣布即将发布HDMI规范2.2版本。新规范将支持更高的分辨率和刷新率,并提供更多高质量选项。更快的96Gbps 带宽可满足数据密集型沉浸式和虚拟应用对传输的要求,如 AR/VR/MR、空间现实和光场显示,以及各种商业应用,如大型数字标牌、医疗成像和
    百佳泰测试实验室 2025-01-16 15:41 194浏览
  • 电竞鼠标应用环境与客户需求电竞行业近年来发展迅速,「鼠标延迟」已成为决定游戏体验与比赛结果的关键因素。从技术角度来看,传统鼠标的延迟大约为20毫秒,入门级电竞鼠标通常为5毫秒,而高阶电竞鼠标的延迟可降低至仅2毫秒。这些差异看似微小,但在竞技激烈的游戏中,尤其在对反应和速度要求极高的场景中,每一毫秒的优化都可能带来致胜的优势。电竞比赛的普及促使玩家更加渴望降低鼠标延迟以提升竞技表现。他们希望通过精确的测试,了解不同操作系统与设定对延迟的具体影响,并寻求最佳配置方案来获得竞技优势。这样的需求推动市场
    百佳泰测试实验室 2025-01-16 15:45 338浏览
  •     IPC-2581是基于ODB++标准、结合PCB行业特点而指定的PCB加工文件规范。    IPC-2581旨在替代CAM350格式,成为PCB加工行业的新的工业规范。    有一些免费软件,可以查看(不可修改)IPC-2581数据文件。这些软件典型用途是工艺校核。    1. Vu2581        出品:Downstream     
    电子知识打边炉 2025-01-22 11:12 46浏览
  •  万万没想到!科幻电影中的人形机器人,正在一步步走进我们人类的日常生活中来了。1月17日,乐聚将第100台全尺寸人形机器人交付北汽越野车,再次吹响了人形机器人疯狂进厂打工的号角。无独有尔,银河通用机器人作为一家成立不到两年时间的创业公司,在短短一年多时间内推出革命性的第一代产品Galbot G1,这是一款轮式、双臂、身体可折叠的人形机器人,得到了美团战投、经纬创投、IDG资本等众多投资方的认可。作为一家成立仅仅只有两年多时间的企业,智元机器人也把机器人从梦想带进了现实。2024年8月1
    刘旷 2025-01-21 11:15 318浏览
  • 随着消费者对汽车驾乘体验的要求不断攀升,汽车照明系统作为确保道路安全、提升驾驶体验以及实现车辆与环境交互的重要组成,日益受到业界的高度重视。近日,2024 DVN(上海)国际汽车照明研讨会圆满落幕。作为照明与传感创新的全球领导者,艾迈斯欧司朗受邀参与主题演讲,并现场展示了其多项前沿技术。本届研讨会汇聚来自全球各地400余名汽车、照明、光源及Tier 2供应商的专业人士及专家共聚一堂。在研讨会第一环节中,艾迈斯欧司朗系统解决方案工程副总裁 Joachim Reill以深厚的专业素养,主持该环节多位
    艾迈斯欧司朗 2025-01-16 20:51 193浏览
  • 2024年是很平淡的一年,能保住饭碗就是万幸了,公司业绩不好,跳槽又不敢跳,还有一个原因就是老板对我们这些员工还是很好的,碍于人情也不能在公司困难时去雪上加霜。在工作其间遇到的大问题没有,小问题还是有不少,这里就举一两个来说一下。第一个就是,先看下下面的这个封装,你能猜出它的引脚间距是多少吗?这种排线座比较常规的是0.6mm间距(即排线是0.3mm间距)的,而这个规格也是我们用得最多的,所以我们按惯性思维来看的话,就会认为这个座子就是0.6mm间距的,这样往往就不会去细看规格书了,所以这次的运气
    wuliangu 2025-01-21 00:15 157浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦