酷渲科技100%数据全链路实时的实践分享,基于云器Lakehouse替换组装式数据平台

爱分析ifenxi 2023-10-24 18:30



酷渲科技成立于2017年,是一家致力于用科技推动组织能力提升的互联网企业服务公司,旗下有多款产品应用,如门店智能运营平台,目前已在零售、餐饮、鞋服、药店连锁、母婴快消、超市便利店、汽车养护、美妆护肤等10+行业领域积累4000+客户。此外,酷渲科技旗下还有多款科技创新应用。
酷渲科技基于云器Lakehouse升级了数据基础设施为Single-Engine的一体化湖仓平台,已在多产品板块规模投产。新平台性能大幅提升,实现千万级数据表全域实时,并基于一体化引擎消除冗余数据,减轻数据治理负担,进一步结合按量计费模式大幅降低计算资源成本。

本文作者:杨杰 酷渲科技研发总监


我们原有的数据平台,基于云服务组合构建,采用的是常见的lambda架构承载业务数据。但随着服务的企业客户规模增长,发现原有数据平台逐渐不能满足业务发展,主要的挑战是:
1) 客户需要小时或分钟级数据。原有架构使用的是Kettle加MaxCompute,是专为大规模离线任务设计的数据链路,链路的更新周期是“T+1”——即今天的业务报表呈现的是截止到昨天的数据。而客户需要更高新鲜度的数据。
2) 多客户分表造成数据库表膨胀问题。我们为每个客户配置独立的一套数据库,以实现业务侧数据相互隔离。每个数据库有几千到万级别的表。随着客户数量增长和新数据链路的开发,物理表数量很快膨胀到千万级,对数据集成、加工处理和升级改造带来了很大挑战。
3) 架构导致数据冗余和高成本。数据在处理链路中被强制复制了多份,例如数据经由Kettle调度,进入MaxCompute,之后再将数据搬运到Hologres引擎进行一次加速计算。数据每经过一个独立的开源组件,就要存储一份,而一旦有处理逻辑需要调整,就有可能要在两个或者多个数据引擎上修改。数据治理的复杂度高,存储和计算资源消耗大。
4) 任务存在高峰低谷,常驻数据资源浪费问题。我们数据加工的时间段,以及企业报表查询的时间段,都具有明显的高峰期和空闲期的特点,之前采用包年的形式,并按高峰期需求量预先购买一定的资源和服务,导致其在业务空闲期资源上的浪费。
这种计费模式带来的高成本及资源浪费也让我们对成本压缩诉求越来越强烈。

图1:原有数据平台架构

我们盘点了这次数据架构升级的需求要点:
1) 升级数据架构,以提升数据处理时效性;
2) 降低资源消耗,保证数据分析查询同时控制计算资源成本;
3) 降低系统的人员维护成本;
4) 顺便解决数据表膨胀问题。
引入“云器Lakehouse”湖仓平台产品,完成平台升级
经过多方选型验证,我们决定引入云器Lakehouse湖仓平台。
选择的过程并非一蹴而就,我们在选型阶段曾考虑过采用StarRocks、Doris等支持实时性的数据产品,评估过单产品能力项,结论认为可以将一部分数据分析时效性要求高的部分改造为实时链路;但我们同时也意识到,还需要在数据集成、任务调度和数据地图等琐碎的管理功能上增加系统组件,每增加一个组件都是后期的升级、运维成本。本质上我们升级的诉求是简化结构的同时实现全域实时,而我们发现组装式Lambda架构方案有2个矛盾,实时链路的数据新鲜度和成本是矛盾的,功能的复杂度和成本也是矛盾的。
因此我们希望选择架构上更简单的,且能够同时支持实时离线一体化的全托管方案。业界能做到一体化的产品主要是Snowflake、Databricks等,国内能做到多云独立+离线实时一体的产品不多。经过调研,我们也了解到云器科技Lakehouse基于增量计算能力现实的Single-Engine引擎能满足一体化的需求,因此做了接触和尝试。经过技术评估、PoC测试和上线,验证发现能满足我们的需求。

图2:基于云器科技产品升级后的数据平台架构

总结新架构的升级效果:
1) 实现千万级业务表的全量数据实时集成。原本成本是我们实现全量数据实时集成主要的顾虑,而新数据平台通过增量计算的方式实现流批一体,这种实现方式仅使用相对较小的资源就支撑起了千万级业务表规模的、全量的实时数据同步。增量计算实现实时的数据处理方式区别于传统流计算常驻资源,它将所有计算抽象成增量的形态,实现数据的一次计算、累次使用,所以可以节省计算资源;同时,能提供灵活调整的“增量时间间隔”,达成批处理或者流处理效果。

图3:新的数据平台实现了千万级业务表的实时写入

根据云器最近的测试,增量计算在近实时(小时级)的资源节省相对于流计算引擎有10倍的提升(详见下表)

图4:增量计算相对于流计算引擎的资源节省对比图

针对实时链路的压测,直接按生产环境要求,针对业务侧千万张表,单表字段在50~100个的上游业务库进行同步,单表单次写入规格在上百条左右,可以看出source侧和sink侧每秒数据吞吐服务运行平稳,,参考指标如下(7天):

图5:Source端每秒输入记录和Sink端每秒输出记录数

2) AI4D让数据任务执行性能提升2倍以上。我们业务代码中用了大量的virtual view;很多相同的virtual view会在不同的query间被使用到,仅靠数据工程师人工调优,效率很低。AI4D是指通过平台自主学习数据和负载的特性,做基于算法和 AI 的自动化调整,从大量任务中识别、抽取出重复计算的部分加以利用,这样不仅降低了计算消耗,而且提升了数据工程师的工作效率。

图6:某段SQL经过AI4D优化后的执行效率对比

图7:新旧数据平台的任务执行时长对比

3) 消除数据冗余,离线实时一体。前面提到Lambda架构有数据冗余存储的问题,本次升级后,基于Single-Engine理念的一体化平台让数据从加工到调度、运维都简单很多。以下图为例,数据工程师只需一次对任务代码进行修改,数仓中贴源层数据与业务侧数据会始终一致,没有数据冗余和指标冗余的顾虑。此外,Single-Engine的离线和实时融合统一,只需调整调度就可切换,精益平衡数据新鲜度与成本。

图8:一体化架构上数据加工处理链路

4) 按量计费节省,计算成本降低50%。新平台采用按使用量计费的模式,即最终的费用是根据对计算、存储、网络等资源的实际使用量进行计算。其中的计算资源,则是按计算集群的实际运行时间进行计算,当计算集群停止后,即不再计费。并且,很重要的一点是,由于新平台在计算性能上相比以往有了大幅提升,因此同等规模的计算资源下,在新的数据平台执行计算任务会大幅节省时间,从而可以进一步降低使用成本。
平台升级后的业务价值展现
新平台上线生产环境后,我们也总结的效果和价值,因为PoC的过程相对完备,生产上线效果比较一致,在此概略总结:

图9:一体化平台数据平台架构运行示意图

1) 各类指标、报表和大屏提供了高效的数据服务。数据新鲜度从“T+1”到“H+1”的升级,让我们的客户可以及时查看了解业务的进展和效果,提升了产品及服务体验。
2) 全托管的数据服务模式,让我们的数据人员可以更专注于数据价值开发,扩展数据分析和洞察能力。不用自己搭建或购买各种组件来进行开发、维护,同时平台中的弹性扩展和AI优化能力对性能也提供很好的SLA保障。
3) 达到降本增效的升级目标。一方面,新的数据平台采用按量计费的模式,从根本上解决了以往空闲期资源浪费的问题。另一方面,新的平台在大部分任务上,可以在同等规模的计算资源下节省50%以上的时间。
对SaaS型的数字原生企业在数据平台选型和升级上的再思考
通过采用云器科技的产品升级原有数据平台的实践,可为同类企业在数据平台选型时提供以下参考经验:
第一, 数字原生企业往往在一定阶段会出现终端用户快速增长的情况,这就要求数据平台具备海量数据表的处理能力、资源弹性伸缩能力、特别是要具备可调成本的实时能力。因此在前期进行数据平台选型时,要充分考虑这些因素,并尽量选择精简的一体化/Single-Engine平台架构,一方面降低开发和运维复杂度,另一方面也便于在后续业务需求发生变化时,可以对平台功能进行灵活扩展。
第二, SaaS企业对于成本较敏感,因此在数据平台的计费模式上,需要优先考虑按量计费的模式,避免空闲期的资源浪费。而这种计费模式的成本优势会随着用户规模的增长变得更加显著。
第三, 数字原生企业的数据运维管理复杂,考虑具备AI4D功能的工具平台,用AI做任务的自动优化调整,可以降低数据平台的使用门槛。
注:点击左下角“阅读原文”前往爱分析官网了解更多内容。

爱分析ifenxi 爱分析是一家中国领先的数字化市场研究与咨询机构。
评论
  • Ubuntu20.04默认情况下为root账号自动登录,本文介绍如何取消root账号自动登录,改为通过输入账号密码登录,使用触觉智能EVB3568鸿蒙开发板演示,搭载瑞芯微RK3568,四核A55处理器,主频2.0Ghz,1T算力NPU;支持OpenHarmony5.0及Linux、Android等操作系统,接口丰富,开发评估快人一步!添加新账号1、使用adduser命令来添加新用户,用户名以industio为例,系统会提示设置密码以及其他信息,您可以根据需要填写或跳过,命令如下:root@id
    Industio_触觉智能 2025-01-17 14:14 121浏览
  • 本文介绍瑞芯微开发板/主板Android配置APK默认开启性能模式方法,开启性能模式后,APK的CPU使用优先级会有所提高。触觉智能RK3562开发板演示,搭载4核A53处理器,主频高达2.0GHz;内置独立1Tops算力NPU,可应用于物联网网关、平板电脑、智能家居、教育电子、工业显示与控制等行业。源码修改修改源码根目录下文件device/rockchip/rk3562/package_performance.xml并添加以下内容,注意"+"号为添加内容,"com.tencent.mm"为AP
    Industio_触觉智能 2025-01-17 14:09 161浏览
  • 电竞鼠标应用环境与客户需求电竞行业近年来发展迅速,「鼠标延迟」已成为决定游戏体验与比赛结果的关键因素。从技术角度来看,传统鼠标的延迟大约为20毫秒,入门级电竞鼠标通常为5毫秒,而高阶电竞鼠标的延迟可降低至仅2毫秒。这些差异看似微小,但在竞技激烈的游戏中,尤其在对反应和速度要求极高的场景中,每一毫秒的优化都可能带来致胜的优势。电竞比赛的普及促使玩家更加渴望降低鼠标延迟以提升竞技表现。他们希望通过精确的测试,了解不同操作系统与设定对延迟的具体影响,并寻求最佳配置方案来获得竞技优势。这样的需求推动市场
    百佳泰测试实验室 2025-01-16 15:45 338浏览
  • 日前,商务部等部门办公厅印发《手机、平板、智能手表(手环)购新补贴实施方案》明确,个人消费者购买手机、平板、智能手表(手环)3类数码产品(单件销售价格不超过6000元),可享受购新补贴。每人每类可补贴1件,每件补贴比例为减去生产、流通环节及移动运营商所有优惠后最终销售价格的15%,每件最高不超过500元。目前,京东已经做好了承接手机、平板等数码产品国补优惠的落地准备工作,未来随着各省市关于手机、平板等品类的国补开启,京东将第一时间率先上线,满足消费者的换新升级需求。为保障国补的真实有效发放,基于
    华尔街科技眼 2025-01-17 10:44 221浏览
  • 嘿,咱来聊聊RISC-V MCU技术哈。 这RISC-V MCU技术呢,简单来说就是基于一个叫RISC-V的指令集架构做出的微控制器技术。RISC-V这个啊,2010年的时候,是加州大学伯克利分校的研究团队弄出来的,目的就是想搞个新的、开放的指令集架构,能跟上现代计算的需要。到了2015年,专门成立了个RISC-V基金会,让这个架构更标准,也更好地推广开了。这几年啊,这个RISC-V的生态系统发展得可快了,好多公司和机构都加入了RISC-V International,还推出了不少RISC-V
    丙丁先生 2025-01-21 12:10 105浏览
  • 2024年是很平淡的一年,能保住饭碗就是万幸了,公司业绩不好,跳槽又不敢跳,还有一个原因就是老板对我们这些员工还是很好的,碍于人情也不能在公司困难时去雪上加霜。在工作其间遇到的大问题没有,小问题还是有不少,这里就举一两个来说一下。第一个就是,先看下下面的这个封装,你能猜出它的引脚间距是多少吗?这种排线座比较常规的是0.6mm间距(即排线是0.3mm间距)的,而这个规格也是我们用得最多的,所以我们按惯性思维来看的话,就会认为这个座子就是0.6mm间距的,这样往往就不会去细看规格书了,所以这次的运气
    wuliangu 2025-01-21 00:15 157浏览
  • 数字隔离芯片是一种实现电气隔离功能的集成电路,在工业自动化、汽车电子、光伏储能与电力通信等领域的电气系统中发挥着至关重要的作用。其不仅可令高、低压系统之间相互独立,提高低压系统的抗干扰能力,同时还可确保高、低压系统之间的安全交互,使系统稳定工作,并避免操作者遭受来自高压系统的电击伤害。典型数字隔离芯片的简化原理图值得一提的是,数字隔离芯片历经多年发展,其应用范围已十分广泛,凡涉及到在高、低压系统之间进行信号传输的场景中基本都需要应用到此种芯片。那么,电气工程师在进行电路设计时到底该如何评估选择一
    华普微HOPERF 2025-01-20 16:50 73浏览
  •  光伏及击穿,都可视之为 复合的逆过程,但是,复合、光伏与击穿,不单是进程的方向相反,偏置状态也不一样,复合的工况,是正偏,光伏是零偏,击穿与漂移则是反偏,光伏的能源是外来的,而击穿消耗的是结区自身和电源的能量,漂移的载流子是 客席载流子,须借外延层才能引入,客席载流子 不受反偏PN结的空乏区阻碍,能漂不能漂,只取决于反偏PN结是否处于外延层的「射程」范围,而穿通的成因,则是因耗尽层的过度扩张,致使跟 端子、外延层或其他空乏区 碰触,当耗尽层融通,耐压 (反向阻断能力) 即告彻底丧失,
    MrCU204 2025-01-17 11:30 179浏览
  • 现在为止,我们已经完成了Purple Pi OH主板的串口调试和部分配件的连接,接下来,让我们趁热打铁,完成剩余配件的连接!注:配件连接前请断开主板所有供电,避免敏感电路损坏!1.1 耳机接口主板有一路OTMP 标准四节耳机座J6,具备进行音频输出及录音功能,接入耳机后声音将优先从耳机输出,如下图所示:1.21.2 相机接口MIPI CSI 接口如上图所示,支持OV5648 和OV8858 摄像头模组。接入摄像头模组后,使用系统相机软件打开相机拍照和录像,如下图所示:1.3 以太网接口主板有一路
    Industio_触觉智能 2025-01-20 11:04 147浏览
  • 随着消费者对汽车驾乘体验的要求不断攀升,汽车照明系统作为确保道路安全、提升驾驶体验以及实现车辆与环境交互的重要组成,日益受到业界的高度重视。近日,2024 DVN(上海)国际汽车照明研讨会圆满落幕。作为照明与传感创新的全球领导者,艾迈斯欧司朗受邀参与主题演讲,并现场展示了其多项前沿技术。本届研讨会汇聚来自全球各地400余名汽车、照明、光源及Tier 2供应商的专业人士及专家共聚一堂。在研讨会第一环节中,艾迈斯欧司朗系统解决方案工程副总裁 Joachim Reill以深厚的专业素养,主持该环节多位
    艾迈斯欧司朗 2025-01-16 20:51 193浏览
  •     IPC-2581是基于ODB++标准、结合PCB行业特点而指定的PCB加工文件规范。    IPC-2581旨在替代CAM350格式,成为PCB加工行业的新的工业规范。    有一些免费软件,可以查看(不可修改)IPC-2581数据文件。这些软件典型用途是工艺校核。    1. Vu2581        出品:Downstream     
    电子知识打边炉 2025-01-22 11:12 46浏览
  • 80,000人到访的国际大展上,艾迈斯欧司朗有哪些亮点?感未来,光无限。近日,在慕尼黑electronica 2024现场,ams OSRAM通过多款创新DEMO展示,以及数场前瞻洞察分享,全面展示自身融合传感器、发射器及集成电路技术,精准捕捉并呈现环境信息的卓越能力。同时,ams OSRAM通过展会期间与客户、用户等行业人士,以及媒体朋友的深度交流,向业界传达其以光电技术为笔、以创新为墨,书写智能未来的深度思考。electronica 2024electronica 2024构建了一个高度国际
    艾迈斯欧司朗 2025-01-16 20:45 388浏览
  •  万万没想到!科幻电影中的人形机器人,正在一步步走进我们人类的日常生活中来了。1月17日,乐聚将第100台全尺寸人形机器人交付北汽越野车,再次吹响了人形机器人疯狂进厂打工的号角。无独有尔,银河通用机器人作为一家成立不到两年时间的创业公司,在短短一年多时间内推出革命性的第一代产品Galbot G1,这是一款轮式、双臂、身体可折叠的人形机器人,得到了美团战投、经纬创投、IDG资本等众多投资方的认可。作为一家成立仅仅只有两年多时间的企业,智元机器人也把机器人从梦想带进了现实。2024年8月1
    刘旷 2025-01-21 11:15 318浏览
  • 高速先生成员--黄刚这不马上就要过年了嘛,高速先生就不打算给大家上难度了,整一篇简单但很实用的文章给大伙瞧瞧好了。相信这个标题一出来,尤其对于PCB设计工程师来说,心就立马凉了半截。他们辛辛苦苦进行PCB的过孔设计,高速先生居然说设计多大的过孔他们不关心!另外估计这时候就跳出很多“挑刺”的粉丝了哈,因为翻看很多以往的文章,高速先生都表达了过孔孔径对高速性能的影响是很大的哦!咋滴,今天居然说孔径不关心了?别,别急哈,听高速先生在这篇文章中娓娓道来。首先还是要对各位设计工程师的设计表示肯定,毕竟像我
    一博科技 2025-01-21 16:17 95浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦