分享嘉宾|余俊 Aloudata合伙人兼技术副总监
内容已做精简,如需获取专家完整版视频实录和课件,请扫码领取。
01
企业数据开发面临的问题和挑战
近10-20年,大量企业都在做自己的大数据平台,随着历史发展和技术的不断创新,企业内部可能同时存在不止一套大数据平台,数据孤岛化趋势明显,导致用户取数、用数成本激增,传统数据解决方案存在的数据时效问题、数据权责问题均难以解决。
但数据虚拟化之后如何解决性能问题,是企业面临落地中一个非常大的挑战。
02
企业级逻辑数据平台构建与优势
面对企业数据孤岛,基于数据虚拟化引擎之上一整个逻辑数据研发平台。其中包含了数据逻辑集成、逻辑数据整合等多个维度。
逻辑数据平台的优势在于以销定产,业务按需进行逻辑集成和逻辑整合数据,业务使用数据按需做数据加速,同时也能轻松集成全域数据资产。
此外,逻辑数据平台也可以创建逻辑视图,分层加工数据,自动生成ETL任务和回收物理表,借由逻辑数据内置/外接数据构建+OLAP查询双引擎,BI工具直连逻辑数仓进行消费,数据处理和消费统一一套SQL语法,管理企业所有数据资产;逻辑数仓架构和底层大数据引擎解耦,底层技术组件升级不影响业务。
案例一
某国有能源企业建有多套数仓,数据规模较大,数据分散,难以统一分析和使用。采用数据虚拟化构建逻辑层可以实现统一的数据查询和访问入口,统一集团所有数据权限管控和审计;同时也能统一数据服务,实现集团所有业务访问数据的集中管理;此外,在统一资产管理方面也有成效。
该国企最早使用的是基于Hana至少搭建BW数仓,之后又购买了国内大厂的一些数仓,因为其业务特性,各个分公司里面存在海量数据,这些数据有存在于另一个数据湖里面。整个数据中台,有BW仓的数据,也有新建数仓的数据,还有数据湖的数据。
像Mongo这种数据面临很多痛点,BW数据如果全部迁到新的数仓里面,无论重构还是新建,对于业务影响巨大,组织协同等各种原因导致无法做到统一,无法都搭到一个新的数仓里面去,但是从业务视角,有需要使用这些数据。同时集团子分公司非常多,每个子分公司又都有自己的数据,这些数据如何整合?最终采用的方案,在所有数据源之上构建一个虚拟化逻辑层,通过提供一个统一的数据访问服务,包括资产管理、安全管控。
实施过程中,按业务场景或是按业务线逐步去做,实现所有用数用户在逻辑数据平台这层可以看到企业所有有效数据,实现了整个数据查询访问的统一入口。
案例二
某传统券商公司要新建一个数仓以解决取数难的问题,如果采用传统数仓体系搭建,公司内部原因IT人员无法完全支持且项目投入成本巨大。逻辑数仓搭建,采用RP(Relational Projection)策略,数据交付时长可以从两周缩短到几小时,数据开发管理工作量减少30%,数据存储计算成本节约70%。
⩓
注:点击左下角“阅读原文”,领取专家完整版实录和分享课件。