资源耗费减少90%,云器Lakehouse助力这家SaaS公司实现数据平台升级|案例研究

原创 爱分析ifenxi 2025-04-15 12:04
数据业务已经成为头部SaaS厂商新的增长引擎。
Salesforce最新财报显示,Data Cloud业务年度营收达9亿美金,年度同比增长120%,远远高于11%的整体营收增速。Salesforce CEO在电话会议表示,Data Cloud是有史以来增长最快产品,是2025财年焦点产品。国内市场,智能销售SaaS厂商探迹科技已经将数据能力作为核心竞争力,基于1.8亿市场主体的全量数据为企业提供智能销售服务,数据正在释放巨大业务价值,这对数据平台提出了更高要求。
01 
数据服务能力成为SaaS厂商的必备能力
以DeepSeek为代表AI大模型爆火后,越来越多SaaS厂商将AI能力融入到产品服务中,研发以AI大模型为核心能力的智能化产品。以探迹科技为例,探迹科技推出了销售大模型“探迹SalesGPT”、电商全流程AI Agents平台“探域电商智能体”,面向营销、获客、售后客服等场景。
在实际落地中,由于 AI 大模型存在“幻觉”等问题,例如生成与事实不符的内容,导致智能产品在没有高质量知识库和数据支撑下难以精准服务。这使得数据质量、知识库构建、工作流稳定性成为智能化场景成功落地的关键前提。
同时,SaaS产品正深入到企业用户的业务场景中,企业用户越来越多的业务数据运行在SaaS平台。探迹销售云产品覆盖了企业用户从寻找客户、联系客户到管理客户的全销售流程,这使得企业用户对探迹科技的数据服务能力提出更高要求,不仅仅是简单的数据看板,而是希望获取实时、深度加工后的数据,辅助业务决策。
以上两方面因素使得SaaS厂商必须持续增强数据服务能力,满足诸多企业用户不断涌现的数智化新需求。
02
SaaS厂商数据平台面临三大问题和一大隐性需求
数据服务能力的底层需要有一套强大的数据平台支撑,而大部分SaaS厂商早期都是基于开源框架组件自建的数据平台,如 Spark、Flink等。伴随业务增长,自建数据平台能力越来越跟不上业务发展需求。成立于2016年的探迹科技,在服务客户数量从数千跃升至超过3万家后,这些自建平台在资源扩展性、维护复杂度、数据更新频率等方面逐渐无法满足业务快速演进的需求。例如,企业对探迹数据服务产品的要求从之前的天级别更新提升至小时级更新,这对数据实时性提出非常高的要求。
探迹科技最初的数据平台是基于Lambda架构,采用离线实时混合处理的设计思路。这套架构体系,灵活支撑了早期的业务快速发展,但随着业务的快速发展,数据量越来越大,业务加工逻辑越来越复杂,业务对数据时效性要求越来越高,数据质量要求越来越高,这种数据处理架构越来越面临处理瓶颈和挑战。
首先是数据实时性问题。探迹的业务场景是大规模数据量的高频更新,同时业务逻辑计算非常复杂,如果全部数据和业务转化为实时加工,成本无法承受。只有少量数据采取实时处理,大部分数据是离线加工,根据业务逻辑分成天级别、周级别、月级别加工。
其次是数据一致性问题。同一个业务,采取离线处理全量的数据和业务逻辑,实时链路处理部分核心数据和精简后的逻辑,数据和逻辑的差异必然带来数据的不一致问题。为了减少数据不一致问题的影响,只能定期刷新离线全量加工后的结果到线上,刷新周期包括天级别、周级别、月级别,但这只能缓解不一致问题,无法根治。
第三是数据运维管理问题。“离线+实时” 双链路架构都有自己的运维方式,开发方式和使用方式,从而增加了运维成本和学习成本。探迹科技自身业务特点对数据质量要求很高,当前的数据质量管理主要依赖人工干预,人工排查依赖经验管理,定位慢,排查时长久,难以实现数据全生命周期的有效管理。
除了上述三大问题,探迹科技这类SaaS厂商还有一个隐性需求,全托管数据平台替代自建数据平台。数据服务能力是探迹科技的核心能力,但数据平台不一定需要自建,如果数据平台能够实现专业化全托管,SaaS厂商可以将资源更聚焦投入到数据产品开发等业务。
这对于探迹科技这类中型企业而言,数据平台全托管意味着一方面有数据平台厂商不断融入新技术,自身能够以较低成本享受到数据平台新技术红利,另一方面能够以比较可控的数据团队资源支撑不断增长的业务。
然而,实现数据平台全托管不仅仅是技术问题,还涉及到企业与数据平台厂商的合作机制等问题。因此,探迹科技当前重点是解决前面三大问题。
03 
以增量计算为基础的新一代数据平台,实现数据低成本大规模实时处理、降低运维管理难度
最近两年,增量计算引擎兴起,实现了数据计算模式的统一,即批、流、交互为一体。以云器为代表的新一代数据平台厂商,基于增量计算为基础,推出了基于Single-Engine理念的新一代数据平台Lakehouse,既能支持结构化数据处理分析,也能和AI能力结合,支持对非结构化进行管理和分析。
针对数据实时性问题,基于增量计算、资源弹性扩展等技术,新一代数据平台Lakehouse能够实现全域数据低成本加工,数据开发成本由之前的全量加增量成本变成仅全量成本,极大降低计算成本。以探迹为例,引入 Lakehouse 后,在相同业务场景下,资源消耗降低了18倍。原本依赖 Spark 的离线全量任务,每日消耗上千 CRU,迁移至增量引擎后,每日仅需约 50-60 CRU,计算成本实现数量级优化。同时,增量计算任务能够根据探迹业务需求灵活设置数据刷新频率,无需修改代码,实现数据及时性的精准控制,实现数据加工成本可控。
从“离线+实时”两条链路升级成一条实时链路,仅需一份代码即可处理完整数据与全量逻辑,彻底解决数据不一致问题。开发团队无需在两套系统之间切换,减少至少30%-50%的开发和运维负担,使数据团队可以集中资源投入在更具业务价值的产品创新上。同时,每张表的变化都有历史记录,可以查询任何历史时间点的数据,实现了数据问题快速排查和数据便捷恢复。
基于一份代码、一条链路的新一代数据平台Lakehouse能够极大程度降低数据团队的数据开发、运维管理难度,同时能够沉淀数据开发、运维经验,为后续智能化开发运维奠定基础。
04 
叠加大模型能力,新一代数据平台实现数据开发运维智能化
智能化是所有SaaS厂商产品服务发展方向,智能化落地同时需要结构化数据和非结构化数据支撑,“大模型+RAG”应用非常依赖于知识库等非结构化数据,这对于SaaS厂商带来了全新挑战,如何同时纳管结构化数据和非结构化数据。
新一代数据平台Lakehouse是湖仓一体平台,数据湖仓可以把结构化数据(比如数据库里的表格)、半结构化数据(比如 JSON 文件)和非结构化数据(比如文档、图片、视频)统统整合起来,形成一个统一的数据平台。其“湖”的能力实现对非结构化数据的存储与管理,能够充分挖掘非结构化数据价值,实现了“Data Ready for AI“。
大模型已经在代码生成领域取得一定效果,成功经验可以复制到数据开发运维领域。结合大模型能力,基于新一代数据平台能力,SaaS厂商未来可以实现数据开发运维智能化。
数据运维场景,结合AI大模型、Agent等技术能力,通过数据平台上的运维案例积累,未来可以针对不同业务场景实现数据自动化索引、编排、优化。
数据开发场景,平台能够基于历史经验,对数据开发人员的SQL语句编译优化,提升数据开发效率。
数据分析场景,通过 AI 大模型技术,让不懂 SQL 的业务人员也可以直接用自然语言交互,内置的指标体系大模型可以把业务语言转换成 SQL 查询业务结果,并展示为报表或图像。

近期活动推荐:
注:点击左下角“阅读原文”,前往爱分析官网,了解更多内容。


爱分析ifenxi 爱分析是一家中国领先的数字化市场研究与咨询机构。
评论 (0)
  • 一、行业背景与需求智能门锁作为智能家居的核心入口,正从单一安防工具向多场景交互终端演进。随着消费者对便捷性、安全性需求的提升,行业竞争已从基础功能转向成本优化与智能化整合。传统门锁后板方案依赖多颗独立芯片(如MCU、电机驱动、通信模块、语音模块等),导致硬件复杂、功耗高、开发周期长,且成本压力显著。如何通过高集成度方案降低成本、提升功能扩展性,成为厂商破局关键。WTVXXX-32N语音芯片通过“单芯片多任务”设计,将语音播报、电机驱动、通信协议解析、传感器检测等功能整合于一体,为智能门锁后板提供
    广州唯创电子 2025-04-18 09:04 185浏览
  •   无人机电磁兼容模拟训练系统软件:全方位剖析   一、系统概述   北京华盛恒辉无人机电磁兼容模拟训练系统软件,专为满足无人机于复杂电磁环境下的运行需求而打造,是一款专业训练工具。其核心功能是模拟无人机在电磁干扰(EMI)与电磁敏感度(EMS)环境里的运行状况,助力用户评估无人机电磁兼容性能,增强其在复杂电磁场景中的适应水平。   应用案例   目前,已有多个无人机电磁兼容模拟训练系统在实际应用中取得了显著成效。例如,北京华盛恒辉和北京五木恒润无人机电磁兼容模拟训练系统。这些成功案例为
    华盛恒辉l58ll334744 2025-04-17 14:52 65浏览
  •   无人机蜂群电磁作战仿真系统软件,是专门用于模拟、验证无人机蜂群在电磁作战环境中协同、干扰、通信以及对抗等能力的工具。下面从功能需求、技术架构、典型功能模块、发展趋势及应用场景等方面展开介绍:   应用案例   目前,已有多个无人机蜂群电磁作战仿真系统在实际应用中取得了显著成效。例如,北京华盛恒辉和北京五木恒润无人机蜂群电磁作战仿真系统。这些成功案例为无人机蜂群电磁作战仿真系统的推广和应用提供了有力支持。   功能需求   电磁环境建模:模拟构建复杂多样的电磁环境,涵盖各类电磁干扰源与
    华盛恒辉l58ll334744 2025-04-17 16:49 145浏览
  • 【摘要/前言】4月春日花正好,Electronica就在浪漫春日里,盛大启幕。2025年4月15-17日,慕尼黑上海电子展于上海新国际博览中心成功举办。伴随着AI、新能源汽车、半导体的热潮,今年的Electronica盛况空前。请跟随Samtec的视角,感受精彩时刻!【 Samtec展台:老虎的朋友圈技术派对】借天时、占地利、聚人和,Samtec 展台人气爆棚!每年展会与大家相聚,总能收获温暖与动力~Samtec展台位于W3展馆716展位,新老朋友相聚于此,俨然一场线下技术派对!前沿D
    电子资讯报 2025-04-17 11:38 62浏览
  • 1. 在Ubuntu官网下载Ubuntu server  20.04版本https://releases.ubuntu.com/20.04.6/2. 在vmware下安装Ubuntu3. 改Ubuntu静态IP$ sudo vi /etc/netplan/00-installer-config.yaml# This is the network config written by 'subiquity'network:  renderer: networkd&nbs
    二月半 2025-04-17 16:27 156浏览
  • 现阶段,Zigbee、Z-Wave、Thread、Wi-Fi与蓝牙等多种通信协议在智能家居行业中已得到广泛应用,但协议间互不兼容的通信问题仍在凸显。由于各协议自成体系、彼此割据,智能家居市场被迫催生出大量桥接器、集线器及兼容性软件以在不同生态的设备间构建通信桥梁,而这种现象不仅增加了智能家居厂商的研发成本与时间投入,还严重削减了终端用户的使用体验。为应对智能家居的生态割裂现象,家居厂商需为不同通信协议重复开发适配方案,而消费者则需面对设备入网流程繁琐、跨品牌功能阉割及兼容隐患等现实困境。在此背景
    华普微HOPERF 2025-04-17 17:53 121浏览
  •     爬电距离指的是两个带电体之间、带电体和大地之间,沿着绝缘材料表面的最短距离。与爬电距离有关的标准有IEC 61010-1。PCB设计方面,可以参照IPC-2221B。        (图源TI)    任何情况下,爬电距离不允许小于电气间隙。当绝缘材料是空气时,爬电距离可以和电气间隙相等。电气间隙的简介见协议标准第011篇。        一般情况下
    电子知识打边炉 2025-04-19 20:54 45浏览
  •   北京华盛恒辉无人机电磁兼容模拟训练系统软件是专门用于模拟与分析无人机在复杂电磁环境中电磁兼容性(EMC)表现的软件工具。借助仿真技术,它能帮助用户评估无人机在电磁干扰下的性能,优化电磁兼容设计,保障无人机在复杂电磁环境中稳定运行。   应用案例   目前,已有多个无人机电磁兼容模拟训练系统在实际应用中取得了显著成效。例如,北京华盛恒辉和北京五木恒润无人机电磁兼容模拟训练系统。这些成功案例为无人机电磁兼容模拟训练系统的推广和应用提供了有力支持。   系统功能   电磁环境建模:支持三维
    华盛恒辉l58ll334744 2025-04-17 15:10 110浏览
  • 近日,全球6G技术与产业生态大会(简称“全球6G技术大会”)在南京召开。紫光展锐应邀出席“空天地一体化与数字低空”平行论坛,并从6G通信、感知、定位等多方面分享了紫光展锐在6G前沿科技领域的创新理念及在空天地一体化技术方面的研发探索情况。全球6G技术大会是6G领域覆盖广泛、内容全面的国际会议。今年大会以“共筑创新 同享未来”为主题,聚焦6G愿景与关键技术、安全可信、绿色可持续发展等前沿主题,汇聚国内外24家企业、百余名国际知名高校与科研代表共同商讨如何推动全行业6G标准共识形成。6G迈入关键期,
    紫光展锐 2025-04-17 18:55 202浏览
  •   无人机电磁环境效应仿真系统:深度剖析   一、系统概述   无人机电磁环境效应仿真系统,专为无人机在复杂电磁环境下的性能评估及抗干扰能力训练打造。借助高精度仿真技术,它模拟无人机在各类电磁干扰场景中的运行状态,为研发、测试与训练工作提供有力支撑。   应用案例   目前,已有多个无人机电磁环境效应仿真系统在实际应用中取得了显著成效。例如,北京华盛恒辉和北京五木恒润无人机电磁环境效应仿真系统。这些成功案例为无人机电磁环境效应仿真系统的推广和应用提供了有力支持。   二、系统功能  
    华盛恒辉l58ll334744 2025-04-17 15:51 150浏览
  • 一、行业背景与需求随着智能化技术的快速发展和用户对便捷性需求的提升,电动车行业正经历从传统机械控制向智能交互的转型。传统电动车依赖物理钥匙、遥控器和独立防盗装置,存在操作繁琐、功能单一、交互性差等问题。用户期待通过手机等智能终端实现远程控制、实时数据监控及个性化交互体验。为此,将蓝牙语音芯片集成至电动车中控系统,成为推动智能化升级的关键技术路径。二、方案概述本方案通过在电动车中控系统中集成WT2605C蓝牙语音芯片,构建一套低成本、高兼容性的智能交互平台,实现以下核心功能:手机互联控制:支持蓝牙
    广州唯创电子 2025-04-18 08:33 193浏览
  •     CTI是Comparative Tracking Indices的缩写,在GB 4207中被译作“比较追踪指数”,我认为还是“漏电起痕指数”更容易理解。    CTI表述了材料的绝缘特性——阻止不希望出现的电流。CTI的单位是V,在绝缘物表面添加一定量的电解液并施加电场,观察在绝缘物表面既不会持续产生火焰,也不会因为热、介质击穿、湿气或者污染物产生电弧放电留下痕迹(起痕)的最高电压。CTI的测量方法见IEC 60112 (GB 4207)。&nbs
    电子知识打边炉 2025-04-19 21:20 54浏览
  • 置信区间反映的是“样本均值”这个统计量的不确定性,因此使用的是标准误(standard error),而不是直接用样本标准差(standard deviation)。标准误体现的是均值的波动程度,而样本标准差体现的是个体数据的波动程度,两者并非一回事,就如下图所显示的一样。下面优思学院会一步一步解释清楚:一、标准差和标准误,究竟差在哪?很多同学对“标准差”和“标准误”这两个概念傻傻分不清楚,但其实差别明显:标准差(Standard Deviation,σ或s):是衡量单个数据点相对于平均值波动的
    优思学院 2025-04-17 13:59 37浏览
  • 自动驾驶技术的飞速发展,正在重新定义未来出行的边界。从感知到决策,从规划到控制,每一个环节都离不开海量、精准的高质量数据支撑。然而,随着传感器数量的增加和数据规模的指数级增长,行业正面临一系列挑战:多源传感器数据的时间同步难题、复杂数据格式的适配、测量技术的灵活性不足、设备集成周期冗长等,这些问题正成为自动驾驶研发与测试的“隐形瓶颈”。基于技术积累与行业洞察,本文分享一套创新的ADAS时空融合数据采集方案。通过硬件与软件的深度协同优化,能够很好地解决数据采集中的核心痛点,还为自动驾驶研发提供了高
    康谋 2025-04-17 09:54 120浏览
  •   无人机蜂群电磁作战仿真系统全解析   一、系统概述   无人机蜂群电磁作战仿真系统是专业的仿真平台,用于模拟无人机蜂群在复杂电磁环境中的作战行为与性能。它构建虚拟电磁环境,模拟无人机蜂群执行任务时可能遇到的电磁干扰与攻击,评估作战效能和抗干扰能力,为其设计、优化及实战应用提供科学依据。   应用案例   目前,已有多个无人机蜂群电磁作战仿真系统在实际应用中取得了显著成效。例如,北京华盛恒辉和北京五木恒润无人机蜂群电磁作战仿真系统。这些成功案例为无人机蜂群电磁作战仿真系统的推广和应用提
    华盛恒辉l58ll334744 2025-04-17 16:29 166浏览
我要评论
0
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦