大道至简,炎凰数据要做极致好用的国产大数据分析基础软件|爱分析调研

原创 爱分析ifenxi 2023-08-03 18:48

自2000年代初大数据技术诞生以来,为了应对不断丰富的应用场景、日益复杂的数据类型,以及逐渐膨胀的数据规模,大数据业内逐渐发展出了多种技术路线。
到今天,大数据产品和技术已处于百花齐放的状态,国内市场近年来也因此涌现出了一批大数据厂商,针对多种应用场景的数据处理需求,如大规模离线数据处理、实时数据分析、异构数据分析等,提供不同的产品和解决方案。
炎凰数据就是其中一家新锐针对异构数据的大数据即时分析平台厂商。
成立至今三年间,炎凰数据持续深耕异构数据即时分析赛道,坚持国产自研和产品化路线,在竞争激烈的国内大数据市场中,走出了一条独特的路线,并获得了市场的认可。
异构数据即时分析的市场需求和发展前景如何?炎凰数据为何选择进入该市场?炎凰数据的团队和产品有哪些优势?带着这些问题,爱分析与炎凰数据董事长何宁、CTO王国栋进行了一次深入访谈。

01

异构数据即时分析平台:赋予用户自由探索未知数据的能力

异构数据大规模增长,如何从数据中快速获取洞察成为挑战

在传统大数据分析应用层面,企业通常会聚焦在固定报表、交互式查询分析等场景,对大量结构化数据进行分析。随着企业业务互联网化和数字化程度的加深,企业内的数据特征发生了以下两点结构性的变化:

1)企业的数据来源更加广泛,如数据可能来自各类业务系统、应用、数据库、物联网设备等,并且在很多场景都需要联合多个来源的数据进行关联分析。
2)企业的系统中逐渐产生了大量半结构化数据(如CSV、JSON、XML等),以及非结构化数据(如文档、音频、视频等)。根据IDC预测,到2025年全球数据总量将达到175ZB,其中超过 80% 的数据都将是处理难度较大的半结构化和非结构化数据。

图1:2025年全球数据总量及构成

然而,面对这些多源异构的数据,如果采用传统的数据处理和分析方式,即通过写时建模,预先定义数据schema,然后对数据进行ETL加工,导入数仓,用于支撑指定场景的数据查询分析,很难有效挖掘出这类异构数据的价值,这是因为:

  • 首先,传统的数据处理模式要求部门之间紧密地协作,数据部门根据用数部门提出的需求预先排期对数据进行加工建模,当用数需求很多时,用户往往要数天甚至数周才能获取分析结果。

  • 其次,在大部分针对异构数据的分析场景中,如对日志数据进行分析,用户需要从哪些角度分析数据,以及需要使用哪些维度的数据都不确定,很难采用预先规划的方式对非结构化数据进行分析。

异构数据即时分析平台,专为多源异构数据的查询分析而设计
正是为了满足企业对异构数据进行高效查询分析的需求,异构数据即时分析平台这一赛道近年来在国内市场逐渐变得明确和清晰。以炎凰数据的异构数据即时分析平台产品为例,它能够集成多个数据源的各类非结构化或结构化数据,并采用读时建模的方式,让企业可以在需要对数据进行查询分析时,通过自定义规则,对原始数据进行快速查询分析,支撑智能运维、安全合规和大量创新型业务分析等场景的分析需求。

图2:炎凰数据异构数据即时分析平台

要支撑异构数据的即时分析,“读时建模”是其中最关键的技术。读时建模技术允许用户在读取数据时自定义规则,根据算法从原始数据中自动提取分析需要的字段,并支持用户根据业务需求动态地调整数据查询规则,从而避免繁重的传统ETL工作,提高异构数据处理的灵活度。
炎凰数据CTO王国栋认为,读时建模的灵活性让用户能够以较小的成本,根据分析需求的变化,快速完成数据模型的迭代,在复杂的异构数据分析中实现“time to value”。
因此,随着企业对异构数据分析的需求不断增长,异构数据即时分析平台的价值在于,帮助用户降低对于数据协作流程以及数据开发和管理团队的依赖,通过提供高效的数据分析工具,赋予用户自由、高效地探索数据,挖掘数据价值的能力。

02

 “事为先、人为重“,炎凰数据是最合适的团队

如果要选出国内异构数据分析赛道最优秀的团队,炎凰数据必定是其中之一。这家成立于2020年7月的大数据公司,核心团队成员都来自于美国明星大数据公司Splunk的前中国研发中心,团队在异构数据分析领域有着深厚的技术和经验积累。
2019年底,在美国逐渐对中国进行技术上的封锁打击,以及中国市场环境变得更加复杂等背景下,Splunk宣布将研发中心迁出中国,这也给炎凰数据的成立提供了一个契机。曾担任Splunk全球副总裁、中国研发中心总经理,现为炎凰数据董事长的何宁表示:“在那样一个时间点上,我和我的创始团队,出于技术人的理想,希望利用自身的专长为业内提供一个灵活好用的分析工具,同时也为了打破国外公司的技术垄断,在读时建模和异构数据分析领域,打造自主可控的国产解决方案。”
带着这样的初衷和愿景,何宁与曾为Splunk中国研发中心核心研发成员的叶晓路、王国栋,倪跃,以及多位前Splunk的资深工程师,创立了炎凰数据。
在访谈中,随着话题的深入,我们愈加发现,这支团队身上有着诸多优势,才让炎凰数据在成立仅三年间,产品已打磨相对完善,并且也收获了一批行业头部客户,如众安保险、上海电力、知识星球等,从而顺利在国内市场打开了局面。

图3:炎凰数据创始团队(从左至右:倪跃、叶晓路、何宁、王国栋)

目前,炎凰数据主要的研发人员都来自Splunk。
首先,这让炎凰数据得以迅速组建起了一支成熟的团队,形成完整的研发能力,并且这支团队在Splunk时期已经经过了充分的磨合,保证了在整个产品研发流程中能够高效顺畅的合作。
其次,在Splunk这样全球一流的大数据公司深耕异构数据分析产品技术的研发,让团队建立了对这个领域的客户需求、市场环境,以及关键技术的深刻理解。
最后,服务于多家国外顶级软件产品公司的经历,让炎凰数据的团队非常熟悉大数据产品的开发流程、架构设计、技术选型等,这些经验有助于公司持续开发一款好的软件产品。
当然,随着公司的发展,炎凰数据也逐渐吸纳了一批在市场、商务等方面有专长的优秀人士加入,让整个团队的能力更完善,更能应对市场竞争和环境变化。
03

紧贴市场需求变化,持续打造一款好用的数据平台产品

凭借着团队在读时建模技术,以及异构数据分析平台开发等方面的积累,炎凰数据在成立后,很快开发和打磨出了一个涵盖主要功能的异构数据即时分析平台产品。


然而,由于近年来企业数字化建设持续深入,以及中国企业用户需求的特殊性,完全复刻Splunk的产品技术已经不能满足今天的中国市场的需求。


因此,炎凰数据在最近两年持续洞察用户需求,并不断进行产品升级,希望为企业用户提供好用、易用的数据平台产品。总结起来,炎凰数据主要从以下四个层面,对异构数据即时分析平台产品不断进行优化和创新。


  • 坚持走产品化路线

对于很多企业用户而言,异构数据处理和分析难度很高,如果需要自行考虑和解决大数据技术栈之间的搭建问题,往往效果不佳,同时也耗费了很多额外的精力。

因此,炎凰数据提供了一站式的数据平台产品,提供了从数据导入、数据集成、数据建模、数据存储、数据分析、数据服务、数据可视化等端到端的能力,使用户可以开箱即用,免去在基础设施构建和配置上的复杂工作。

而在标准化的产品之外,炎凰数据也充分考虑了国内很多大型企业潜在的定制化需求。

具体而言,炎凰数据采取的策略是,将一个完整的数据平台上80%属于用户共性需求的功能设计为标准化的产品,而对剩余20%左右不同客户可能存在的个性化需求,炎凰数据则将相关能力进行封装,并构建了一个合作伙伴生态,由这些合作伙伴利用自身的专长充分理解客户的特殊需求,并完成相应的功能开发。从而既满足了客户需求,也让炎凰数据可以专注于产品的持续打磨和升级。

  • 持续优化底层计算引擎

尽管读时建模为异构数据的即时分析提供了一个有效的解决方案,但读时建模也有着一个较明显的短板,即读时建模的算力开销较大,这在数据规模较大时,如不对引擎进行深入优化,将会显著影响数据查询的性能。


针对这一问题,炎凰数据持续在自研的大数据计算引擎上进行了大量优化工作。包括在向量化计算、即时编译,基于列式存储的数据压缩,并发任务安排等多方面做了大量精巧的设计与优化,以加快运算速度,提高数据吞吐量,降低算力消耗,从而可以在绝大部分场景中实现相对即时的分析结果。


  • 采用全新的基础架构

区别于Splunk时代,今天的企业对于数据分析的计算环境、数据规模都比以往有着很大的不同。一方面,一些企业的很多业务系统和数据平台都部署在云上,同时对于资源使用的灵活性有着很高要求;另一方面,随着企业数据规模的不断提高,如何应对高吞吐、大规模数据的分析,也成为了企业迫切需要解决的问题。


炎凰数据也敏锐的察觉到了这些变化,因此很早就开始规划和进行平台基础架构上的升级,引入云原生和分布式架构和技术。


在云原生方面,炎凰数据平台基于全新的云原生架构而设计,无论在云端还是私有化部署,都能够通过存算分离,为用户带来存储和计算资源的弹性扩展能力,从而可以有效应对高峰期的查询需求,并大幅降低运维和实施部署的成本。


在分布式方面,炎凰数据于今年6月发布新版本的数据平台产品,采用了分布式架构,提升了对于大规模,高并发数据的处理性能。


  • 注重平台易用性

数据平台的易用性往往也是企业用户在选择产品时会重点考虑的因素,通过减少繁琐的操作,用户可以专注于数据分析工作,获取洞察。因此,炎凰数据一直注重提升数据平台的易用性。


首先是查询语言方面,区别于业内同类的异构数据分析平台通常采用定制的搜索语言,如SPL、Elastic query DSL等,炎凰数据平台支持用户使用标准SQL语言进行数据查询,除了支持过滤,映射,去重,聚合,排序,关联等基本SQL查询能力之外,还提供了大量标准函数和表函数的扩展,同时也支持用户自定义函数,极大降低了用户的学习门槛。


其次,炎凰数据平台提供了丰富的仪表板功能,基于平台集成的可视化图库echarts,用户可以使用各类常见的可视化解决方案,并将数据分析方法和分析结果保存在其中,加速企业内部数据价值的分享和传递。


04

深入应用场景,用数据提升客户业务效益

数据平台最终还是需要在具体的应用场景中,为用户的业务提供洞察,提升业务效益。总体而言,炎凰数据的产品可以作为企业数字化转型的数据平台和效能工具,在运维、安全、生产制造等多种真实场景中,为用户提供快速分析和解决业务问题的能力。


图4:炎凰数据平台产品定位

  • 跨领域数据分析,提升企业IT治理水平

在IT运维领域,炎凰数据的异构数据即时分析平台可提供关联多源日志数据的能力,帮助用户在IT基础平台运维、业务系统质量分析等场景高效洞察和定位问题。

企业IT基础平台运维:炎凰数据平台可以帮助企业用户整合基础平台多种产品日志,并通过一站式的工具组合,提供企业级的巡检、监控、统计、报表、统一视图、用量透视、辅助规划能力,企业的IT平台运行状况因此可以一目了然。

业务系统质量度量与分析:炎凰数据平台具备便捷接入各类来源数据的能力,可以快速关联分析多个应用系统的日志数据,提供全流程业务质量度量,通过描画应用调用链,精准定位系统的业务故障。

  • 兼顾效率与灵活,保障网络完全防护

随着企业数字化的深入,大中型企业在网络安全方面,也会面临着更高的威胁。炎凰数据平台对于异构数据的即时分析能力可以帮助企业在网络安全领域建立安全运营中心(SOC)。通过配合企业的安全设备,平台能够持续分析威胁数据,清晰探查攻击链路,并准确定位攻击源;同时,平台也能够对多安全系统进行跨域关联分析,提供定期的统计与报表,实现高效的安全告警。
  • 广泛连接异构数据,助力企业生产

在制造业,领先的生产型企业在设备上有大量传感器在持续不断地收集各类IoT数据,不同传感器收集的数据可能存在数据格式和标准不一致的问题,这使得多传感器数据的关联分析具备较高难度。而炎凰数据平台可以轻松实现对各类型产线传感器数据进行关联和综合分析,为产品设计、产线调优等场景提供精准洞察,提升制造业企业的生产效率。

05

异构数据潜力巨大,价值有待进一步深挖

与异构数据庞大的数据规模及潜在价值相比,国内企业当前对于异构数据的挖掘利用整体还处于较初级的水平。随着以炎凰数据为代表的异构数据即时分析平台在功能、性能、易用性上的不断完善,以及企业对于异构数据价值的认识逐渐提高,预期国内企业将会在各类业务场景中加强对于异构数据探索分析。


为了加速这一进程,帮助业内企业用好分析工具,拓宽应用场景,炎凰数据近期推出了免费的社区版一站式异构数据分析平台产品——鸿鹄,并提供相应的交流平台,旨在帮助广大开发者可以灵活地管理海量多源异构数据,快速地分析数据特征,助力用户轻松实现数据驱动业务。

截至当前,鸿鹄社区已经汇集了众多来自字节跳动、中金所、平安、阿里、移动、公安部研究所、电信等知名企业机构的研发人员、数据分析师、数据科学家等人员,并产生了多个创新性的应用案例。

如在公安部第三研究所“网络安全态势感知系统”应用案例中,用户提出了一种基于鸿鹄数据平台的网络安全态势感知系统,系统借助鸿鹄数据平台读时建模、时序处理、数据搜索等高效灵活的超大数据存储和分析处理能力,以安全大数据为基础,从全局角度提升对安全威胁的发现识别、理解分析、响应处置能力,最终实现网络安全态势感知能力的落地。

在上海耀乘科技“微服务应用的可观测性平台”应用案例中,用户基于鸿鹄自主研发的读时建模引擎,可以快速导入和存储异构数据,支持动态调整数据模型和分析参数,无需固化模型和分析流程。当业务分析场景有变化时,只需调整SQL分析语句,快速响应,符合搭建可观测性场景的需求。因此保障了在微服务应用中,当请求跨越多个微服务时,每一个微服务都具有透明性和可观测性,从而使工程人员能够及时准确地观测和诊断问题。

可见,异构数据分析正不断在多个业务领域创造出重要价值,相信在不久的将来,异构数据分析即时平台将成为企业的必备基础设施。

注:点击左下角“阅读原文”可浏览爱分析官网,了解更多信息。


爱分析ifenxi 爱分析是一家中国领先的数字化市场研究与咨询机构。
评论 (0)
  • 在人工智能技术飞速发展的今天,语音交互正以颠覆性的方式重塑我们的生活体验。WTK6900系列语音识别芯片凭借其离线高性能、抗噪远场识别、毫秒级响应的核心优势,为智能家居领域注入全新活力。以智能风扇为起点,我们开启一场“解放双手”的科技革命,让每一缕凉风都随“声”而至。一、核心技术:精准识别,无惧环境挑战自适应降噪,听懂你的每一句话WTK6900系列芯片搭载前沿信号处理技术,通过自适应降噪算法,可智能过滤环境噪声干扰。无论是家中电视声、户外虫鸣声,还是厨房烹饪的嘈杂声,芯片均能精准提取有效指令,识
    广州唯创电子 2025-04-08 08:40 79浏览
  • 在追求环境质量升级与产业效能突破的当下,温湿度控制正成为横跨多个行业领域的核心命题。作为环境参数中的关键指标,温湿度的精准调控不仅承载着人们对舒适人居环境的期待,更深度关联着工业生产、科研实验及仓储物流等场景的运营效率与安全标准。从应用场景上看,智能家居领域要求温湿度系统实现与人体节律的协同调节,半导体洁净车间要求控制温湿度范围及其波动以保障良品率,而现代化仓储物流体系则依赖温湿度的实时监测预防各种产品的腐损与锈化。温湿度传感器作为实现温湿度监测的关键元器件,其重要性正在各行各业中凸显而出。温湿
    华普微HOPERF 2025-04-07 10:05 88浏览
  • 医疗影像设备(如CT、MRI、超声诊断仪等)对PCB的精度、可靠性和信号完整性要求极高。这类设备需要处理微伏级信号、高频数据传输,同时需通过严格的EMC/EMI测试。制造此类PCB需从材料选择、层叠设计、工艺控制等多维度优化。以下是关键技术与经验分享。 1. 材料选择:高频与生物兼容性优先医疗影像设备PCB常采用 Rogers RO4000系列 或 Isola FR4高速材料,以降低介电损耗并保证信号稳定性。例如,捷多邦在客户案例中曾为某超声探头厂商推荐 Rogers RO4350B
    捷多邦 2025-04-07 10:22 93浏览
  • 引言:POPO声的成因与影响在语音芯片应用中,WT588F08A作为一款支持DAC+功放输出的高集成方案,常因电路设计或信号处理不当,在音频播放结束后出现POPO声(瞬态噪声)。这种噪声不仅影响用户体验,还可能暴露电路设计缺陷。本文将基于实际案例,解析POPO声的成因并提供系统化的解决方案。一、POPO声的根源分析1. 功放电路状态切换的瞬态冲击当DAC输出的音频信号突然停止时,功放芯片的输入端若处于高阻态或无信号状态,其内部放大电路会因电源电压突变产生瞬态电流,通过喇叭表现为POPO声。关键因
    广州唯创电子 2025-04-07 09:01 95浏览
  • 曾几何时,汽车之家可是汽车资讯平台领域响当当的“扛把子”。2005 年成立之初,它就像一位贴心的汽车小助手,一下子就抓住了大家的心。它不仅吸引了海量用户,更是成为汽车厂商和经销商眼中的“香饽饽”,广告投放、合作推广不断,营收和利润一路高歌猛进,2013年成功在纽交所上市,风光无限。2021年更是在香港二次上市,达到了发展的巅峰,当年3月15日上市首日,港股股价一度高达184.6港元,市值可观。然而,如今的汽车之家却陷入了困境,业务下滑明显。业务增长瓶颈从近年来汽车之家公布的财报数据来看,情况不容
    用户1742991715177 2025-04-07 21:48 57浏览
  •     根据 IEC术语,瞬态过电压是指持续时间几个毫秒及以下的过高电压,通常是以高阻尼(快速衰减)形式出现,波形可以是振荡的,也可以是非振荡的。    瞬态过电压的成因和机理,IEC 60664-1给出了以下四种:    1. 自然放电,最典型的例子是雷击,感应到电力线路上,并通过电网配电系统传输,抵达用户端;        2. 电网中非特定感性负载通断。例如热处理工厂、机加工工厂对
    电子知识打边炉 2025-04-07 22:59 52浏览
  • 贞光科技作为三星电机车规电容代理商,针对电动汽车领域日益复杂的电容选型难题,提供全方位一站式解决方案。面对高温稳定性、高可靠性、高纹波电流和小型化等严苛要求,三星车规电容凭借完整产品矩阵和卓越技术优势,完美满足BMS、电机控制器和OBC等核心系统需求。无论技术选型、供应链保障、样品测试还是成本优化,贞光科技助力客户在电动汽车产业高速发展中占据技术先机。在电动汽车技术高速发展的今天,作为汽车电子系统中不可或缺的关键元器件,电容的选型已成为困扰许多工程师和采购人员的难题。如何在众多参数和型号中找到最
    贞光科技 2025-04-07 17:06 36浏览
  • 在全球电子产业面临供应链波动、技术迭代和市场需求变化等多重挑战的背景下,安博电子始终秉持“让合作伙伴赢得更多一点”的核心理念,致力于打造稳健、高效、可持续的全球供应链体系。依托覆盖供应商管理、品质检测、智能交付的全链路品控体系,安博电子不仅能确保电子元器件的高可靠性与一致性,更以高透明的供应链管理模式,助力客户降低风险、提升运营效率,推动行业标准升级,与全球合作伙伴共同塑造更具前瞻性的产业生态。动态优选机制:构建纯净供应链生态安博电子将供应商管理视为供应链安全的根基。打造动态优选管控体系,以严格
    电子资讯报 2025-04-07 17:06 52浏览
  • 及时生产 JIT(Just In Time)的起源JIT 起源于 20 世纪 70 年代爆发的全球石油危机和由此引发的自然资源短缺,这对仰赖进口原物料发展经济的日本冲击最大。当时日本的生产企业为了增强竞争力、提高产品利润,在原物料成本难以降低的情况下,只能从生产和流通过程中寻找利润源,降低库存、库存和运输等方面的生产性费用。根据这种思想,日本丰田汽车公司创立的一种具有特色的现代化生产方式,即 JIT,并由此取得了意想不到的成果。由于它不断地用于汽车生产,随后被越来越多的许多行业和企业所采用,为日
    优思学院 2025-04-07 11:56 93浏览
  • 引言:小型化趋势下的语音芯片需求随着消费电子、物联网及便携式设备的快速发展,产品设计对芯片的小型化、高集成度和低功耗提出了更高要求。厂家凭借其创新的QFN封装技术,推出WTV系列(如WTV380)及WT2003H系列语音芯片,以超小体积、高性能和成本优势,为紧凑型设备提供理想解决方案。产品核心亮点1. QFN封装技术赋能超小体积极致尺寸:WTV380采用QFN32封装,尺寸仅4×4毫米,WT2003H系列同样基于QFN工艺,可满足智能穿戴、微型传感器等对空间严苛的场景需求。高密度集成:QFN封装
    广州唯创电子 2025-04-07 08:47 99浏览
  • 文/Leon编辑/cc孙聪颖‍转手绢、跳舞、骑车、后空翻,就在宇树、智元等独角兽企业率领“机器人大军”入侵短视频时,却有资本和科技大佬向此产业泼了一盆冷水。金沙江创投管理合伙人朱啸虎近日突然对人形机器人发难,他表示“最近几个月正在批量退出人形机器人公司”。“只是买回去做研究的,或者买回去做展示的,这种都不是我们意义上的商业化,谁会花十几万买一个机器人去干这些活?”朱啸虎吐槽。不过,朱啸虎的观点很快就遭到驳斥,众擎机器人的创始人、董事长赵同阳回怼道:“(朱啸虎)甚至问出了人形机器人在这个阶段有什么
    华尔街科技眼 2025-04-07 19:24 74浏览
  •     在研究Corona现象时发现:临界电压与介电材料表面的清洁程度有关。表面越清洁的介电材料,临界电压越高;表面污染物越多的地方,越容易“爬电”。关于Corona现象,另见基础理论第007篇。    这里说的“污染物”,定义为——可能影响介电强度或表面电阻率的固体、液体或气体(电离气体)的任何情况。    IEC 60664-1 (对应GB/T 16935.1-2023) 定义了 Pollution Degree,中文术语是“污染等
    电子知识打边炉 2025-04-07 22:06 49浏览
  • 在万物互联时代,智能化安防需求持续升级,传统报警系统已难以满足实时性、可靠性与安全性并重的要求。WT2003H-16S低功耗语音芯片方案,以4G实时音频传输、超低功耗设计、端云加密交互为核心,重新定义智能报警设备的性能边界,为家庭、工业、公共安防等领域提供高效、稳定的安全守护。一、技术内核:五大核心突破,构建全场景安防基座1. 双模音频传输,灵活应对复杂场景实时音频流传输:内置高灵敏度MIC,支持环境音实时采集,通过4G模块直接上传至云端服务器,响应速度低至毫秒级,适用于火灾警报、紧急呼救等需即
    广州唯创电子 2025-04-08 08:59 68浏览
  •   工业自动化领域电磁兼容与接地系统深度剖析   一、电磁兼容(EMC)基础认知   定义及关键意义   电磁兼容性(EMC),指的是设备或者系统在既定的电磁环境里,不但能按预期功能正常运转,而且不会对周边其他设备或系统造成难以承受的电磁干扰。在工业自动化不断发展的当下,大功率电机、变频器等设备被大量应用,现场总线、工业网络等技术也日益普及,致使工业自动化系统所处的电磁环境变得愈发复杂,电磁兼容(EMC)问题也越发严峻。   ​电磁兼容三大核心要素   屏蔽:屏蔽旨在切断电磁波的传播路
    北京华盛恒辉软件开发 2025-04-07 22:55 76浏览
我要评论
0
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦