为确保成功部署并采用实时流平台,系统架构师、数据工程师和安全架构师必须克服大量挑战。本文重点阐述五大挑战,这些挑战可能会对平台及与之关联的数据和设备的使用、操作、维护和安全产生消极影响。

挑战一:选择数据格式、架构和开发框架

实际上,流平台是一种变相大数据平台,流数据处理只是其总体功能的一个方面。通常,流数据能够通过适当途径进入本地或基于云的大型数据存储库。分析师和领域专家运用这些数据提取见解、掌握趋势及开发算法,从而实时应用这些算法处理数据流,改善运营并进一步发掘业务价值。数据结构及分析师、数据科学家和领域专家掌握的工具将极大地影响整个平台的采用和应用。

鉴于流数据通常由一系列带时间戳的数据包组成,因此 IT 团队和工程师应搜寻支持原生数据类型的工具以处理时序数据。这样,数据清理、可视化及模式探查将变得轻松。另外,这些工具还必须提供专为执行流处理所需的微型批处理/窗口化处理而设计的开发框架。该框架将包括存储处理结果临时状态的配置,以及大规模实施生成的算法的基础设施。这些功能不仅有助于提高算法的开发和运营系统部署效率,还能降低出错概率。

开发预测性维护算法(如剩余使用寿命 (RUL)、状态监测、资产绩效管理 (APM) 应用)时,通常需要监控资产的故障数据。经证实,对于高价值资产或安全关键应用,故障运行的成本过高或是不实际。在这种情况下,最好使用系统仿真工具生成合成数据,对算法开发过程中使用的真实数据进行补充。

挑战二:算法测试、验证、部署和生命周期管理

 使用静态数据开发预测性算法是一方面,工程师还必需思考如何在运营系统中验证算法,确保妥善检测和报告资产运行状况。同时,还必须实施算法生命周期管理,确保生产环节的模型完整性。

为应对这些挑战,流平台应当能够重放存档流数据,以便执行算法测试和验证。该步骤往往在测试/验证系统上完成。测试/验证系统是生产流系统的小型副本。务必利用算法开发环境自带的调试功能,充分考量多方面能力,包括设置断点、监控变量以及整体了解按生产系统运行方式处理流数据时算法的行为模式。

与在算法开发阶段使用仿真数据一样,应使用系统仿真工具生成并传输合成数据,从而验证不利或极端案例。同时,还可通过仿真将数据输送至整个生产系统接受验收测试,以及输送至在线流系统作为基准。

鉴于这些系统对于推进指定组织运营的重要性日益提升,必须对部署算法的整个生命周期进行管理,从而确保完整性及合理使用,这与企业应用程序软件的管理如出一辙。在开发阶段,将涵盖以下一些能力:评估算法的准确性和有效性;管理用于开发算法的数据和评估结果;自动记录结果和算法应用相关的信息。而在运营阶段,不仅要管理算法版本,还要将性能与开发阶段采集的基准结果进行比较,确定是否需要调整或更新算法,或者是否全面停用和替换算法,以确保系统正常运行,这一点非常重要。鉴于这些平台通常全天候运行,系统应支持算法热部署、算法在线更新以及在算法更新遇到问题时还原。

挑战三:网络连接不可靠和/或远程设备传回的数据不确定

系统如何处理未按顺序抵达或已丢弃的数据包?如何设计可能并非始终与终端设备相连的系统架构?IT 团队和工程师采用的平台应支持在执行数据包分析之前的混洗及重新排序。很多时候,处理机器数据时会采用信号处理及时域和频域分析等技术提取特征。值得注意的是,为应用这些技术,必须根据原始事件发生的时间而不是注入到流系统的时间,对数据包进行排序。另外,还应设计处理环境,使用重定时、插值和平滑等方法清理时序数据。

系统架构师寻求的平台应支持将算法部署到各种系统,包括云、本地和边缘/嵌入式设备。当连接具有间歇性时,该功能支持将部分处理本地化至边缘设备。如果边缘设备与集中流处理基础设施之间的带宽有限,还可以实现数据缩减。

挑战四:扩展和性能

 实时流系统必须在设置的时间段内对输入数据做出响应。它们持续运行,并随着新设备的上线不断调整。系统应根据通用流基础设施通常采用的分区方式进行扩展。创建新的主题或流时,还必须创建新的流处理上下文。探寻利用云和容器技术弹性的强大功能。系统应对数据批处理实施管理,确保不受 I/O 约束(暂停等待执行输入/输出操作)并充分利用平台计算资源。

挑战五:安全性

系统架构师必须预先考虑整个工作流程安全性,从开发到运营系统的部署。流平台需要与组织内部现有的安全层集成,从而支持单点登录 (SSO) 等功能及根据用户角色控制数据和系统访问。这也包括控制边缘设备访问,特别是利用流平台对设备实施某种监督控制的系统。与此同时,平台还必须支持实行数据保护,包括加密静态数据、动态数据及算法知识产权;特别是,如果算法可在云系统上访问或者在边缘设备或系统上运行。由于很多分析平台将算法作为脚本或未打包代码运行,这可能成为一项挑战。

流数据的时间价值

实时分析可提供关键见解,但从数据中收集的见解具有时间价值。例如,如果工厂对其设备运行机器运行状况监控,需就潜在设备故障发出提醒,为操作员预留充足的时间进行干预。系统架构师、数据工程师和安全架构师尽可能高效地避免潜在障碍并顺利部署实时流平台,将创造巨大价值。通过应对上述挑战,IT 团队将可以使用系统并开始提取即时的见解。

责编:Yvonne Geng

(本文由MathWorks供稿,电子工程专辑对文中陈述、观点保持中立) 

阅读全文,请先
您可能感兴趣
即使在最佳设计中,噪声和干扰也会悄然降低信噪比、掩盖所需信号并影响测量精度和可重复性。示波器和数字化仪等数字化仪器集成了多种功能,用于表征、测量和减少噪声对测量的影响。
本文介绍了一些生成常见且有用的噪声类型的好方法,包括白色、粉色和褐色(可选)。核心组件是一个经过编程的MCU,用于生成原始白噪声,以及一个改进的滤波器,用于将白噪声转换为粉色噪声。
仿真程序有助于分析和设计电源转换器及其控制算法。
人类的发明,即工程系统,依赖于物理学和数学基本原理,如麦克斯韦方程、量子力学和信息论等,以实现特定目标。然而,随着工程系统复杂性和规模迅速增长,其子组件的功能可能呈现出非线性特性,这使得基于第一原理的设计方法受到限制。
过去几十年来,全球能源消耗稳步增长,预计还会进一步增长。
光电探测器的性能因材料不同、结构不同、制备工艺及应用场景的不同而存在较大的差异。性能指标之间往往存在制约,如暗电流与输出电流、灵敏度与响应度、可靠性与灵敏度等需要权衡。对于性能表征也是如此,例如高响应度与高精度电流表征无法同时进行。
全球人形机器人领域上市公司的百强名单将人形机器人产业链区分为大脑、身体以及集成三大核心环节,覆盖全球共计100家上市公司。中国共37家企业上榜(中国大陆32家,台湾5家),其中深圳7家,占中国大陆上榜企业近四分之一,包括比亚迪、腾讯、优必选、速腾聚创、雷赛智能、兆威机电、汇川技术等......
DeepSeek模型虽降低AI训练成本,但AI模型的低成本化可望扩大应用场景,进而增加全球数据中心建置量。光收发模块作为数据中心互连的关键组件,将受惠于高速数据传输的需求。未来AI服务器之间的数据传输,都需要大量的高速光收发模块......
凭借新一代3nm制程工艺与全新架构,骁龙® 8至尊版的单核和GPU 性能提升均超过 40%,使得Find N5在性能上实现质的飞跃……
简化物联网连接:应用就绪型软件构建模块
别再盯着欧美了,日韩在全球半导体市场也是一股不可忽视的力量。韩国,按销售额来看,是全球半导体第二大国,仅次于美国。日本,半导体设备和材料领域的王者,在部分领域能做到近乎垄断。不只有三星和SK海力士,存
据IT业界9日报道,苹果公司最近进入了“可折叠iPhone”零部件供应商选择的最后阶段,据观察,三星显示器已决定独家供应初期面板量。据悉,三星将供应约1500万至2000万片,并将于明年5月开始量产,
2022年下半年以来,需求下降,芯片价格跳水,芯片行情趋向寒冷,拼价格、拼服务、拼账期成为常态,持续的低迷之下,芯片人都开始靠省钱过日子。同时,我们发现,行情冷淡的时候,订货、配单、PPV(Purch
2月11日,特斯拉上海储能超级工厂投产仪式今日在上海临港举行,这一重要项目的投产标志着特斯拉在华业务的进一步拓展。特斯拉上海储能超级工厂于 2024 年 5 月正式在上海临港新片区开工建设。从开工到产
我是芯片超人花姐,入行20年,有40W+芯片行业粉丝。有很多不方便公开发公众号的,关于芯片买卖、关于资源链接等,我会分享在朋友圈。扫码加我本人微信👇1.  信越化学(Shin-Etsu Chemica
周一,埃隆·马斯克与一群投资者提出以974亿美元收购ChatGPT开发商OpenAI,这一金额远低于这家人工智能公司最近1570亿美元的估值。OpenAI首席执行官萨姆·奥特曼在X平台上发文,立即拒绝
现货促销让采购/更简单/更高效为了更好地帮助大家采购芯片,实现供需资源的无缝对接。AMEYA360决定开启【现货促销】专栏,通过AMEYA360微信公众号,每天推送原厂现货促销物料,助力广大用户制定更
近日,摩根士丹利发布了题为《The Humanoid 100: Mapping the Humanoid Robot Value Chain》的报告,该报告公布了全球人形机器人产业链百强企业榜单。这一
比亚迪放大招,智驾卷到10万元内!王传福:比亚迪全系车型搭载高阶智驾2月10日晚,比亚迪智驾发布会放出“王炸”,这家全球新能源汽车销量冠军宣布,将推出低、中、高三套不同配置高阶智能驾驶解决方案,首批搭
  电子无尘车间在设计时需要重视多个问题,以确保生产环境的洁净度、生产效率和安全性。以下是需要重视的设计问题,具体随合洁科技电子洁净工程公司一起来了解下吧! &emsp