在新生态、新技术、新业务不断涌现的当下,企业 IT 架构复杂度、IT 基础设施规模快速增长,智能运维(AIOps)正成为企业管控物理设备、实现快速需求迭代、保障业务连续性的必备手段。
HotChips 2024大会技术合集(1)
HotChips 2024大会技术合集(2)
HotChips 2024大会技术合集(3)
HotChips 2024大会技术合集(4)
HotChips 2024大会技术合集(5)
HotChips 2024大会技术合集(6)
HotChips 2024大会技术合集(7)
HotChips 2024大会技术合集(8)
机器人专题研究:产业发展概览(2024)
AIOps能力建设基本情况
智能运维产业在 2024 年保持稳健发展态势,各行业对智能运维技术的需求将进一步增长。随着行业标准体系的逐步制定和完善,智能运维市场的规范化程度将进一步提高。现阶段,我国智能运维市场的主要客户来自金融、运营商等业务系统复杂且对系统运行效率要求较高的行业。随着智能化技术进一步赋能传统行业,智能运维技术也在能源、制造等传统行业逐渐推广。
企业对智能运维需求强劲,2024 年更多企业关注投入成本以及运营的可持续性。数字化转型的目标正从收入增长向利润产生转变,企业在 IT 方面的预算增速已经放缓,如何运用人工智能等技术提高效率,助力企业降本增效也是当前的关注重点。
智能运维 AIOps、业务可观测性和 SRE 可靠性实践是当前重点关注方向。此外,今年运维数据治理、大模型与运维场景的结合以及运维数字员工等方向也受到企业关注。
运维领域中大语言模型 LLM 的应用已逐步增多,已在开展运维大模型相关实践的企业较 2023 年明显提升,市场上已逐渐出现一些较为成熟的运维大模型相关产品。
AIOps场景应用情况
随着 AIOps 建设不断深入,企业 AIOps 智能运维能力建设成熟度逐渐提高,更多企业进入 L3 进阶智能化运维阶段。智能运维在质量、成本、效率、安全四大运维领域均已开展部署和应用,其中质量和效率领域仍然是目前企业关注度最高的应用方向。此外,2024 年成本方向关注度显著提升。
随着技术的发展,智能运维正从单一场景向体系化发展,产品趋向于构建统一平台。同时,智能运维系统也在从被动响应向主动预防转变,可观测性和可解释性关注度提升,进一步提高运维的透明度和增强运维人员对系统的理解。
通过采购第三方解决方案、组建团队进行联合开发,快速构建智能运维能力,是多数企业目前建设 AIOps 能力的主要方式。我国智能运维行业参与者众多,集中度较低,解决方案丰富而多样,反映了市场的创新活跃性和多元化发展。
AIOps可观测能力建设情况
可观测性技术可以通过实时监控和分析 IT 系统的指标、日志和追踪等数据,为运维团队提供了深入理解系统内部状态和过程的能力。可观测能力可以结合智能运维能力应用于多种不同的可观测场景,让运维人员能够更容易地理解复杂的数据和系统状态。
根据本次调查数据显示,超过半数的企业已经着手构建可观测性能力,并且部分企业已经建立了较为成熟的系统。这些企业主要在基础设施监控、用户体验提升以及应用性能监测等场景中实践和推进可观测性能力建设,以期实现更高效的运维管理和服务质量保障。
AIOps发展趋势与挑战
当前,智能运维算法模型准确性、可解释性是现阶段企业主要面临的挑战,这导致企业需要投入大量的时间、人力成本持续优化模型,提升模型准确率,并为算法不准确的场景兜底。在未来,企业可通过开展运维数据治理工作、并结合领域专家知识,以增强模型的准确性和透明度,提升智能维效果。
展望未来,企业将专注于在多样化的应用场景中建设智能运维能力,并致力于通过强化数据治理来提升数据的准确性和完整性。这不仅有助于智能算法的持续提升优化,以确保运维决策的可靠性,也将显著提高企业运维的智能化水平,实现更高效、更精准的运维管理。
(一)AIOps 能力建设基本情况
我国 AIOps 智能运维发展势头强劲,逐步成为企业提升运维效率、保障系统稳定运行的关键技术。本次调查数据显示,超四成企业在运维方面年平均投资规模超5000 万元,占比最高(47.16%)。其次为投资金额在 500 万元至 5000 万元的区间,占比高达 40.12%。
(二)AIOps 场景应用情况
根据中国信通院牵头制定的行业标准AIOps 能力建设分级要求,可以将智能化运维整体能力从感知、分析、决策、执行、知识更新五个维度进行级别划分。系统的参与程度随智能化程度逐级递增,并结合智能运维应用场景特点,形成 AIOps 能力成熟度模型。
从目前的发展情况来看,现阶段 AIOps 能力大多集中在 L2 辅助智能化运维、L3 进阶智能化运维级别,主要以系统分析、辅助人工进行决策和操作为主。L4 和L5 级别随着 AIOps 的技术发展和能力的逐步增强,将是未来智能运维能力建设的发展方向和目标。
《算力网络:光网络技术合集(1)》
1、面向算力网络的新型全光网技术发展及关键器件探讨
2、面向算力网络的光网络智能化架构与技术白皮书
3、2023开放光网络系统验证测试规范
4、面向通感算一体化光网络的光纤传感技术白皮书
《算力网络:光网络技术合集(2)》
1、数据中心互联开放光传输系统设计
2、确定性光传输支撑广域长距算力互联
3、面向时隙光交换网络的纳秒级时间同步技术
4、数据中心光互联模块发展趋势及新技术研究
面向超万卡集群的新型智算技术白皮书
面向AI大模型的智算中心网络演进白皮书
本号资料全部上传至知识星球,更多内容请登录智能计算芯知识(知识星球)星球下载全部资料。
免责申明:本号聚焦相关技术分享,内容观点不代表本号立场,可追溯内容均注明来源,发布文章若存在版权等问题,请留言联系删除,谢谢。
温馨提示:
请搜索“AI_Architect”或“扫码”关注公众号实时掌握深度技术分享,点击“阅读原文”获取更多原创技术干货。