随着5G部署规模不断扩大,网管KPI的分析需求突增也日益显著,存在用户感知问题无法从告警和KPI数值中直接体现的情况;或者某些小区存在故障而网络维护工程师无法及时监控识别出来。异常零流量小区,就是指这类状态正常,没有异常告警上报,但实际上用户无法接入或接入后业务不正常的小区。
导致异常零流量小区的原因有很多,可能是系统故障、配置错误、干扰等因素。网优人员筛查异常零流量小区时,通常存在如下痛点:
耗人力:需人工获取大量KPI、告警信息并进行指标筛选分析。
占资源:网管取全网KPI指标进行核查,网管CPU占用率高、负荷大。
用时长:获取全网KPI、告警及KPI梳理等过程耗时长,一般一天最多只能取一次数据进行统计。在取KPI及告警后,网优人员很难及时发现新出现的异常零流量小区。
难度大:全网站点多,站型复杂,异常零流量小区筛查需要结合KPI、告警信息等大量信息,人工筛查工作量大并且无法保证零失误。
为了解决以上痛点,中兴通讯推出了NQI异常零流量小区检测功能。该功能采用AI算法,智能检测5G异常零流量小区,并提供初步根因判定,以指导现场人员快速排障,及时解决潜在风险。
异常零流量小区检测功能,使用历史14天的基站性能数据训练AI模型,分析用户的MSG1接入次数、RRC接入尝试/成功次数、RRC连接用户数、上下文建立尝试/成功次数等信息,判断业务的初始随机接入阶段、RRC阶段、上下文接入阶段等是否存在异常,以此判断真正的异常零用户小区和初步根因。异常零流量小区归类为睡眠小区、零流量小区、特殊小区、人工关断小区,以及故障小区等类型,并针对不同的类型给出不同的处理建议。
下图展示了异常零流量小区的主要判定过程。
过滤出用户数为0的小区,对这些小区应用AI模型,判断出其中真正的睡眠小区。
对于用户数不为0的小区,过滤出其中流量为0的小区,应用AI模型,判断出其中真正的零流量小区。
对于0用户非睡眠小区,如果小区退服,原因是人工OAM,统计为人工关断;否则统计为故障小区。小区正常,统计为特殊小区。
环境需求:
UME网管版本要求:V16.21.32及以上版本
NIA版本要求:V16.21.32及以上版本
新建任务执行结束后,自动输出异常零流量小区清单和根因,同时给出初步的处理建议。单击操作栏中间的【查看报告】图标,可以查看任务报告。报告分别从“异常零流量小区占比”、“根因类型”、“小区异常零流量天数”三个TAB页展示异常零流量小区的各项统计数据及详情。
经确认异常零流量小区识别准确率达100%,人工处理需要2-3小时,NQI只需1-2分钟,整体提效至少70%,助力现场网络优化、故障排查体质提效。
异常零流量小区的根因有很多类型,通常包括硬件异常、人工关断等。识别出异常零流量小区后,还可以根据根因类型,分别给出解决建议。
如下为主要的根因类型,其中有一些根因比较明确(标记为黄色背景),现场人员可直接去对应模块处理;而部分根因原因较复杂(标记为蓝色背景),则需要现场人员排查干扰和CPU利用率等基础指标找出具体原因。无法定位原因的还可能需要转交其他运维人员进行硬件扫描或者提交给研发团队分析处理。
问题现象:MBCD-ZRW-4室分小区长期无流量,从指标分析RRC用户数为0,且MSG1的接收次数较少。在该区域打卡,可以正常搜索到美博城1/2/3小区信号,无4小区信号。NQI输出根因为没有MSG3、特殊小区。
问题分析:4小区下行公共调度消息正常,RRU发射功率正常,但有一个通道节能。
配置核查:RRU为2通道,分别接不同的天馈,按客户要求小区通道节能打开,现场核查发现1通道堵了负载,2通道天馈室分外打,安装在楼顶位置。
结论:由于两个通道覆盖不同的区域,且通道1被堵,导致通道节能触发后,通道2无法被唤醒,小区处于无信号状态。关闭节能后再次复测,可以正常接入,恢复正常。
问题现象:广州南沙区大岗村莲塘上街D-ZRH-3小区从3号开始出现0流量、0用户,从指标分析RRC用户数为0。从接入类的指标看,MSG1/2次数为0,网管核查无活跃告警。在该站点下测试,可以正常搜索到广州南沙区大岗村莲塘上街D-ZRH-1/2小区信号,3小区无信号。NQI输出根因为特殊小区、其他原因。
问题分析:网管采数分析,小区MIB/SIB正常,基带/RRU功率正常。通过AAU状态扫描脚本发现,该小区对应的AAU存在FPGA异常、AC校正失败,复位AAU后未恢复,需返修AAU。
NQI异常零流量检测功能可自动输出问题小区清单和根因,并提供处理建议。正常人工统计需要2-3小时,NQI只需1-2分钟,整体提效至少70%,助力现场网络优化、故障排查体质提效,目前已全网日常应用。
想第一时间收到我们的更新吗?
只需两步,为文档君加上“爱你一万年”星标⭐!
没有星标,你爱的文档君就要跟你失联啦~