异常检测根因定位分析系统

摘要:如何快速高效自动化检测异常与根因定位,减少人工参与耗时和提高工作效率,显得尤为重要。

一.背景

二.名词解释

三.数据架构流转图

四.核心要点及结论

o1.核心模块

o2.效果评估

o3.遗留问题

五.应用场景示例

o1.效果展示

六.未来展望

七.参考文档

一.背景

数据指标”异常“,为什么异常?分析什么原因导致....

老板的灵魂三问…

如何快速高效自动化检测异常与根因定位,减少人工参与耗时和提高工作效率,显得尤为重要。

使用人群:商分,运营,产品,市场等数据使用分析人员

概念拉齐:行业约定俗成的根因定位叫法,数据层定位搜索分析结果(算法无法知道”外部知识“)

完美闭环图:有因有果有应对策略动作

二.名词解释

预测值:predict,forecast

真实值:real,actual

指标:fundamental measure,derived measure

维度:dim

元素:element

异常:outlier,anomaly

归因:rca即RootCauseAnalysis

波动量化指标: 惊奇力,波动度,异常度等

权重量化指标: 解释力,贡献度,严重度等

三.数据架构流转图

四.核心要点及结论

1.核心模块

异常模块:7种算法(LOF,COF,KNN,IForest,COPOD,PCA,SOS)投票机制

预测模块:EWMA,剔除异常点的前N的中位数Median或者Avg等,预测的准确度对算法的影响

根因模块:主流算法(Adtributor,R_Adtributor,AutoRoot,PSqueeze,Squeeze,ImpAPTr(iap),MID,Squeeze,HotSpot,RiskLoc)

2.效果评估

目前选用模型都是业界比较经典且SOTA Score 等比较高的,从实际使用“体感”效果来看

TopN:R_Adtributor,Adtributor,ImpAPTr,AutoRoot,MID

中等:Squeeze,PSqueeze

下等:HotSpot,RiskLoc

算法大都遵循的前提条件:父子节点变化同步(假设同比例,同一致,协同变化;Ripple涟漪效应概念)

结果:

(a).粗粒度维度下RCA算法都差不多ok

(b).效果不好的RCA算法除了自身的鲁棒稳定性局限性外,数据的”好坏“质量(例如空值,NAN值,稀疏等)其实影响比较大

(c).支持算法一键上下线“可插拔”迭代替换优化

3.遗留问题

a.维度-元素的大项问题

权重“很大”项阀值控制权交由业务应用过滤slide

b.涟漪相反不一致问题

五.应用场景示例

1.效果展示图

六.未来展望

1.结合业务数据维度粒度(数据细粒度“缺失”稀疏无历史基准参考,长尾分布等不稳定)如何提高准确预测能力

2.借助“大模型”能力做归因与业务动作外部知识编排关联与因果分析推理探索

3.驾驶舱大盘业务可视化数据关联

七.参考文档

数据分析流程释疑

异常检测算法

异常检测指标系统介绍

异常根因算法

异常检测系统操作指南

来源:苏迪说科技

相关推荐