摘要:如何快速高效自动化检测异常与根因定位,减少人工参与耗时和提高工作效率,显得尤为重要。
一.背景
二.名词解释
三.数据架构流转图
四.核心要点及结论
o1.核心模块
o2.效果评估
o3.遗留问题
五.应用场景示例
o1.效果展示
六.未来展望
七.参考文档
一.背景
数据指标”异常“,为什么异常?分析什么原因导致....
老板的灵魂三问…
如何快速高效自动化检测异常与根因定位,减少人工参与耗时和提高工作效率,显得尤为重要。
使用人群:商分,运营,产品,市场等数据使用分析人员
概念拉齐:行业约定俗成的根因定位叫法,数据层定位搜索分析结果(算法无法知道”外部知识“)
完美闭环图:有因有果有应对策略动作
二.名词解释
预测值:predict,forecast
真实值:real,actual
指标:fundamental measure,derived measure
维度:dim
元素:element
异常:outlier,anomaly
归因:rca即RootCauseAnalysis
波动量化指标: 惊奇力,波动度,异常度等
权重量化指标: 解释力,贡献度,严重度等
三.数据架构流转图
四.核心要点及结论
1.核心模块
异常模块:7种算法(LOF,COF,KNN,IForest,COPOD,PCA,SOS)投票机制
预测模块:EWMA,剔除异常点的前N的中位数Median或者Avg等,预测的准确度对算法的影响
根因模块:主流算法(Adtributor,R_Adtributor,AutoRoot,PSqueeze,Squeeze,ImpAPTr(iap),MID,Squeeze,HotSpot,RiskLoc)
2.效果评估
目前选用模型都是业界比较经典且SOTA Score 等比较高的,从实际使用“体感”效果来看
TopN:R_Adtributor,Adtributor,ImpAPTr,AutoRoot,MID
中等:Squeeze,PSqueeze
下等:HotSpot,RiskLoc
算法大都遵循的前提条件:父子节点变化同步(假设同比例,同一致,协同变化;Ripple涟漪效应概念)
结果:
(a).粗粒度维度下RCA算法都差不多ok
(b).效果不好的RCA算法除了自身的鲁棒稳定性局限性外,数据的”好坏“质量(例如空值,NAN值,稀疏等)其实影响比较大
(c).支持算法一键上下线“可插拔”迭代替换优化
3.遗留问题
a.维度-元素的大项问题
权重“很大”项阀值控制权交由业务应用过滤slide
b.涟漪相反不一致问题
五.应用场景示例
1.效果展示图
六.未来展望
1.结合业务数据维度粒度(数据细粒度“缺失”稀疏无历史基准参考,长尾分布等不稳定)如何提高准确预测能力
2.借助“大模型”能力做归因与业务动作外部知识编排关联与因果分析推理探索
3.驾驶舱大盘业务可视化数据关联
七.参考文档
数据分析流程释疑
异常检测算法
异常检测指标系统介绍
异常根因算法
异常检测系统操作指南
来源:苏迪说科技