摘要:工业检测和医疗筛查等领域对异常检测技术的需求日益增长,而现有方法通常依赖于将测试图像与训练集中学习到的正常模式进行比较,这在面对外观和位置变化时容易导致对齐问题,影响检测准确性。
工业检测和医疗筛查等领域对异常检测技术的需求日益增长,而现有方法通常依赖于将测试图像与训练集中学习到的正常模式进行比较,这在面对外观和位置变化时容易导致对齐问题,影响检测准确性。
为解决这一难题,来自清华大学和华中科技大学的研究团队提出了一种全新的方法 ——INP-Former,它能够从单张测试图像中提取内在正常原型(INPs),并利用这些 INPs 指导图像重建,通过重建误差实现异常检测。这项研究由清华大学精密仪器系的罗威、姚海明、张效天和楼家楠,以及华中科技大学机械科学与工程学院的曹云康、程育奇、沈卫明和余文勇等人共同完成。相关代码已开源,可供研究者进一步探索和应用。
论文标题:Exploring Intrinsic Normal Prototypes within a Single Image for Universal Anomaly Detection
论文地址:https://arxiv.org/pdf/2503.02424
项目地址:https://github.com/luow23
INP-Former 在多个数据集上进行了全面实验,展现出卓越性能:
MVTec-AD 数据集:图像级指标达到 99.7/99.9/99.2,像素级指标达到 98.5/71.0/69.7/94.9,显著优于现有方法。VisA 数据集:图像级指标达到 98.9/99.0/96.6,像素级指标达到 98.9/51.2/54.7/94.4,取得最佳或第二佳成绩。Real-IAD 数据集:图像级指标达到 90.5/88.1/81.5,像素级指标达到 99.0/47.5/50.3/95.0,刷新了该数据集上的检测记录。此外,INP-Former 在少样本和单类别异常检测任务中同样表现出色,并展现出一定的零样本检测能力。
我们首先验证了INP-Former各个组件的有效性。通过在MVTec-AD和VisA数据集上的实验,我们发现:
INP提取器和INP指导解码器: 引入INP提取器和INP指导解码器后,模型性能显著提升。这是因为INP提取器能够从测试图像中动态提取与异常区域具有相同几何上下文和外观的正常区域作为INPs,为后续的特征重建提供了关键信息。
INP相干性损失(Lc): Lc的加入进一步提升了模型性能。它确保提取的INPs能够一致地表示正常模式,避免捕获异常信息,为异常特征的抑制奠定了坚实基础。
软挖掘损失(Lsm):Lsm的引入使模型能够更加关注难以优化的样本,从而进一步提升整体性能。
我们研究了不同数量的INPs(M)对模型性能的影响。实验结果表明,当M超过4时,模型性能趋于稳定。然而,如果M过大,可能会引入异常信息,导致性能略有下降。在我们的研究中,将M设置为6,既能保证性能,又能有效避免异常信息的干扰。
INP-Former 的提出为异常检测领域开辟了新方向。未来,研究团队计划进一步优化 INP 提取和利用方式,结合更多先验知识和上下文信息,提升模型对复杂异常模式的检测能力,推动异常检测技术在更多领域的广泛应用。
来源:极市平台