在工业生产和质量控制领域,异常检测技术是确保生产流程稳定、产品质量可靠的关键环节。传统异常检测方法依赖大量正常样本进行训练,然而,在保护用户数据隐私或应用于新生产线时,这种方法存在局限性。因此,零样本异常检测技术应运而生,旨在无需目标类别训练数据的情况下,直接进行高效异常检测。
近期,由中科视语和中国科学院自动化研究所合作开发的FiLo方法,以其在异常检测和定位方面的显著性能提升,成为了业界关注焦点。该方法在零样本异常检测工业场景中展现出了最佳性能,标志着异常检测技术的又一重大突破。
FiLo方法的核心在于其独特的细粒度描述和高质量定位模块设计,分别称为FG-Des(自适应学习的细粒度描述模块)和HQ-Loc(位置增强的高质量定位模块)。这些模块协同工作,有效解决了现有零样本异常检测方法在检测准确性及定位精度上的挑战。
FG-Des模块:通过利用大语言模型(LLMs)的强大知识生成每个物体类别可能出现的细粒度异常类型,并采用自适应学习的文本模板替代传统的手工编写描述,从而增强了异常检测的准确性和解释性。
HQ-Loc模块:利用Grounding DINO进行初步定位,并通过位置增强的文本提示和多尺度、多形状的跨模态交互模块(MMCI)精准定位不同大小和形状的异常,显著提高了定位精度。
结合FG-Des和HQ-Loc两大模块的FiLo方法,通过大语言模型生成的细粒度异常描述与Grounding DINO初步定位结果相结合,再通过MMCI模块进行多尺度交互,实现了异常检测的高效准确性和定位的高精度,显著提升了整体性能。
在MVTec-AD和VisA两个工业异常检测数据集上,FiLo方法表现出超越现有零样本异常检测方法的最优性能。实验结果表明,FiLo不仅能够准确识别异常,还能提供具体的异常类型信息,增强模型决策的可信度和可解释性。
FiLo研究团队已经将这一创新成果提交至人工智能和多媒体领域的顶级会议ACM MM 2024,并在Arxiv上发布了预印版论文,同时公开了相关代码,为学术界和工业界提供了宝贵的资源和技术支持。
展望未来,研究团队指出,现有异常检测技术更多关注异常的存在与否,而FiLo方法的成功应用启发了后续研究进一步增强对具体异常类型的判断能力,这将极大地提升异常检测技术的实用性和可信度,为工业生产和质量控制带来更多可能性。