近年来,基础模型(Foundation Models) 已成为计算机视觉领域的变革性工具,凭借其强大的零样本(zero-shot)与小样本(few-shot)学习能力,在众多任务中展现出卓越的泛化性能。它们在视觉异常检测(Visual Anomaly Detection, VAD)这一关键且高风险的应用领域——涵盖医疗健康、工业检测、安全防护以及自主系统等——的融合,正不断开辟新的研究前沿与实际应用场景。 本教程旨在系统而及时地综述基础模型在视觉异常检测中的角色与作用。我们将涵盖多种视觉模态,包括 二维图像(2D images)、三维图像(3D images)与视频(videos),每一种模态均面临独特的挑战,并需要针对性的技术方案。具体而言,教程将深入探讨从数据(预)训练与提示工程(prompt engineering)到方法创新、推理策略及真实环境部署的完整技术流程。 主要议题包括:零样本与小样本学习、伪标签生成(pseudo-labeling)、异常数据生成(anomaly generation),以及视觉与语言的多模态对齐(multi-modal alignment)。 为促进对上述主题的深入与实践性理解,本教程将汇聚来自学术界与工业界的顶尖专家,通过深度的技术报告与专题讨论,为参会者提供对最新研究进展、实际应用案例及当前开放挑战的系统洞察,从而助力他们掌握这一快速演进领域的核心趋势与未来方向。 https://sites.google.com/view/iccv2025-tutorial-fm-driven-ad/home