在过去的十年中,机器学习和大规模计算的出现极大地改变了我们处理、解释和预测成像和计算机视觉数据的方式。基于特定信号和测量结构的参数模型——例如稀疏和低秩模型——以及相关的优化工具的“传统”算法设计方法,现在通过数据驱动的学习技术显著丰富,在这些技术中,大规模网络先进行预训练,然后适应各种特定任务。然而,无论是现代数据驱动范式还是经典模型范式的成功,都依赖于正确识别现实世界数据中存在的低维结构,以至于我们看到数据处理算法的学习和压缩角色——无论是显式的还是隐式的,如深度网络——是不可分割地联系在一起的。 因此,本教程提供了一个及时的教程,独特地将低维模型与成像和视觉中的深度学习相结合。
本教程将展示如何:
- 低维模型和原理为公式化问题提供了有价值的视角,并理解现代深度模型在成像和计算机视觉中的行为;
- 低维模型的理念可以为设计新的参数高效、鲁棒和可解释的计算机视觉深度学习模型提供宝贵的指导。 我们将首先介绍基本的低维模型(例如基本的稀疏和低秩模型)及其在计算机视觉中的应用。基于这些发展,我们将讨论低维结构和深度模型之间的强概念性、算法性和理论性连接,从新的角度理解当前最先进的深度模型在学习表示、可推广性和可转移性方面的表现。最后,我们将展示这些连接如何为设计学习计算机视觉中低维结构的深度网络提供新的原则,具有清晰的可解释性和实际的好处。我们将以与来自学术界和工业界的专家研究人员的专题讨论结束,讨论低维模型在当前以大型语言模型和基础模型为中心的时代中可以和应该扮演的角色。