【导读】国际人工智能会议AAAI 2022论文将在全程线上举办,时间在 2 月 22 日-3 月 1 日,本届大会也将是第 36 届 AAAI 大会。大会涵盖了众多最近研究Tutorial报告,来自中国人民大学HongtengXU博士做了关于结构数据建模的进展报告,非常值得关注!
在过去的几年里,来自生物学、化学、网络科学、自然语言处理和计算机视觉的结构化数据建模机器学习方法得到了快速发展。来自于最优运输理论的最新开发工具和前沿方法,特别是基于Gromov-Wasserstein (GW)距离及其变体的模型和算法,已被证明在这些任务中特别成功。这些工作的一个令人印象深刻的特点是运用了Gromovized最优传输的新理论和计算技术,用于比较定义在具有复杂结构的空间(如图、集、核、黎曼流形和更多度量空间)上的概率分布。Gromov-Wasserstein learning (GWL)是一种新的机器学习框架,已经被证明在结构化数据建模中非常有效,但在社区中还不是很出名。在本教程中,我介绍了(i) GWL的理论基础,包括GW距离的定义、GW距离的性质及其与其他最优运输距离的联系;(ii) GW距离及其变量的计算方法,基于GW的机器学习模型和算法; (iii) GWL的创新下游应用,以及优化传输和结构化数据建模的挑战。以上内容涉及AAAI社区的几个领域,如机器学习及其应用、非凸优化、随机算法、图建模和分析。
许洪腾 准聘副教授
2017年博士毕业于佐治亚理工学院,2013年硕士毕业于上海交通大学,2010年本科毕业于天津大学。其研究方向为机器学习及其应用,主要研究基于最优传输理论和点过程模型的复杂数据分析、建模、预测、生成及控制技术、并以第一作者身份在ICML、NeurIPS、AAAI、IJCAI、CVPR、ICCV、TKDE等CCF A类会议和期刊上发表论文20余篇。
第1部分
我将首先介绍最优传输的基本理论,从Wasserstein距离、Wasserstein重心以及它们对分布匹配和平均的作用开始。除了基本理论之外,我将重点讨论定义在不可比空间上的分布之间的最优传输,相应地,我将介绍度量度量空间(mm-space)的Gromov-Wasserstein距离和相应的Gromov-Wasserstein重心,展示了它们在这种具有挑战性的场景下的可行性和合理性。此外,我将考虑具有复杂结构的度量度量空间,并为相应的结构化数据(如图(如分子、网络和网格))定义GW距离和重心。最后,我将展示GW距离对图匹配和划分的作用。
第2部分
我将详细阐述GW距离及其近年来提出的典型变体。对于经典的GW距离,我将介绍其典型的优化算法,如共轭梯度、近端梯度、Bregman ADMM等。从理论上介绍了GW距离的加速度和扩展变化,包括低阶GW距离、融合GW距离、分级GW距离、分段GW距离、不平衡GW距离等。
第3部分
在这一部分中,我将利用GW相关的距离重新制定一些现有的机器学习方法,并提出一些新的模型和算法。特别是,我们将介绍GW距离在生成建模(如耦合生成模型的GW- GAN和关系正则化的Wasserstein自动编码器)、图表示方法(如GW分解模型)和图生成(如基于GW的图估计器和图自动编码器)方面的应用。最后,我将讨论基于距离的机器学习的一些正在进行的研究和有趣的方向。