正则最优传输理论作为一种处理和比较概率测度的通用工具,在机器学习领域受到越来越多的关注。基于熵的正则化,被称为Sinkhorn散度,在广泛的应用中被证明是成功的:作为聚类和重心估计的度量,作为领域适应中传递信息的工具,以及作为生成模型的拟合损失,仅举几例。鉴于这一成功,研究此类模型的统计和优化特性是至关重要的。这些方面有助于设计新的和有原则的范式,有助于进一步推进该领域。然而,基于熵最优输运的估计量的渐近保证问题却较少受到关注。

在这篇论文中,我们针对这些问题,集中在三个主要设置,熵最优传输已被使用:学习直方图在监督框架,重心估计和概率匹配。我们提出了第一个在有监督的情况下学习Sinkhorn损失的一致估计,有明确的超额风险界限。我们提出了一个新的Sinkhorn质心算法,处理具有可证明的全局收敛保证的任意概率分布。最后,我们用Sinkhorn散度作为损失函数来处理生成模型:我们从建模和统计的角度分析潜在分布和生成器的作用。我们提出了一种联合学习潜在分布和生成器的方法,并刻画了该估计量的泛化性质。总之,在这项工作中开发的工具有助于理解熵最优输运的理论性质及其在机器学习中的通用性。

成为VIP会员查看完整内容
35

相关内容

【ETH博士论文】贝叶斯深度学习,241页pdf
专知会员服务
121+阅读 · 2022年1月16日
专知会员服务
137+阅读 · 2021年8月12日
专知会员服务
70+阅读 · 2020年12月7日
【干货书】用于概率、统计和机器学习的Python,288页pdf
专知会员服务
280+阅读 · 2020年6月3日
【经典书】机器学习高斯过程,266页pdf
专知会员服务
192+阅读 · 2020年5月2日
【新书】多元统计与机器学习,185页pdf
专知
5+阅读 · 2022年6月5日
机器学习著名定理之—No Free Lunch定理详解
PaperWeekly
0+阅读 · 2022年3月4日
【ETH博士论文】贝叶斯深度学习,241页pdf
专知
9+阅读 · 2022年1月16日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
3+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2008年12月31日
Arxiv
12+阅读 · 2018年1月12日
VIP会员
相关VIP内容
【ETH博士论文】贝叶斯深度学习,241页pdf
专知会员服务
121+阅读 · 2022年1月16日
专知会员服务
137+阅读 · 2021年8月12日
专知会员服务
70+阅读 · 2020年12月7日
【干货书】用于概率、统计和机器学习的Python,288页pdf
专知会员服务
280+阅读 · 2020年6月3日
【经典书】机器学习高斯过程,266页pdf
专知会员服务
192+阅读 · 2020年5月2日
相关基金
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
3+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2008年12月31日
微信扫码咨询专知VIP会员