8月5日,ACM SIGKDD 2021 正式公布了最佳博士论文奖,Runner Up奖、新星奖、研究时间检验奖、应用数据科学时间检验奖、创新奖和服务奖。

其中斯坦福大学的Aditya Grover获得最佳博士论文奖,UIUC 的Shweta Jain获得Runner Up 奖

SIGKDD 博士论文奖

论文标题: Learning to Represent and Reason Under Limited Supervision 标题:在有限监督条件下的学习表征和推理 作者:Aditya Grover 机构:Facebook AI研究院

论文摘要:

自然智能体,如人类,擅长构建世界的表征,并使用这些表征来有效地进行推理和做决策。即使在有限的监督下,这种高级推理能力也可以发展起来。与此形成鲜明对比的是,基于机器学习 (ML) 的智能体在获得大规模标注数据集或模拟器的条件下取得主要进展,如目标识别和玩游戏等。

本论文由三部分组成。首先,论文建立了基础的学习概率生成模型,目标是模拟所有可用的数据,即使在监督受限的环境中,也能够为智能体提供一个自然的学习目标。论文讨论了很多使用这些模型进行高维学习和推理所需要的取舍(trade-off),包括选择特定的学习目标、优化流程和模型参数等。

基于这些结果,研究者开发了新算法来提高模型的性能,并在用未标记的数据集进行训练时降低偏置。之后,研究者将这些模型扩展到关系数据领域,用来学习这些数据的表征。这一过程是无监督的,研究者探索并展示了模型在分类和序列决策中的性能。最后,论文介绍了这些模型在加速科学研究的两个实际应用:1.学习压缩感知的数据相关先验;2.优化电池充电的实验设计。这些案例说明, 智能体能够克服现实世界中高维推理和决策问题的关键监督瓶颈。

本文分为三个主题部分。第1部分研究了概率生成建模的统计和计算基础。

在第二章,我们提供必要的背景设置的问题和回顾一些关键的工作。

在第三章中,我们讨论了生成模型的两种中心学习范式: 最大似然估计和对抗学习。

在第四章,我们提出了一个模型不可知的算法,以提高任何现有生成模型的性能。本章以[Gro+19a]为基础,以我们在[GE18]中的早期工作为基础。

在第五章中,我们提出了另一种模型无关的算法,以解决融合多个未标记数据源训练生成模型时的潜在数据集偏差问题。

第二部分深入研究了概率生成模型的使用,用于在关系域上表示和推理,其中数据点偏离了独立和同分布(i.i.d)假设。

在第六章中,我们提出了一个用于学习图节点表示的潜在变量生成模型。

在第七章中,我们提出了一种结合生成目标和对比目标的多智能体系统中智能体策略学习表示的算法。

第三部分讨论了在科学发现和可持续发展的现实世界中运应用概率方法的使用。

在第八章中,我们提出了一个生成建模框架,用于统计压缩感知中的学习获取和恢复过程。

在第九章中,我们提出了一种最优的实验设计方法,适用于设计空间大和实验时间密集的领域。作为一个案例研究,我们使用它来优化电池充电协议。

在第10章中,我们总结了本论文的主要贡献和未来的研究方向。

作者介绍:

Aditya Grover是Facebook AI核心机器学习团队的一位研究者,同时也是UCLA计算机系的一名助理教授。

Aditya的主要研究方向是用于概率建模的机器学习,无监督表征学习,以及序列决策,这些研究已用于物理学、气候变化等领域。Aditya于2020年毕业于斯坦福大学,获得博士学位,并在谷歌大脑、微软研究院、OpenAI等机构完成了实习。

https://aditya-grover.github.io/

成为VIP会员查看完整内容
29

相关内容

【哥伦比亚大学博士论文】深度概率图建模147页pdf
专知会员服务
88+阅读 · 2021年4月27日
专知会员服务
25+阅读 · 2021年1月21日
【布朗大学David Abel博士论文】强化学习抽象理论,297页pdf
【南京大学冯雯博士论文】新型深度学习模型的研究
专知会员服务
67+阅读 · 2020年12月5日
【CMU博士论文Wen Sun】强化学习的泛化性与效率,206页pdf
专知会员服务
91+阅读 · 2020年9月28日
【CVPR2019】弱监督图像分类建模
深度学习大讲堂
38+阅读 · 2019年7月25日
从 ICLR 2019 一览小样本学习最新进展!
AI科技评论
15+阅读 · 2019年6月9日
在稀疏和欠明确奖励中学习泛化
谷歌开发者
6+阅读 · 2019年3月20日
Meta-Learning 元学习:学会快速学习
GAN生成式对抗网络
20+阅读 · 2018年12月8日
AAAI 2018 五个论文奖全部揭晓,「记忆增强的蒙特卡洛树搜索」获杰出论文
北京思腾合力科技有限公司
5+阅读 · 2018年2月8日
【深度】GAN与平行视觉|王坤峰副研究员
中国科学院自动化研究所
8+阅读 · 2017年8月18日
Arxiv
0+阅读 · 2021年10月4日
Arxiv
3+阅读 · 2018年4月11日
Arxiv
3+阅读 · 2018年4月3日
Arxiv
10+阅读 · 2017年12月29日
Arxiv
3+阅读 · 2017年12月18日
Arxiv
3+阅读 · 2015年11月29日
VIP会员
相关资讯
【CVPR2019】弱监督图像分类建模
深度学习大讲堂
38+阅读 · 2019年7月25日
从 ICLR 2019 一览小样本学习最新进展!
AI科技评论
15+阅读 · 2019年6月9日
在稀疏和欠明确奖励中学习泛化
谷歌开发者
6+阅读 · 2019年3月20日
Meta-Learning 元学习:学会快速学习
GAN生成式对抗网络
20+阅读 · 2018年12月8日
AAAI 2018 五个论文奖全部揭晓,「记忆增强的蒙特卡洛树搜索」获杰出论文
北京思腾合力科技有限公司
5+阅读 · 2018年2月8日
【深度】GAN与平行视觉|王坤峰副研究员
中国科学院自动化研究所
8+阅读 · 2017年8月18日
相关论文
Arxiv
0+阅读 · 2021年10月4日
Arxiv
3+阅读 · 2018年4月11日
Arxiv
3+阅读 · 2018年4月3日
Arxiv
10+阅读 · 2017年12月29日
Arxiv
3+阅读 · 2017年12月18日
Arxiv
3+阅读 · 2015年11月29日
微信扫码咨询专知VIP会员