AAAI 2019最佳论文公布，CMU、斯坦福、MIT上榜

会员服务 ·

AAAI 2019最佳论文公布，CMU、斯坦福、MIT上榜

2019 年 1 月 28 日 新智元

新智元报道

来源：AAAI

编辑：肖琴、大明

【新智元导读】AAAI 2019今天公布最佳论文、最佳学生论文等奖项，在7745篇投稿论文、16.2%录取率的竞争下，来自以色列理工学院、CMU、斯坦福和MIT的论文分别斩获大奖，其中强化学习、零样本学习尤其受到关注。

作为2019年人工智能学界的第一个顶会，AAAI 2019已经在美国夏威夷拉开了帷幕。

今年AAAI大会主席是AI、机器人研究领域著名专家、德州大学奥斯汀分校的Peter Stone教授，南京大学周志华教授、乔治亚理工大学Pascal Van Hentenryck教授是联合程序主席。

早在大会开始前，周志华教授已经透露AAAI 2019的论文录取率：16.2%，可以说是AAAI录取率最低的一年。而且，今年的投稿数量高达7745篇，比去年翻了一番，创下AAAI历史新高！

日前，AAAI 2019 最受瞩目的各大奖项已经全部公布，包括最佳论文奖和最佳学生论文奖、经典论文奖、蓝天创意奖、杰出教育家奖、Robert S. Engelmore纪念奖，Feigenbaum 奖等。

2019 AAAI经典论文奖

2019 AAAI经典论文奖授予了2002年在加拿大举行的第18届AAAI会议最具影响力的论文：

Content-Boosted Collaborative Filtering for Improved Recommendations

作者：Prem Melville, Raymond J. Mooney, Ramadass Nagarajan

作者机构：德克萨斯大学

论文地址：

https://www.cs.utexas.edu/~ml/papers/cbcf-aaai-02.pdf

这篇论文提出一种在推荐系统中补充基于内容和协同过滤方法的方法。

论文的第一作者Prem Melville将在1月29日上午11：30进行演讲。

最佳论文奖(Outstanding Paper Award)

今年，AAAI的“Outstanding Paper Award”共提及4篇论文，其中最佳论文及提名、最佳学生论文及提名各有一篇，这些奖项将由大会程序主席Pascal Van Hentenryck和周志华在颁发。

AAAI-19 最佳论文奖

如何在强化学习中结合树搜索方法(How to Combine Tree-Search Methods in Reinforcement Learning)

作者：Yonathan Efroni, Gal Dalal, Bruno Scherrer, Shie Mannor

机构：以色列理工学院，法国国家信息与自动化研究所(INRIA)

链接：https://arxiv.org/abs/1809.01843

最佳论文提名：

Solving Imperfect-Information Games via Discounted Regret Minimization

作者：Noam Brown, Tuomas Sandholm

机构：卡内基梅隆大学(CMU)

链接：https://arxiv.org/abs/1809.04040

AAAI-19最佳学生论文奖

Zero Shot Learning for Code Education: Rubric Sampling with Deep Learning Inference

作者：Mike Wu, Milan Mosse, Noah Goodman, Chris Piech

机构：斯坦福大学

链接：https://arxiv.org/abs/1809.01357

最佳学生论文奖提名：

Learning to Teach in Cooperative Multiagent Reinforcement Learning

作者：Shayegan Omidshafiei, Dong Ki Kim, Miao Liu(刘淼), Gerald Tesauro, Matthew Riemer, Chris Amato, Murray Campbell, Jonathan How

机构：MIT、IBM、美国东北大学

链接：https://arxiv.org/abs/1805.07830

CMU、斯坦福、MIT等摘获最佳论文奖，强化学习最受关注

AAAI-19 最佳论文奖

如何在强化学习中结合树搜索方法(How to Combine Tree-Search Methods in Reinforcement Learning)

作者：Yonathan Efroni, Gal Dalal, Bruno Scherrer, Shie Mannor

机构：以色列理工学院，法国国家信息与自动化研究所(INRIA)

论文简介：

有限时域前瞻策略(Finite-horizon lookahead policies)已经在强化学习中得到广泛应用，并取得了令人印象深刻的实证成果。通常，前瞻性策略是通过特定的规划方法实现的，例如蒙特卡洛树搜索(Monte Carlo Tree Search)，AlphaZero正是应用了该方法。将规划问题视为树搜索，实现上的一种合理做法是只备份叶节点上的值，而根节点上获得的信息只用于更新策略。

在这篇论文中，作者质疑了这种方法的有效性，认为后一过程通常是非收缩的，其收敛性没有保证。

论文提出一种简单明了的增强方法：使用最优树路径的返回值来备份根节点的后代的值。为了实现结果，作者引入一个称为多步贪婪一致性(multiple-step greedy consistency)的概念。然后，在树搜索阶段和值估计阶段同时注入噪声的情况下，为上述增强方法的两个算法实例提供收敛速度。

AAAI-19最佳学生论文奖

代码教育的零样本学习：深度学习推理的量规采样(Zero Shot Learning for Code Education: Rubric Sampling with Deep Learning Inference)

作者：Mike Wu, Milan Mosse, Noah Goodman, Chris Piech

机构：斯坦福大学

论文简介：

现代计算机科学教育中，大规模开放在线课程(MOOC)记录了数千小时关于学生如何解决编码挑战的数据。由于数据丰富，这些平台吸引了机器学习社区的兴趣，许多新算法试图自动提供反馈，以帮助未来的学生学习。但对于第一批学生呢？在大多数教育环境(如教室)中，没有足够的作业历史数据来进行监督学习。

在这篇论文中，作者提出一种“human-in-the-loop”的“量规抽样”（Rubric sampling）方法来解决“零样本”反馈的挑战。结果证明，该方法能够为第一批学生的入门编程作业提供自主反馈，其准确性大大优于依赖大量数据的算法，甚至接近人类水平。

Rubric sampling只需要最少的教师工作量，能够将反馈与学生答案的特定部分联系起来，并能够用教师的语言清晰地解答学生的错误。随着更多特定于作业的学生数据可获取，深度学习推理使得Rubric sampling方法的效果能够进一步提高。作者使用Code.org(世界最大的编程教育平台)的一个新数据集证明了他们的结果。

最佳论文奖提名：

Solving Imperfect-Information Games via Discounted Regret Minimization

作者：Noam Brown, Tuomas Sandholm

机构：卡内基梅隆大学(CMU)

这篇论文的两位作者分别是CMU计算机系博士生Noam Brown，以及该校计算机系教授Tuomas Sandholm。这两位也是去年的著名的德州扑克AI程序“冷扑大师”（Libratus）的缔造者，堪称德州扑克AI之父。论文通过德州扑克基准平台来探讨不完全信息条件下的博弈策略问题。

论文简介：

反事实后悔最小化（CFR）是目前最热门一系列迭代算法，在实际应用中，也是近似解决大型不完美信息博弈问题的最快方法。在本文中，我们介绍了新的CFR变体。分别为：

1）以多种方式从先前的迭代中将后悔程度实现缩减（在某些情况下，对正向和负向后悔采用不同处理方式），

2）以多种方式对迭代进行重新加权，获得输出策略，

3）使用非标准后悔最小化和/或

4）利用“乐观后悔匹配”方式。这可以在许多环境下显著提高性能。

首先，我们在每个测试的游戏中引入一个优于CFR +（一种之前的最先进的算法）的变体，包括大规模的现实设置。 CFR +是一个强大的基准：目前没有其他算法能够超越它。最后，我们表明，与CFR +不同，许多重要的算法的新变体与现代不完美信息博弈修剪技术兼容，也与博弈树中的采样兼容。

最佳学生论文奖提名：

Learning to Teach in Cooperative Multiagent Reinforcement Learning

作者：Shayegan Omidshafiei, Dong Ki Kim, Miao Liu(刘淼), Gerald Tesauro, Matthew Riemer, Chris Amato, Murray Campbell, Jonathan How

机构：MIT、IBM、美国东北大学

集体人类知识显然因为个人创新通过交流向其他人流动这一事实而获益。与人类社会群体类似，分布式学习系统中的智能体也可能会从彼此交流中受益，实现分享知识和教授技能。先前的研究成果已经在关注改进智能体学习的教学问题，但是这些方法所基于的假设，让这些教学上的应用无法用在一般的多智能体问题上，或者还需要领域内专业知识来解决关于应用范围的问题。这种学习教学问题存在固有的复杂性，与量度教学质量和效果的长期影响密切相关，给标准化多智能体共同教学问题造成了更大的挑战。

与现有研究相比，本文提出了智能体在多智能体环境中进行教学的首个通用的框架和算法。我们的算法（LeCTR）解决了合作多智能体强化学习中的点对点教学问题。我们的方法中的每个智能体都会学习在何时何地提出建议，然后利用收到的建议来改善学习效果。重要的是，这些智能体的角色并不固定，智能体能够学会在适当的时刻承担学生和/或教师的角色，发出请求并提供建议，以提高整个团队的表现。与目前最先进的教学方法的实证比较表明，我们的教学智能体不仅学得更快，而且可以学会协调用现有方法无法完成的任务。

其他大奖：蓝天奖、Feigenbaum 纪念奖等

AAAI-19蓝天创意奖（AAAI-19 Blue Sky Idea Awards）

AAAI与计算机研究协会计算社区联盟（CCC）合作，宣布三篇获奖论文，这些论文提出了可以激发研究界追求新方向的想法和愿景，比如提出了新问题、新应用领域或新方法。获奖者分别是：

第一名：Pat Langley 获奖论文：Explainable, Normative, and Justified Agency

第二名：Francesca Rossi和Nicholas Mattei 获奖论文：Building Ethically Bounded AI

第三名： Barry Smyth，获奖论文Recommender Systems: A Healthy Obsession

2019 AAAI/EAAI杰出教育家奖

AAAI / EAAI杰出教育家奖旨在表彰为人工智能教育做出重大贡献、为人工智能社区实现长期利益的个人或团体。 2019年AAAI / EAAI杰出教育家奖颁给佐治亚理工学院的Ashok Goel，以表彰他持续卓越的教学贡献，利用AI技术来教授AI技术的创新，采用科学实验和奖学金来评估和改进AI的教学方法，以及他向整个社区分享的大量资源。该奖项由AAAI和人工智能教育进展研讨会（Symposium on Educational Advances in Artificial Intelligence）联合赞助。

2019年罗伯特·S·恩格尔莫尔纪念奖

罗伯特·S·恩格尔莫尔(Robert S. Engelmore)纪念奖由IAAI-19和AI Magazine赞助，由IAAI-19主席Karen Myers和AI Magazine主编Ashok Goel主持。该奖项于2003年设立，旨在纪念罗伯特·S·恩格尔博士为AAAI、AI杂志和AI应用社区的卓越贡献，以及他对应用AI期刊的贡献。 2019年的奖项将颁发给南加州大学的Milind Tambe团队，以表彰他们在多智能体系统领域的杰出贡献，以及在解决具有重大社会意义的问题上的应用。

Feigenbaum奖

AAAI Feigenbaum奖旨在表彰和鼓励通过计算机科学实验方法取得的杰出的AI研究进展。 2019年的AAAI Feigenbaum奖项授予加州大学伯克利分校的Stuart Russell，以表彰他通过创新和概率知识表示，推理和学习的成就对AI领域的具有广泛影响力贡献。 Feigenbaum奖由Feigenbaum Nii基金会资助。

更多阅读：