CMU德扑AI真是大奖拿到手软，Noam Brown获AAAI/ACM SIGAI博士论文奖

2022 年 2 月 28 日 机器之心

机器之心报道

编辑：蛋酱、泽南

AAAI 2022 大会即将落下帷幕，目前所有奖项均已公布。

近日，第 36 届 AAAI 人工智能会议正在线上召开。在公布了杰出论文奖、杰出学生论文奖、Distinguished 论文奖、最佳演示奖等多项论文奖之后，AAAI 官方又公布了新一届的 AAAI/ACM SIGAI 博士论文奖、经典论文奖、Robert S. Engelmore 纪念演讲奖和杰出服务奖等多个奖项。

德扑 AI 作者 Noam Brown 获 AAAI/ACM SIGAI 博士论文奖

AAAI/ACM SIGAI 博士论文奖由 AAAI 和 ACM SIGAI 共同设立，旨在发现和鼓励人工智能领域的优秀博士研究和论文。这是一个年度奖项，将出现在一年一度的 AAAI 会议上，获奖者将在会议上做演讲。第一届奖项由吴佳俊获得。

第二届的 2020 年 AAAI/ACM SIGAI 博士学位论文奖由 Meta AI（原 FAIR）科学家 Noam Brown 摘得，获奖理由是「在大型对抗性不完全信息博弈均衡求解方面的工作」。

2020 年 9 月，Noam Brown 宣布完成 CMU 博士论文答辩，并公开了长达 230 页的超硬核博士论文《大型对抗性不完美信息博弈的均衡发现》。

在博士学位论文中，Noam Brown 详述了大型对抗性不完美信息博弈中均衡计算的一系列进展。这些新技术使得 AI 智能体首次有可能在无限注扑克游戏中击败顶级职业玩家，而这正是几十年来 AI 和博弈论领域一直存在的重大挑战性难题。

Noam Brown 致力于结合计算博弈论和机器学习来开发能够在不完美信息多智能体环境中进行策略推理的 AI 系统，其研究成果应用到了首个分别在在双人无限扑克和多人无限扑克中战胜人类顶级玩家的 Libratus 和 Pluribus。这两个游戏 AI 系统为 Noam Brown 带来了巨大的关注度。

2017 年，Noam Brown 与其导师 Tuomas Sandholm 开发的 AI 系统 Libratus 在宾夕法尼亚州匹兹堡 Rivers 赌场持续 20 天 1 对 1 无限制德扑比赛中成功战胜了 4 名全球顶级职业玩家。该研究登上了《Science》杂志，与研究相关的另一篇论文《Safe and Nested Subgame Solving for Imperfect-Information Games》也获得了 NIPS 2017 最佳论文奖。Noam 团队还因此获得了 IJCAI 颁发的第二枚马文 · 明斯基奖章（Marvin Minsky Medal）。

此外，Noam 还曾获得 2017 年度 Allen Newell「卓越研究奖」，也曾被 MIT 科技评论评选为 2019 年度「35 岁以下科技精英」（MIT TR35）。2019 年，Noam Brown 与其导师 Tuomas Sandholm 合著的论文《Solving Imperfect-Information Games via Discounted Regret Minimization》获得了 AAAI 杰出论文荣誉提名奖。2021 年，他的博士论文还获得 2020 IFAAMAS Victor Lesser Distinguished Dissertation Award。

在 CMU 获得博士学位之后，Noam Brown 现在是 Facebook 人工智能研究中心的研究科学家，致力于多智能体人工智能的研究。

AAI/ACM SIGAI 博士论文奖提名

获奖论文 1：Building agents that can see, talk, and act

论文链接：https://smartech.gatech.edu/handle/1853/62768

AI 的长期发展目标是构建通用智能体，同时拥有感知周围丰富的视觉环境（通过视觉、听觉或其他传感器）、以可解释和可操作的方式从感知中推理和推断、将这种理解传达给人类和其他智能体（例如，在环境中进行自然语言对话）、并在物理世界中根据这种理解采取行动（例如，通过在具体环境中执行命令来帮助人类）的能力。

为了在这一方向上取得进展，我们必须探索新的多模态人工智能任务，从数据集转移到物理环境，并建立新的模型。在这篇论文中，作者结合了计算机视觉、语言理解、强化学习等不同领域的见解，提出了将视觉和语言的基础领域与这些通用智能体的行动连接起来的步骤。

在第 1 部分，他们介绍了自己开发的能看、能说（就图像进行自由形式的对话）的智能体，以及通过自我博弈方式训练这些视觉对话智能体的强化学习算法。

在第 2 部分，他们将重点扩展到能看、能说、能行动的智能体，即能够在部分可观察的模拟环境中主动感知和导航，以完成诸如回答问题之类的任务的具身智能体。

在第 3 部分，他们设计了一些技术来训练可以相互交流的多个智能体，以协调、策划和利用它们在物理世界中的综合感官体验和行为。这些智能体完全依靠来自下游的奖励，在没有任何通信监督的情况下学习发送何种消息以及与谁通信。

最后，在第 4 部分，他们使用问答作为 task-agnostic probe，来询问一个自监督的具身智能体关于物理世界的了解程度，并使用它来量化智能体在接受不同辅助目标训练时形成的视觉表征的差异。

个人主页：https://abhishekdas.com/

本文作者 Abhishek Das 博士毕业于佐治亚理工学院，现在是 Meta 基础人工智能研究实验室（FAIR）的一名研究科学家，研究深度神经网络及其在气候变化中的应用。他目前的研究重点用 AI 方法寻找用于可再生能源存储的电催化剂。

这是佐治亚理工学院近年来获得的第二个此类奖项。2019 年的奖项提名是该校的 Aishwarya Agrawal。Das 和 Agrawal 的导师都是该校交互计算学院教授 Dhruv Batra。

获奖论文 2：A Theory of Abstraction in Reinforcement Learning.

论文链接：https://david-abel.github.io/thesis.pdf

强化学习定义了学习仅通过行动和观察做出好的决策的智能体所面临的问题。要成为有效的问题解决者，这些智能体必须有效地探索广阔的世界，从延迟的反馈中获得 credit，并归纳出新的经验，同时利用有限的数据、计算资源和感知带宽。抽象（abstraction）对于所有这些努力都是必不可少的。通过抽象，智能体可以搭建起关于其环境的简洁模型，这些模型支持一个合理的、适应性强的决策者所需的许多实践。

在这篇论文中，作者提出了一个强化学习中的抽象理论。具体来说，他首先提供了实现抽象过程的函数的三个要求。它们应该：1）保持接近最佳行为的表示；2 该被有效地学习和构造；3）减少规划或学习时间。

接下来，他提出了一套新的算法和分析结果，阐明了智能体如何能够根据这些需求学习抽象。

总的来说，这些结果提供了发现和使用抽象的部分路径，最小化了有效强化学习的复杂性。

个人主页：https://david-abel.github.io/

本文作者 David Abel 博士毕业于布朗大学，现为 DeepMind 的研究科学家。他通常研究强化学习问题，致力于从计算学习理论、计算复杂性和分析哲学中汲取工具和观点。

经典论文奖

AAAI 2022 经典论文奖颁发给了 2006 年的大会论文《Winning the DARPA grand challenge with an AI robot》作者 Michael Montemerlo、Sebastian Thrun、Hendrik Dahlkamp、David Stavens、Sven Strohband 等人。

论文链接：https://ai.stanford.edu/~dstavens/aaai06/montemerlo_etal_aaai06.pdf

该论文描述了 Stanley 软件架构，这是一种无人驾驶陆地车辆，专为高速沙漠驾驶而开发。该架构自动驾驶车赢得了大型机器人竞赛 DARPA 大挑战赛。

新一届 AAAI Fellow

每年，AAAI 都会将一批为人工智能领域做出重大、持续贡献的会员晋升为该组织会士（Fellow）。入选 Fellow 的人通常需要在该领域做出十年或更长时间贡献，因个人技术研究或为 AAAI 提供重要的扩展服务而获得认可。

今年的新 Fellow 已在本月中旬公布，包括：

美国德克萨斯大学奥斯汀分校教授 Inderjit Dhillon，表彰其对机器学习和大规模数据分析做出的贡献。

香港科技大学计算机科学教授冯雁（Pascale Fung），表彰她在对话式 AI 领域以及道德 AI 伦理和算法的发展方面做出的贡献。

美国南加州大学教授 Kristina Lerman，表彰其在网络科学领域和人工智能在计算社会科学中的应用做出的贡献。

爱尔兰科克大学教授 Barry O'Sullivan，表彰其对约束规划的重大贡献和在 AI 社区的杰出领导。

美国田纳西大学教授，白宫科技政策办公室主任 Lynne E. Parker，表彰其在分布式机器人技术方面的开创性研究，和在人工智能政策方面的杰出领导。

美国杜克大学教授 Cynthia Rudin，表彰其在可解释机器学习和可信赖的 AI 方面的开创性工作。

DeepMind 首席科学家、英国伦敦大学学院教授 David Silver，表彰其对机器学习、博弈论以及深度学习在游戏中的应用做出了重大贡献。

澳大利亚新南威尔士大学教授 Mary-Anne Williams，表彰其知识表示和人机交互做出了重大贡献，并在社区中发挥了领导作用。

索尼 AI 负责人 Peter Wurman，表彰其对计算拍卖理论、多智能体系统以及机器人技术关键应用做出的重大贡献。

Sea AI Lab（SAIL）负责人、前依图科技 CTO 颜水成，表彰其为深度学习架构和计算机视觉做出了重大贡献。

吴恩达获 2022 AAAI Robert S. Engelmore 纪念演讲奖

Robert S. Engelmore 纪念奖由 IAAI-20 和 AI Magzine 组织赞助。这一奖项设立于 2003 年，用来纪念恩格尔莫尔博士对 AAAI、AI Magzine 和整个社区的贡献。

今年的纪念奖由斯坦福大学教授、Landing.AI 创始人吴恩达获得，他在 AAAI 大会上进行了演讲，主题为以数据为中心的人工智能（DCAI）。

AAAI 杰出服务奖

AAAI 杰出服务奖每年表彰一个为 AI 社区提供卓越服务的人，包括但不限于：提供社会服务、编辑服务、会议组织、在其他组织（如 CRA、ACM 或 IEEE）中代表 AI 领域，作为政府机构合同监督员，或在有影响力的服务项目，对人工智能领域产生积极影响。获奖者将获得 1000 美元。

今年的获奖者为俄勒冈州立大学计算机科学系的名誉教授、机器学习领域的先驱之一 Thomas Dietterich，表彰他通过担任 AAAI 主席和国际机器学习协会主席等职务对人工智能领域的贡献。

包括 Yann Lecun、李飞飞在内的多位 AI 学者也对此表示了祝贺：

Thomas G. Dietterich 的研究贡献包括纠错输出编码在多类分类中的应用、多实例问题的形式化、分层强化学习的 MAXQ 框架以及将非参数回归树集成到概率图模型中的方法的开发（包括条件随机场和潜在变量模型）。其著作包括《人工智能手册》第 XIV 章（学习和归纳推理）、《机器学习阅读》一书（与 Jude Shavlik 合编）以及有名的评论文章《机器学习研究：机器学习中的四个方向和集成方法》。Thomas G. Dietterich 还入选了 ACM Fellow、AAAI Fellow 和 AAAS Fellow。

在大会上，AAAI 还公布了其他一些奖项的结果。AAAI Squirrel AI Award 旨在表彰人工智能技术推动人类生活、社会进步的研究者，奖金高达 100 万美元，以及参加会议的差旅费用。今年该奖颁发给了杜克大学的可解释机器学习研究者 Cynthia Rudin 教授。

参考内容：

https://aaai.org/Conferences/AAAI-22/invited-speakers/