UCL多智能体机器学习课程上线，计算机系教授汪军主讲 - 专知

会员服务 ·

0

UCL多智能体机器学习课程上线，计算机系教授汪军主讲

2021 年 3 月 3 日 机器之心

人工智能已经在围棋、图像识别和语音识别等领域达到甚至超越了人类专家水平，但智能化的机器离我们仍然很远。要想实现通用智能，AI智能体必须学习如何在共享环境中与「他人」进行互动，由此便产生了人工智能的一个前沿研究领域：多智能体学习。

多智能体学习的问题存在于多个领域。在这些问题中，多个智能体不仅与环境相互作用，而且彼此互动，由此造成的复杂和多变性为研究带来了诸多挑战。此外，多智能体学习在现实生活中有着广泛的应用，比如无人机群的控制、仓库机器人的合作、分布式传感器网络/交通的优化、机器竞标等。

如何了解这一前沿领域？

最近，UCL课程《多智能体机器学习（2021）》上线机器之心知识商店，主讲人为伦敦大学学院（UCL）计算机系教授汪军，适合计算机科学以及机械和航空工程等专业的本科生、研究生，从事机器学习、多智能体协同控制等领域的工程技术人员。

课程观看地址： https://app6ca5octe2206.pc.xiaoe-tech.com/detail/p_603db816e4b0a77c389892d3/6

本课程基于伦敦大学学院计算机系2020-2021学年度课程Multi-agent Artificial Intelligence (20/21)，主要介绍多智能体机器学习。课程将机器学习的研究与博弈论和经济学研究相结合，包括博弈论、拍卖理论、算法机制设计、多智能体（深度）强化学习等主题，同时还将讨论相关的实际应用，包括在线广告、在线拍卖、生成模型的对抗训练、机器人规划，以及玩在线游戏的智能体。

本课程由RLChina（微信公众号：RLCN）制作，RLChina是由国内外强化学习学者联合发起的民间学术组织，主要活动包括举办强化学习线上公开课、强化学习线上研讨会等，旨在搭建强化学习学术界、产业界和广大爱好者之间的桥梁。

课程为英文授课，与UCL授课进度同步，每周五更新，如有变化以课程交流群中通知为准。

讲师简介

汪军，伦敦大学学院计算机系教授，阿兰·图灵研究所 Turing Fellow，华为诺亚方舟实验室决策推理首席顾问。主要研究智能信息系统，包括机器学习、强化学习、多智能体、数据挖掘、计算广告学、推荐系统等。汪军教授目前已发表 120 多篇学术论文，出版两本学术专著，并多次获得最佳论文奖。

课程目录

一、博弈论基础介绍

1.1 博弈论的基本概念

1.2 纯策略纳什均衡

1.3 混合策略纳什均衡

1.4 纳什均衡的存在性证明

1.5 古诺双寡头模型

二、更多博弈形式

2.1 位势博弈（Potential Game）

2.2 扩展形式的博弈(Extensive-form game)

2.3 重复博弈（Repeated Games）

三、纳什均衡

3.1 零和博弈及纳什均衡计算

3.2 极大极小博弈（Minmax Game）介绍

3.3 纳什均衡的线性规划解法

3.4 线性互补问题

3.5 Lemke–Howson 算法求解线性互补问题

四、贝叶斯博弈与拍卖理论

4.1 贝叶斯博弈（Bayesian Game）

4.2 在线拍卖的设置与步骤

4.3 拍卖模式：一口价拍卖与密封式拍卖

4.4 竞价策略与纳什均衡

五、神经网络与深度学习

5.1 深度学习基础

5.2 词嵌入

5.3 深度神经网络层

5.4 卷积神经网络

5.5 循环神经网络
5.6 网络信息检索

5.7 表征学习

5.8 深度强化学习

六、基于值函数的单智能体强化学习

6.1 强化学习基础

6.2 Model-based 方法：马尔科夫决策过程，动态规划求解

6.3 Model-free方法：蒙特卡洛，时序差分，Q-learning

6.4 深度强化学习实例：Atari，Alpha Go

七、多智能体强化学习（一）

7.1 多智能体强化学习介绍及基本概念

7.2 值迭代与策略迭代

7.3 均衡学习：纳什-Q，Minmax-Q，Friend-Foe-Q

7.4 最佳对策：JAL与对手建模，梯度提升，Wolf-IGA

八、基于策略的单智能体强化学习

8.1 策略梯度

8.2 策略梯度理论证明

8.3 函数近似

九、多智能体强化学习（二）

9.1 策略预测的IGA

9.2 动态系统的梯度提升优化

9.3 虚拟博弈

9.4 理性学习

9.5 演化博弈论

9.6 复制动态方程

十、多智能体强化学习（三）

10.1 Emergent behaviours

10.2 智能体建模

10.3 多智能体通信

10.4 多智能体合作

10.5 Many-agent 学习

课程交流群

欢迎大家加入课程交流群，共同学习讨论。我们也将在群中第一时间发布更新通知。

如群已超出人数限制，添加机器之心小助手：syncedai5、syncedai4或syncedai3，备注「UCL」即可加入。

点击「阅读原文」，即刻开始学习。

登录查看更多

4

相关内容

多智能体

【斯坦福大学】可信任机器学习课程，附课件

专知会员服务

47+阅读 · 2021年5月13日

不可错过！北大「人工智能」课程，林作铨教授主讲，附讲义

专知会员服务

82+阅读 · 2021年3月26日

UC伯克利最新深度学习课程上线，强化学习大牛Sergey Levine授课（B站可看）

专知会员服务

33+阅读 · 2021年3月21日

最新《计算控制理论》笔记与课程，60页pdf

专知会员服务

53+阅读 · 2020年12月24日

【康奈尔】最新《强化学习基础》CS 6789课程

【康奈尔】最新《强化学习基础》CS 6789课程

专知会员服务

69+阅读 · 2020年9月27日

不可错过！UIUC最新《统计强化学习》课程！

专知会员服务

53+阅读 · 2020年9月7日

【硬核课】CMU《多模态机器学习》2020课程，附课件与视频

【硬核课】CMU《多模态机器学习》2020课程，附课件与视频

专知会员服务

138+阅读 · 2020年9月3日

【哥伦比亚大学】经济AI优化课程，Economics, AI, and Optimization

【哥伦比亚大学】经济AI优化课程，Economics, AI, and Optimization

专知会员服务

53+阅读 · 2020年2月15日

【课程推荐】人工智能导论：Introduction to Articial Intelligence

【课程推荐】人工智能导论：Introduction to Articial Intelligence

专知会员服务

103+阅读 · 2019年12月20日

【CMU】机器学习导论课程（Introduction to Machine Learning）

【CMU】机器学习导论课程（Introduction to Machine Learning）

专知会员服务

61+阅读 · 2019年8月26日

【中文公益公开课】RLChina2020强化学习夏令营，国内外强化学习最强阵容亲自授课。

【中文公益公开课】RLChina2020强化学习夏令营，国内外强化学习最强阵容亲自授课。

深度强化学习实验室

9+阅读 · 2020年7月13日

B站学强化学习？港中文周博磊变身up主，中文课程已上线

B站学强化学习？港中文周博磊变身up主，中文课程已上线

机器之心

18+阅读 · 2020年3月18日

独家 | 强化学习必看！UC 伯克利 CS 285 双语字幕课程今日正式上线

独家 | 强化学习必看！UC 伯克利 CS 285 双语字幕课程今日正式上线

AI科技评论

5+阅读 · 2019年12月23日

UC伯克利最新深度强化学习课程上线，视频已上传到B站

UC伯克利最新深度强化学习课程上线，视频已上传到B站

量子位

6+阅读 · 2019年10月2日

中文课程！台大李宏毅机器学习公开课2019版上线

中文课程！台大李宏毅机器学习公开课2019版上线

全球人工智能

14+阅读 · 2019年3月18日

DeepMind高赞课程：24小时看完深度强化学习最新进展（视频）

DeepMind高赞课程：24小时看完深度强化学习最新进展（视频）

新智元

14+阅读 · 2018年11月24日

为什么强化学习会成为当下机器学习最火的研究领域？

为什么强化学习会成为当下机器学习最火的研究领域？

机器学习算法与Python学习

6+阅读 · 2018年6月15日

资源 | 台大李宏毅教授最新课程，深度强化学习有国语版啦！

资源 | 台大李宏毅教授最新课程，深度强化学习有国语版啦！

大数据文摘

20+阅读 · 2018年6月13日

资源 | UC Berkeley CS 294深度强化学习课程（附视频、学习资料）

资源 | UC Berkeley CS 294深度强化学习课程（附视频、学习资料）

数据派THU

21+阅读 · 2018年4月7日

吴恩达机器学习课程

吴恩达机器学习课程

平均机器

9+阅读 · 2018年2月5日

Compiling With Classical Connectives

Arxiv

0+阅读 · 2021年6月9日

Widening Access to Applied Machine Learning with TinyML

Widening Access to Applied Machine Learning with TinyML

Arxiv

0+阅读 · 2021年6月9日

A Modest Pareto Optimisation Analysis of Dependency Parsers in 2021

Arxiv

0+阅读 · 2021年6月9日

Causal Curiosity: RL Agents Discovering Self-supervised Experiments for Causal Representation Learning

Arxiv

1+阅读 · 2021年6月9日

Curriculum Design for Teaching via Demonstrations: Theory and Applications

Arxiv

0+阅读 · 2021年6月8日

Causality in Neural Networks -- An Extended Abstract

Arxiv

0+阅读 · 2021年6月3日

Privacy and Robustness in Federated Learning: Attacks and Defenses

Arxiv

35+阅读 · 2020年12月7日

Accelerated Methods for Deep Reinforcement Learning

Accelerated Methods for Deep Reinforcement Learning

Arxiv

6+阅读 · 2019年1月10日

Mobile big data analysis with machine learning

Mobile big data analysis with machine learning

Arxiv

6+阅读 · 2018年8月2日

Feasibility Based Large Margin Nearest Neighbor Metric Learning

Arxiv

3+阅读 · 2018年5月2日

VIP会员

相关主题

多智能体学习

相关VIP内容

【斯坦福大学】可信任机器学习课程，附课件

专知会员服务

47+阅读 · 2021年5月13日

不可错过！北大「人工智能」课程，林作铨教授主讲，附讲义

专知会员服务

82+阅读 · 2021年3月26日

UC伯克利最新深度学习课程上线，强化学习大牛Sergey Levine授课（B站可看）

专知会员服务

33+阅读 · 2021年3月21日

最新《计算控制理论》笔记与课程，60页pdf

专知会员服务

53+阅读 · 2020年12月24日

【康奈尔】最新《强化学习基础》CS 6789课程

【康奈尔】最新《强化学习基础》CS 6789课程

专知会员服务

69+阅读 · 2020年9月27日

不可错过！UIUC最新《统计强化学习》课程！

专知会员服务

53+阅读 · 2020年9月7日

【硬核课】CMU《多模态机器学习》2020课程，附课件与视频

【硬核课】CMU《多模态机器学习》2020课程，附课件与视频

专知会员服务

138+阅读 · 2020年9月3日

【哥伦比亚大学】经济AI优化课程，Economics, AI, and Optimization

【哥伦比亚大学】经济AI优化课程，Economics, AI, and Optimization

专知会员服务

53+阅读 · 2020年2月15日

【课程推荐】人工智能导论：Introduction to Articial Intelligence

【课程推荐】人工智能导论：Introduction to Articial Intelligence

专知会员服务

103+阅读 · 2019年12月20日

【CMU】机器学习导论课程（Introduction to Machine Learning）

【CMU】机器学习导论课程（Introduction to Machine Learning）

专知会员服务

61+阅读 · 2019年8月26日

热门VIP内容

开通专知VIP会员享更多权益服务

《美空军条令出版物：战略打击》最新条令

《高能激光武器》22页slides

军事前沿模型

《面向小型无人机或无人飞行器的创新雷达探测与人工智能分类技术》263页

相关资讯

【中文公益公开课】RLChina2020强化学习夏令营，国内外强化学习最强阵容亲自授课。

【中文公益公开课】RLChina2020强化学习夏令营，国内外强化学习最强阵容亲自授课。

深度强化学习实验室

9+阅读 · 2020年7月13日

B站学强化学习？港中文周博磊变身up主，中文课程已上线

B站学强化学习？港中文周博磊变身up主，中文课程已上线

机器之心

18+阅读 · 2020年3月18日

独家 | 强化学习必看！UC 伯克利 CS 285 双语字幕课程今日正式上线

独家 | 强化学习必看！UC 伯克利 CS 285 双语字幕课程今日正式上线

AI科技评论

5+阅读 · 2019年12月23日

UC伯克利最新深度强化学习课程上线，视频已上传到B站

UC伯克利最新深度强化学习课程上线，视频已上传到B站

量子位

6+阅读 · 2019年10月2日

中文课程！台大李宏毅机器学习公开课2019版上线

中文课程！台大李宏毅机器学习公开课2019版上线

全球人工智能

14+阅读 · 2019年3月18日

DeepMind高赞课程：24小时看完深度强化学习最新进展（视频）

DeepMind高赞课程：24小时看完深度强化学习最新进展（视频）

新智元

14+阅读 · 2018年11月24日

为什么强化学习会成为当下机器学习最火的研究领域？

为什么强化学习会成为当下机器学习最火的研究领域？

机器学习算法与Python学习

6+阅读 · 2018年6月15日

资源 | 台大李宏毅教授最新课程，深度强化学习有国语版啦！

资源 | 台大李宏毅教授最新课程，深度强化学习有国语版啦！

大数据文摘

20+阅读 · 2018年6月13日

资源 | UC Berkeley CS 294深度强化学习课程（附视频、学习资料）

资源 | UC Berkeley CS 294深度强化学习课程（附视频、学习资料）

数据派THU

21+阅读 · 2018年4月7日

吴恩达机器学习课程

吴恩达机器学习课程

平均机器

9+阅读 · 2018年2月5日

相关论文

Compiling With Classical Connectives

Arxiv

0+阅读 · 2021年6月9日

Widening Access to Applied Machine Learning with TinyML

Widening Access to Applied Machine Learning with TinyML

Arxiv

0+阅读 · 2021年6月9日

A Modest Pareto Optimisation Analysis of Dependency Parsers in 2021

Arxiv

0+阅读 · 2021年6月9日

Causal Curiosity: RL Agents Discovering Self-supervised Experiments for Causal Representation Learning

Arxiv

1+阅读 · 2021年6月9日

Curriculum Design for Teaching via Demonstrations: Theory and Applications

Arxiv

0+阅读 · 2021年6月8日

Causality in Neural Networks -- An Extended Abstract

Arxiv

0+阅读 · 2021年6月3日

Privacy and Robustness in Federated Learning: Attacks and Defenses

Arxiv

35+阅读 · 2020年12月7日

Accelerated Methods for Deep Reinforcement Learning

Accelerated Methods for Deep Reinforcement Learning

Arxiv

6+阅读 · 2019年1月10日

Mobile big data analysis with machine learning

Mobile big data analysis with machine learning

Arxiv

6+阅读 · 2018年8月2日

Feasibility Based Large Margin Nearest Neighbor Metric Learning

Arxiv

3+阅读 · 2018年5月2日

大家都在搜

久别重逢话双塔

大型语言模型

软件无线电

国防科技创新

论文浅尝 - ICLR2020 | 通过神经逻辑归纳学习有效地解释

微信扫码咨询专知VIP会员