AlphaZero原理与启示 - 专知

会员服务 ·

0

AlphaZero原理与启示

2020 年 8 月 23 日 专知

近几年, 计算机围棋成功引发了又一轮的人工智能热潮, 从计算机围棋中发展出来的AlphaZero框架成功地应用在其他完全信息条件下的二人有限零和博弈问题, 进而展示出了深度学习和强化学习在智能决策领域的优异性能。本文首先介绍了AlphaZero框架中三个核心技术: 深度学习、强化学习以及蒙特卡罗树搜索, 然后详细说明了AlphaZero框架两个关键阶段——AlphaGo和AlphaGo Zero的基本原理, 最后, 对AlphaZero框架提出了自己的思考, 并基于对AlphaZero原理的剖析讨论了其对军事决策智能化的启示。

http://www.aeroweaponry.avic.com/CN/abstract/abstract10638.shtml

专知便捷查看

便捷下载，请关注专知公众号（点击上方蓝色专知关注）

后台回复“AlphaZero” 可以获取《AlphaZero原理与启示》专知下载链接索引

专知，专业可信的人工智能知识分发，让认知协作更快更好！欢迎注册登录专知www.zhuanzhi.ai，获取5000+AI主题干货知识资料！

欢迎微信扫一扫加入专知人工智能知识星球群，获取最新AI专业干货知识教程资料和与专家交流咨询！

点击“ 阅读原文 ”，了解使用专知 ，查看获取5000+AI主题知识资源

登录查看更多

6

相关内容

AlphaZero

【2020新书】软件和人工智能项目中的设计思维，157页pdf

【2020新书】软件和人工智能项目中的设计思维，157页pdf

专知会员服务

123+阅读 · 2020年8月30日

斯坦福EE364a《凸优化》课件，301页ppt

斯坦福EE364a《凸优化》课件，301页ppt

专知会员服务

99+阅读 · 2020年7月14日

【Manning2020新书】Python工作手册，249页pdf，Python 50个必要练习

【Manning2020新书】Python工作手册，249页pdf，Python 50个必要练习

专知会员服务

108+阅读 · 2020年7月9日

Fariz Darari简明《博弈论Game Theory》介绍，35页ppt

Fariz Darari简明《博弈论Game Theory》介绍，35页ppt

专知会员服务

112+阅读 · 2020年5月15日

【2020新书】《“一行”Python：如何写出精炼的Python代码》，216页pdf

【2020新书】《“一行”Python：如何写出精炼的Python代码》，216页pdf

专知会员服务

252+阅读 · 2020年4月19日

简明扼要！Python教程手册，206页pdf

简明扼要！Python教程手册，206页pdf

专知会员服务

48+阅读 · 2020年3月24日

【Manning2020新书】深度强化学习实战，351页pdf，Deep Reinforcement Learning

【Manning2020新书】深度强化学习实战，351页pdf，Deep Reinforcement Learning

专知会员服务

294+阅读 · 2020年3月10日

《深度学习》圣经花书的数学推导、原理与Python代码实现

《深度学习》圣经花书的数学推导、原理与Python代码实现

专知会员服务

325+阅读 · 2020年3月6日

【文献综述】边缘计算与深度学习的融合综述论文

【文献综述】边缘计算与深度学习的融合综述论文

专知会员服务

168+阅读 · 2019年12月26日

【强化学习】深度强化学习初学者指南

【强化学习】深度强化学习初学者指南

专知会员服务

184+阅读 · 2019年12月14日

【ICML2020-Tutorial】无标签表示学习，222页ppt，DeepMind

【ICML2020-Tutorial】无标签表示学习，222页ppt，DeepMind

专知

30+阅读 · 2020年7月14日

【Manning2020新书】深度强化学习实战，351页pdf，Deep Reinforcement Learning

【Manning2020新书】深度强化学习实战，351页pdf，Deep Reinforcement Learning

专知

43+阅读 · 2020年3月10日

【2020新书】实用Matlab深度学习 Practical MATLAB Deep Learning，260页pdf

【2020新书】实用Matlab深度学习 Practical MATLAB Deep Learning，260页pdf

专知

6+阅读 · 2020年2月13日

【南洋理工Xavier】深度强化学习，课件与代码，109页PPT

【南洋理工Xavier】深度强化学习，课件与代码，109页PPT

专知

53+阅读 · 2019年11月28日

【文章+代码】GAN不能生成什么？MIT&香港中文最新论文

【文章+代码】GAN不能生成什么？MIT&香港中文最新论文

专知

6+阅读 · 2019年11月14日

如何撰写优秀科研论文【附112页文章下载】

如何撰写优秀科研论文【附112页文章下载】

专知

38+阅读 · 2019年9月28日

IEEE Fellow 微软曾文军：解锁深度视频理解的潜力 PPT详解

IEEE Fellow 微软曾文军：解锁深度视频理解的潜力 PPT详解

专知

7+阅读 · 2018年1月5日

一张图看懂AlphaGo Zero

一张图看懂AlphaGo Zero

AI前线

6+阅读 · 2017年11月17日

公开课 | 解读Alphago Zero背后的算法

公开课 | 解读Alphago Zero背后的算法

七月在线实验室

4+阅读 · 2017年10月27日

最大熵原理（一）

最大熵原理（一）

深度学习探索

12+阅读 · 2017年8月3日

Unsupervised Constrative Person Re-identification

Unsupervised Constrative Person Re-identification

Arxiv

0+阅读 · 2020年10月15日

The Complexity of Subgame Perfect Equilibria in Quantitative Reachability Games

Arxiv

0+阅读 · 2020年10月13日

Unsupervised Keyword Extraction for Full-sentence VQA

Arxiv

0+阅读 · 2020年10月12日

Arxiv

0+阅读 · 2020年10月10日

An Application of Deep Reinforcement Learning to Algorithmic Trading

Arxiv

0+阅读 · 2020年10月9日

Scalable Many-Objective Pathfinding Benchmark Suite

Arxiv

0+阅读 · 2020年10月9日

Learning Quintuplet Loss for Large-scale Visual Geo-Localization

Arxiv

0+阅读 · 2020年10月9日

A Mathematical Introduction to Generative Adversarial Nets (GAN)

A Mathematical Introduction to Generative Adversarial Nets (GAN)

Arxiv

28+阅读 · 2020年9月1日

The Matrix Calculus You Need For Deep Learning

The Matrix Calculus You Need For Deep Learning

Arxiv

12+阅读 · 2018年7月2日

Long-Term Visual Object Tracking Benchmark

Arxiv

3+阅读 · 2018年3月22日

VIP会员

相关主题

蒙特卡罗树搜索

相关VIP内容

【2020新书】软件和人工智能项目中的设计思维，157页pdf

【2020新书】软件和人工智能项目中的设计思维，157页pdf

专知会员服务

123+阅读 · 2020年8月30日

斯坦福EE364a《凸优化》课件，301页ppt

斯坦福EE364a《凸优化》课件，301页ppt

专知会员服务

99+阅读 · 2020年7月14日

【Manning2020新书】Python工作手册，249页pdf，Python 50个必要练习

【Manning2020新书】Python工作手册，249页pdf，Python 50个必要练习

专知会员服务

108+阅读 · 2020年7月9日

Fariz Darari简明《博弈论Game Theory》介绍，35页ppt

Fariz Darari简明《博弈论Game Theory》介绍，35页ppt

专知会员服务

112+阅读 · 2020年5月15日

【2020新书】《“一行”Python：如何写出精炼的Python代码》，216页pdf

【2020新书】《“一行”Python：如何写出精炼的Python代码》，216页pdf

专知会员服务

252+阅读 · 2020年4月19日

简明扼要！Python教程手册，206页pdf

简明扼要！Python教程手册，206页pdf

专知会员服务

48+阅读 · 2020年3月24日

【Manning2020新书】深度强化学习实战，351页pdf，Deep Reinforcement Learning

【Manning2020新书】深度强化学习实战，351页pdf，Deep Reinforcement Learning

专知会员服务

294+阅读 · 2020年3月10日

《深度学习》圣经花书的数学推导、原理与Python代码实现

《深度学习》圣经花书的数学推导、原理与Python代码实现

专知会员服务

325+阅读 · 2020年3月6日

【文献综述】边缘计算与深度学习的融合综述论文

【文献综述】边缘计算与深度学习的融合综述论文

专知会员服务

168+阅读 · 2019年12月26日

【强化学习】深度强化学习初学者指南

【强化学习】深度强化学习初学者指南

专知会员服务

184+阅读 · 2019年12月14日

热门VIP内容

开通专知VIP会员享更多权益服务

隐身自主无人水下航行器技术如何变革水下作战并重塑海军竞争

《俄乌战争中的无人系统：新的战争方式与新兴趋势——来自前线的印象》报告

《海上自主水面船舶远程操作中心：安全可持续运行的多维度分析》

相关资讯

【ICML2020-Tutorial】无标签表示学习，222页ppt，DeepMind

【ICML2020-Tutorial】无标签表示学习，222页ppt，DeepMind

专知

30+阅读 · 2020年7月14日

【Manning2020新书】深度强化学习实战，351页pdf，Deep Reinforcement Learning

【Manning2020新书】深度强化学习实战，351页pdf，Deep Reinforcement Learning

专知

43+阅读 · 2020年3月10日

【2020新书】实用Matlab深度学习 Practical MATLAB Deep Learning，260页pdf

【2020新书】实用Matlab深度学习 Practical MATLAB Deep Learning，260页pdf

专知

6+阅读 · 2020年2月13日

【南洋理工Xavier】深度强化学习，课件与代码，109页PPT

【南洋理工Xavier】深度强化学习，课件与代码，109页PPT

专知

53+阅读 · 2019年11月28日

【文章+代码】GAN不能生成什么？MIT&香港中文最新论文

【文章+代码】GAN不能生成什么？MIT&香港中文最新论文

专知

6+阅读 · 2019年11月14日

如何撰写优秀科研论文【附112页文章下载】

如何撰写优秀科研论文【附112页文章下载】

专知

38+阅读 · 2019年9月28日

IEEE Fellow 微软曾文军：解锁深度视频理解的潜力 PPT详解

IEEE Fellow 微软曾文军：解锁深度视频理解的潜力 PPT详解

专知

7+阅读 · 2018年1月5日

一张图看懂AlphaGo Zero

一张图看懂AlphaGo Zero

AI前线

6+阅读 · 2017年11月17日

公开课 | 解读Alphago Zero背后的算法

公开课 | 解读Alphago Zero背后的算法

七月在线实验室

4+阅读 · 2017年10月27日

最大熵原理（一）

最大熵原理（一）

深度学习探索

12+阅读 · 2017年8月3日

相关论文

Unsupervised Constrative Person Re-identification

Unsupervised Constrative Person Re-identification

Arxiv

0+阅读 · 2020年10月15日

The Complexity of Subgame Perfect Equilibria in Quantitative Reachability Games

Arxiv

0+阅读 · 2020年10月13日

Unsupervised Keyword Extraction for Full-sentence VQA

Arxiv

0+阅读 · 2020年10月12日

Arxiv

0+阅读 · 2020年10月10日

An Application of Deep Reinforcement Learning to Algorithmic Trading

Arxiv

0+阅读 · 2020年10月9日

Scalable Many-Objective Pathfinding Benchmark Suite

Arxiv

0+阅读 · 2020年10月9日

Learning Quintuplet Loss for Large-scale Visual Geo-Localization

Arxiv

0+阅读 · 2020年10月9日

A Mathematical Introduction to Generative Adversarial Nets (GAN)

A Mathematical Introduction to Generative Adversarial Nets (GAN)

Arxiv

28+阅读 · 2020年9月1日

The Matrix Calculus You Need For Deep Learning

The Matrix Calculus You Need For Deep Learning

Arxiv

12+阅读 · 2018年7月2日

Long-Term Visual Object Tracking Benchmark

Arxiv

3+阅读 · 2018年3月22日

大家都在搜

朱克爱德华兹家族

大型语言模型

蓝牙安全攻防

【论文笔记】用于数据驱动交通预测的扩散卷积循环神经网络（DCRNN）

微信扫码咨询专知VIP会员