DeepMind高管回答：Alpha zero 的强化学习是否真的不要训练数据？

会员服务 ·

DeepMind高管回答：Alpha zero 的强化学习是否真的不要训练数据？

2018 年 1 月 24 日 全球人工智能

-欢迎加入AI技术专家社群>>

- 日薪5K-10K招兼职AI讲师>>

在MIT的达沃斯讨论会上，DeepMind 的联合创始人Mustafa Suleyman 被问到Alpha zero 的强化学习是否真的证明可以不要训练数据？除了游戏还有什么应用？

DeepMind 的联合创始人Mustafa Suleyman 非常坦诚地说：alpha zero 只是在三个前提条件成立的情况能够工作：

可预测环境（围棋规则）；
清晰奖励系统（输赢）；
无变数（variability) ；

Mustafa Suleyman还表示，他们正在探索在游戏之外的应用，但是初步预测这不会是很容易的，因为真实世界比游戏复杂很多，他预测会需要3-5年时间。

他也提到：alpha zero 本身并不能带来AI对于数据的需求，但是他觉得在数据生成和模拟上的进步（比如说用真实语音合成、人脸合成、甚至类似Grand theft auto来做自动驾驶的模拟）是有可能在未来自动产生可补充的数据。（内容来自：李开复老师朋友圈）

或点击“阅读原文”，查看详情

登录查看更多

相关内容

DeepMind

关注 2

【复旦大学-SP2020】NLP语言模型隐私泄漏风险

专知会员服务

25+阅读 · 2020年4月20日

【模型泛化教程】标签平滑与Keras, TensorFlow，和深度学习

专知会员服务

21+阅读 · 2019年12月31日

【强化学习】深度强化学习初学者指南

专知会员服务

184+阅读 · 2019年12月14日

【伯克利】机器学习中充满价值的学科转变（Value-laden Disciplinary Shifts in Machine Learning）

专知会员服务

5+阅读 · 2019年12月5日

【机器学习课程】Google机器学习速成课程

专知会员服务

170+阅读 · 2019年12月2日

万维钢：数学高手都是训练出来的

罗辑思维

4+阅读 · 2019年3月4日

李开复：听AI大佬吐槽真实的人工智能

算法与数学之美

4+阅读 · 2018年8月26日

李开复2018年达沃斯见闻(Ⅱ)：听AI大佬吐槽，真实的AI居然是这样的

创新工场

4+阅读 · 2018年1月24日

【AlphaGo Zero】AlphaGo Zero横空出世，DeepMind Nature论文解密不使用人类知识掌握围棋

产业智能官

5+阅读 · 2018年1月8日

一张图看懂AlphaGo Zero

AI前线

6+阅读 · 2017年11月17日

Data Augmentation using Pre-trained Transformer Models

Arxiv

17+阅读 · 2020年3月4日

Universal Transformers

Arxiv

5+阅读 · 2019年3月5日

Training behavior of deep neural network in frequency domain

Arxiv

4+阅读 · 2018年8月21日

Contrastive Explanations for Reinforcement Learning in terms of Expected Consequences

Arxiv

5+阅读 · 2018年7月23日

Long-Term Visual Object Tracking Benchmark

Arxiv

7+阅读 · 2017年12月28日

VIP会员