DeepMind高管回答:Alpha zero 的强化学习是否真的不要训练数据?

2018 年 1 月 24 日 全球人工智能

-欢迎加入AI技术专家社群>>

- 日薪5K-10K招兼职AI讲师>>

在MIT的达沃斯讨论会上,DeepMind 的联合创始人Mustafa Suleyman 被问到Alpha zero 的强化学习是否真的证明可以不要训练数据?除了游戏还有什么应用?

DeepMind 的联合创始人Mustafa Suleyman 非常坦诚地说:alpha zero 只是在三个前提条件成立的情况能够工作:

  1. 可预测环境(围棋规则);

  2. 清晰奖励系统(输赢);

  3. 无变数(variability)   ;

Mustafa Suleyman还表示,他们正在探索在游戏之外的应用,但是初步预测这不会是很容易的,因为真实世界比游戏复杂很多,他预测会需要3-5年时间。

他也提到:alpha zero 本身并不能带来AI对于数据的需求,但是他觉得在数据生成和模拟上的进步(比如说用真实语音合成、人脸合成、甚至类似Grand theft auto来做自动驾驶的模拟)是有可能在未来自动产生可补充的数据。(内容来自:李开复老师朋友圈)

或点击“阅读原文”,查看详情

登录查看更多
1

相关内容

【复旦大学-SP2020】NLP语言模型隐私泄漏风险
专知会员服务
24+阅读 · 2020年4月20日
【模型泛化教程】标签平滑与Keras, TensorFlow,和深度学习
专知会员服务
20+阅读 · 2019年12月31日
【强化学习】深度强化学习初学者指南
专知会员服务
178+阅读 · 2019年12月14日
【机器学习课程】Google机器学习速成课程
专知会员服务
162+阅读 · 2019年12月2日
万维钢:数学高手都是训练出来的
罗辑思维
4+阅读 · 2019年3月4日
李开复:听AI大佬吐槽真实的人工智能
算法与数学之美
4+阅读 · 2018年8月26日
零基础搞懂强化学习?这份视频攻略不算迟
AI研习社
6+阅读 · 2018年4月25日
一张图看懂AlphaGo Zero
AI前线
5+阅读 · 2017年11月17日
已删除
将门创投
5+阅读 · 2017年10月20日
AI都干过什么让人细思极恐的事?
全球创新论坛
4+阅读 · 2017年9月15日
Arxiv
8+阅读 · 2019年3月28日
Universal Transformers
Arxiv
5+阅读 · 2019年3月5日
Arxiv
6+阅读 · 2018年4月21日
Arxiv
7+阅读 · 2017年12月28日
VIP会员
相关资讯
万维钢:数学高手都是训练出来的
罗辑思维
4+阅读 · 2019年3月4日
李开复:听AI大佬吐槽真实的人工智能
算法与数学之美
4+阅读 · 2018年8月26日
零基础搞懂强化学习?这份视频攻略不算迟
AI研习社
6+阅读 · 2018年4月25日
一张图看懂AlphaGo Zero
AI前线
5+阅读 · 2017年11月17日
已删除
将门创投
5+阅读 · 2017年10月20日
AI都干过什么让人细思极恐的事?
全球创新论坛
4+阅读 · 2017年9月15日
相关论文
Top
微信扫码咨询专知VIP会员