多巴胺:谷歌开源新型增强学习框架

2018 年 8 月 30 日 专知

Google 近日宣布开源一个新的基于 Tensorflow 的框架 —— Dopamine,旨在为新手和资深 RL(强化学习)研究人员提供灵活性、稳定性和可重复性。该框架受大脑中的奖励动机行为启发,反映了神经科学与强化学习研究之间的强历史联系,旨在实现可以推动激进发现的投机性研究。

Dopamine 的功能亮点

易用性

  • 清晰性和简洁性是该框架设计中的两个关键考虑因素。Google 提供的代码非常紧凑(约 15 个 Python 文件)且文档完善,Google 希望这种简单性能使研究人员更轻松地理解代理的内部运作并快速尝试新的想法。

复用性

  • Google 非常看重可复用性在强化学习研究中的重要性。为此,他们为代码提供完整的测试覆盖率;,并遵循 Machado 等学者给出的建议使用街机学习环境(Arcade Learning Environment)标准化经验评估。

基准测试

  • 对于新的研究人员而言,能够根据已有方法快速对自己的想法进行基准测试是非常重要的。因此,Google 提供四个 agent 的完整训练数据,包括Arcade Learning Environment 支持的 60 个游戏,格式为 Python pickle 文件(对于使用谷歌框架训练的智能体)和 JSON 数据文件(用于对比其他框架训练的智能体)。Google 还额外提供一个网站,可在上面快速查看所有 60 款游戏的 agent 可视化训练运行情况。


更多细节根据相关链接进行查阅

相关链接


-END-

专 · 知


人工智能领域26个主题知识资料全集获取与加入专知人工智能服务群: 欢迎微信扫一扫加入专知人工智能知识星球群,获取专业知识教程视频资料和与专家交流咨询!



请PC登录www.zhuanzhi.ai或者点击阅读原文,注册登录专知,获取更多AI知识资料!


请加专知小助手微信(扫一扫如下二维码添加),加入专知主题群(请备注主题类型:AI、NLP、CV、 KG等)交流~

 AI 项目技术 & 商务合作:bd@zhuanzhi.ai, 或扫描上面二维码联系!

请关注专知公众号,获取人工智能的专业知识!

点击“阅读原文”,使用专知


登录查看更多
1

相关内容

【牛津大学&DeepMind】自监督学习教程,141页ppt
专知会员服务
179+阅读 · 2020年5月29日
【Nature论文】深度网络中的梯度下降复杂度控制
专知会员服务
38+阅读 · 2020年3月9日
《强化学习—使用 Open AI、TensorFlow和Keras实现》174页pdf
专知会员服务
136+阅读 · 2020年3月1日
深度强化学习策略梯度教程,53页ppt
专知会员服务
178+阅读 · 2020年2月1日
【强化学习资源集合】Awesome Reinforcement Learning
专知会员服务
94+阅读 · 2019年12月23日
【文章|BERT三步使用NLP迁移学习】NLP Transfer Learning In 3 Steps
【资源】强化学习实践教程
专知
43+阅读 · 2019年9月11日
TensorFlow 2.0如何在Colab中使用TensorBoard
专知
17+阅读 · 2019年3月15日
PyTorch实现多种深度强化学习算法
专知
36+阅读 · 2019年1月15日
UC伯克利Pieter Abbeel谈论强化学习-视频
专知
7+阅读 · 2018年12月17日
深度强化学习简介
专知
30+阅读 · 2018年12月3日
资源 | 谷歌开源AdaNet:基于TensorFlow的AutoML框架
极市平台
4+阅读 · 2018年11月1日
深度学习TensorFlow实现集合
专知
10+阅读 · 2018年9月8日
NLP论文的技术播客-NLP Highlights
专知
14+阅读 · 2018年8月6日
A Comprehensive Survey on Transfer Learning
Arxiv
121+阅读 · 2019年11月7日
Arxiv
19+阅读 · 2019年4月5日
Relational Deep Reinforcement Learning
Arxiv
10+阅读 · 2018年6月28日
VIP会员
相关资讯
【资源】强化学习实践教程
专知
43+阅读 · 2019年9月11日
TensorFlow 2.0如何在Colab中使用TensorBoard
专知
17+阅读 · 2019年3月15日
PyTorch实现多种深度强化学习算法
专知
36+阅读 · 2019年1月15日
UC伯克利Pieter Abbeel谈论强化学习-视频
专知
7+阅读 · 2018年12月17日
深度强化学习简介
专知
30+阅读 · 2018年12月3日
资源 | 谷歌开源AdaNet:基于TensorFlow的AutoML框架
极市平台
4+阅读 · 2018年11月1日
深度学习TensorFlow实现集合
专知
10+阅读 · 2018年9月8日
NLP论文的技术播客-NLP Highlights
专知
14+阅读 · 2018年8月6日
Top
微信扫码咨询专知VIP会员