Google Research Football (scenario 2) 实验

2019 年 8 月 29 日 CreateAMind


谷歌足球环境(Google Research Football )的介绍可以参看之前的公众号文章:

谷歌足球游戏环境使用介绍

源码链接:https://github.com/google-research/football


在 Football Academy 中提供了11个不同类型和难度的scenarios,这里选择scenario 2 作为初步的实验环境:


谷歌发布的这足球环境有两个特点:一是稀疏奖励(只有进球了才有得分),类似游戏有围棋等;二是随机性大(射门进球是离散概率的),类似游戏有扑克等。环境的动作空间为21维,解决scenario 2的重点是找到其中有用的动作,比如带球和射门。


随着学习的进行,Agent学到的策略也在迭代:


1. 直接射门。刚开始就学到的简单策略,由于远距离射门进球随机性大,得分并不高。


2. 先带球再射门。Agent发现离球门越近射门进球概率越高,学会先带球后再射门,但是需要补射。


3. 带球到禁区附近射门。一路带球到靠近球门,此时正对球门,距离合适,射门基本都能命中,而且不需要补射。


官方的Baseline里的得分只有0.85,我们的实验结果为1.0(100%进球)。



欢迎加入或支持我们 :)

登录查看更多
8

相关内容

一家美国的跨国科技企业,致力于互联网搜索、云计算、广告技术等领域,由当时在斯坦福大学攻读理学博士的拉里·佩奇和谢尔盖·布林共同创建。创始之初,Google 官方的公司使命为「整合全球范围的信息,使人人皆可访问并从中受益」。 Google 开发并提供了大量基于互联网的产品与服务,其主要利润来自于 AdWords 等广告服务。

2004 年 8 月 19 日, 公司以「GOOG」为代码正式登陆纳斯达克交易所。
【Nature论文】深度网络中的梯度下降复杂度控制
专知会员服务
38+阅读 · 2020年3月9日
【机器学习课程】Google机器学习速成课程
专知会员服务
164+阅读 · 2019年12月2日
强化学习扫盲贴:从Q-learning到DQN
夕小瑶的卖萌屋
52+阅读 · 2019年10月13日
谷歌足球游戏环境使用介绍
CreateAMind
33+阅读 · 2019年6月27日
深度强化学习入门,这一篇就够了!
机器学习算法与Python学习
27+阅读 · 2018年8月17日
【干货】强化学习介绍
人工智能学家
13+阅读 · 2018年6月24日
入门 | 通过 Q-learning 深入理解强化学习
机器之心
12+阅读 · 2018年4月17日
【强化学习】强化学习/增强学习/再励学习介绍
产业智能官
10+阅读 · 2018年2月23日
LibRec 每周算法:Collaborative Metric Learning (WWW'17)
LibRec智能推荐
6+阅读 · 2017年7月4日
Hierarchical Deep Multiagent Reinforcement Learning
Arxiv
8+阅读 · 2018年9月25日
Relational Deep Reinforcement Learning
Arxiv
10+阅读 · 2018年6月28日
Arxiv
3+阅读 · 2018年6月24日
Arxiv
6+阅读 · 2018年4月24日
Arxiv
3+阅读 · 2018年2月24日
Arxiv
4+阅读 · 2018年2月13日
Arxiv
7+阅读 · 2017年12月28日
VIP会员
相关资讯
强化学习扫盲贴:从Q-learning到DQN
夕小瑶的卖萌屋
52+阅读 · 2019年10月13日
谷歌足球游戏环境使用介绍
CreateAMind
33+阅读 · 2019年6月27日
深度强化学习入门,这一篇就够了!
机器学习算法与Python学习
27+阅读 · 2018年8月17日
【干货】强化学习介绍
人工智能学家
13+阅读 · 2018年6月24日
入门 | 通过 Q-learning 深入理解强化学习
机器之心
12+阅读 · 2018年4月17日
【强化学习】强化学习/增强学习/再励学习介绍
产业智能官
10+阅读 · 2018年2月23日
LibRec 每周算法:Collaborative Metric Learning (WWW'17)
LibRec智能推荐
6+阅读 · 2017年7月4日
相关论文
Hierarchical Deep Multiagent Reinforcement Learning
Arxiv
8+阅读 · 2018年9月25日
Relational Deep Reinforcement Learning
Arxiv
10+阅读 · 2018年6月28日
Arxiv
3+阅读 · 2018年6月24日
Arxiv
6+阅读 · 2018年4月24日
Arxiv
3+阅读 · 2018年2月24日
Arxiv
4+阅读 · 2018年2月13日
Arxiv
7+阅读 · 2017年12月28日
Top
微信扫码咨询专知VIP会员