SQN算法效果及代码: Breakout-ram-v4 打砖块

2019 年 1 月 21 日 CreateAMind

先看跑CartPole-v0的效果（实在是太简单了。。。）

SQN：颤抖吧，CartPole！

再看LunarLander-v2的效果（也是比较简单了。。。），AverageEpRet就是不上300... : (

最后Breakout-ram-v4的效果（通关无压力。。。）

可以看下面视频最后打完无砖块，可以看到864分即最高分。

并没有调到最优，只是为了验证自己的算法，也没有使用视频版本的Breakout。

SQN （Soft Q Network ）是基于Q-value的强化学习算法，伪代码及源代码详见createamind代码库。

代码：https://github.com/createamind/DRL

登录查看更多

相关内容

算法

关注 159

在数学和计算机科学之中，算法（Algorithm）为一个计算的具体步骤，常用于计算、数据处理和自动推理。精确而言，算法是一个表示为有限长列表的有效方法。算法应包含清晰定义的指令用于计算函数。来自维基百科：算法

【ICML2020】用于强化学习的对比无监督表示嵌入

专知会员服务

28+阅读 · 2020年7月6日

【ICML2020-天津大学】多智能体深度强化学习中的Q值路径分解

专知会员服务

81+阅读 · 2020年7月2日

【圣经书】《强化学习导论(2nd)》电子书与代码，548页pdf

专知会员服务

208+阅读 · 2020年5月22日

【牛津大学博士论文】基于强化学习的无地图机器人导航，Reinforcement Learning Based MRN

专知会员服务

122+阅读 · 2020年5月18日

强化学习的对比无监督表示，CURL: Contrastive Unsupervised Representations for Reinforcement Learning

专知会员服务

41+阅读 · 2020年4月11日

【浙江大学】使用MAML元学习的少样本图分类

专知会员服务

63+阅读 · 2020年3月22日

CVPR 2020 论文开源项目合集

专知会员服务

110+阅读 · 2020年3月12日

Tensorflow GNN实战：手把手教你使用tf_geometric构建图自编码器GAE（附完整代码）

专知会员服务

76+阅读 · 2020年1月30日

【南洋理工大学课程】deep_reinforcement_learning（深度强化学习），109页ppt

专知会员服务

105+阅读 · 2019年11月2日

RL解决'LunarLander-v2' (SOTA)

CreateAMind

62+阅读 · 2019年9月27日

RL解决'BipedalWalkerHardcore-v2' (SOTA)效率效果均第一及完整源代码

CreateAMind

19+阅读 · 2019年7月18日

手把手教你用Python实现“坦克大战”，附详细代码！

机器学习算法与Python学习

12+阅读 · 2019年6月8日

使用vae与sac实现简单自动驾驶

CreateAMind

9+阅读 · 2019年6月6日

自动驾驶仿真软件列表

智能交通技术

13+阅读 · 2019年5月9日

骥智CreateAMind2019招聘目标：50+端对端强化学习无人驾驶牛人推荐成功送mate20

CreateAMind

5+阅读 · 2019年2月13日

骥智CreateAMind给您拜年了-附招聘信息

CreateAMind

3+阅读 · 2019年2月6日

期待已久的—YOLO V3

计算机视觉战队

20+阅读 · 2018年4月13日

拍照手抖有救了！DeblurGAN消除运动模糊效果惊人 | 附论文+代码

量子位

3+阅读 · 2017年11月26日

开发 | Keras版faster-rcnn算法详解（RPN计算）

AI科技评论

4+阅读 · 2017年9月23日

Zero-Shot Entity Linking by Reading Entity Descriptions

Arxiv

6+阅读 · 2019年6月18日

Prime Sample Attention in Object Detection

Arxiv

13+阅读 · 2019年4月9日

DC-SPP-YOLO: Dense Connection and Spatial Pyramid Pooling Based YOLO for Object Detection

Arxiv

3+阅读 · 2019年3月20日

OMNIA Faster R-CNN: Detection in the wild through dataset merging and soft distillation

Arxiv

6+阅读 · 2018年12月6日

BiSeNet: Bilateral Segmentation Network for Real-time Semantic Segmentation

Arxiv

4+阅读 · 2018年8月2日

Relational Deep Reinforcement Learning

Arxiv

10+阅读 · 2018年6月28日

An Interpretable Reasoning Network for Multi-Relation Question Answering

Arxiv

13+阅读 · 2018年6月1日

Population Anomaly Detection through Deep Gaussianization

Arxiv

6+阅读 · 2018年5月5日

Complex-YOLO: Real-time 3D Object Detection on Point Clouds

Arxiv

3+阅读 · 2018年3月16日

DeepPath: A Reinforcement Learning Method for Knowledge Graph Reasoning

Arxiv

20+阅读 · 2018年1月8日