策略梯度最新内容 - 专知

会员服务 ·

策略梯度

【2022新书】强化学习工业应用

【2022新书】强化学习工业应用

专知

18+阅读 · 2022年2月3日

一个新的 TensorFlow Lite 示例应用：棋盘游戏

一个新的 TensorFlow Lite 示例应用：棋盘游戏

TensorFlow

0+阅读 · 2021年12月23日

深度强化学习算法与应用研究现状综述

深度强化学习算法与应用研究现状综述

专知

1+阅读 · 2021年1月13日

李宏毅强化学习完整笔记！开源项目《LeeDeepRL-Notes》发布

李宏毅强化学习完整笔记！开源项目《LeeDeepRL-Notes》发布

机器之心

2+阅读 · 2020年11月25日

李宏毅强化学习完整笔记！开源项目《LeeDeepRL-Notes》发布

李宏毅强化学习完整笔记！开源项目《LeeDeepRL-Notes》发布

专知

0+阅读 · 2020年11月24日

UC伯克利出品，深度强化学习最新课程已上线

UC伯克利出品，深度强化学习最新课程已上线

机器之心

1+阅读 · 2020年10月12日

殊途同归的策略梯度与零阶优化

殊途同归的策略梯度与零阶优化

PaperWeekly

1+阅读 · 2020年10月11日

MSU最新《深度强化学习中的迁移学习》2020综述论文，22页pdf

MSU最新《深度强化学习中的迁移学习》2020综述论文，22页pdf

深度强化学习实验室

0+阅读 · 2020年9月20日

MSU最新《深度强化学习中的迁移学习》2020综述论文，22页pdf

MSU最新《深度强化学习中的迁移学习》2020综述论文，22页pdf

专知

0+阅读 · 2020年9月20日

不吃蘑菇，不捡金币，我用强化学习跑通29关马里奥，刷新最佳战绩

不吃蘑菇，不捡金币，我用强化学习跑通29关马里奥，刷新最佳战绩

机器之心

0+阅读 · 2020年8月1日

Youtube推荐RL首弹，基于Top-K的Off-Policy矫正解决推荐中的信息茧房困境

Youtube推荐RL首弹，基于Top-K的Off-Policy矫正解决推荐中的信息茧房困境

AINLP

3+阅读 · 2020年6月11日

在机器人领域使用元学习探索进化方向

在机器人领域使用元学习探索进化方向

谷歌开发者

0+阅读 · 2020年5月25日

超越99.9%人类玩家，微软专业十段麻将AI论文细节首次公布

超越99.9%人类玩家，微软专业十段麻将AI论文细节首次公布

THU数据派

0+阅读 · 2020年4月12日

超越99.9%人类玩家，微软专业十段麻将AI论文细节首次公布

超越99.9%人类玩家，微软专业十段麻将AI论文细节首次公布

机器之心

0+阅读 · 2020年4月7日

参考链接

微信扫码咨询专知VIP会员