成为VIP会员查看完整内容
VIP会员码认证
首页
主题
发现
会员
服务
注册
·
登录
策略梯度
关注
12
综合
百科
VIP
热门
动态
论文
精华
【2022新书】强化学习工业应用
专知
17+阅读 · 2022年2月3日
一个新的 TensorFlow Lite 示例应用:棋盘游戏
TensorFlow
0+阅读 · 2021年12月23日
深度强化学习算法与应用研究现状综述
专知
1+阅读 · 2021年1月13日
李宏毅强化学习完整笔记!开源项目《LeeDeepRL-Notes》发布
机器之心
2+阅读 · 2020年11月25日
李宏毅强化学习完整笔记!开源项目《LeeDeepRL-Notes》发布
专知
0+阅读 · 2020年11月24日
UC伯克利出品,深度强化学习最新课程已上线
机器之心
1+阅读 · 2020年10月12日
殊途同归的策略梯度与零阶优化
PaperWeekly
1+阅读 · 2020年10月11日
MSU最新《深度强化学习中的迁移学习》2020综述论文,22页pdf
深度强化学习实验室
0+阅读 · 2020年9月20日
MSU最新《深度强化学习中的迁移学习》2020综述论文,22页pdf
专知
0+阅读 · 2020年9月20日
不吃蘑菇,不捡金币,我用强化学习跑通29关马里奥,刷新最佳战绩
机器之心
0+阅读 · 2020年8月1日
Youtube推荐RL首弹,基于Top-K的Off-Policy矫正解决推荐中的信息茧房困境
AINLP
2+阅读 · 2020年6月11日
在机器人领域使用元学习探索进化方向
谷歌开发者
0+阅读 · 2020年5月25日
超越99.9%人类玩家,微软专业十段麻将AI论文细节首次公布
THU数据派
0+阅读 · 2020年4月12日
超越99.9%人类玩家,微软专业十段麻将AI论文细节首次公布
机器之心
0+阅读 · 2020年4月7日
参考链接
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top