成为VIP会员查看完整内容
VIP会员码认证
首页
主题
发现
会员
服务
注册
·
登录
价值函数
关注
0
综合
百科
VIP
热门
动态
论文
精华
Model-Based 两篇paper
CreateAMind
0+阅读 · 2018年12月18日
为什么科学家如此热衷于研发棋牌类AI?
新智元
0+阅读 · 2017年5月24日
中国文明的密码
知社学术圈
0+阅读 · 2018年9月7日
朱松纯团队新作:让AI「读懂」人类价值观!登上Science Robotics
极市平台
2+阅读 · 2022年7月15日
【AlphaGo核心技术-教程学习笔记03】深度强化学习第三讲 动态规划寻找最优策略
专知
10+阅读 · 2017年10月22日
从算法到训练,综述强化学习实现技巧与调试经验
中国人工智能学会
0+阅读 · 2017年9月11日
DeepMind到底是如何教AI玩游戏的?这篇在Medium上获得1700个赞的文章,把里面的原理讲清楚了
AI100
0+阅读 · 2017年9月23日
业界 | 让人工智能学会谈判,Facebook开源端到端强化学习模型
机器之心
0+阅读 · 2017年6月15日
常见强化学习方法总结
CVer
0+阅读 · 2020年1月26日
GAIL(Imitating driver behavior with GAN)
CreateAMind
1+阅读 · 2018年10月10日
【论文深度研读报告】MuZero算法过程详解
深度强化学习实验室
2+阅读 · 2021年1月18日
B站教学,全中文课程:港中文周博磊强化学习课程完结
机器之心
1+阅读 · 2020年5月27日
除了DQN/A3C,还有哪些高级强化学习成果
论智
15+阅读 · 2018年10月28日
我开始相信会有更多孩子被伤害
卢泓言
0+阅读 · 2018年6月30日
通用强化学习用算法发现算法:DeepMind 数据驱动「价值函数」自我更新,14款Atari游戏完虐人类!
新智元
1+阅读 · 2020年7月27日
参考链接
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top