成为VIP会员查看完整内容
VIP会员码认证
首页
主题
发现
会员
服务
注册
·
登录
序贯决策
关注
1
序贯决策(Sequential Decision)是指按时间顺序排列起来,以得到按顺序的各种决策(策略),是用于随机性或不确定性动态系统最优化的决策方法。
综合
百科
VIP
热门
动态
论文
精华
多Agent深度强化学习综述(中文版),21页pdf
专知
2+阅读 · 2021年1月1日
基于深度强化学习的组合优化研究进展
专知
0+阅读 · 2020年12月11日
强化学习是人工智能的未来?
CSDN
0+阅读 · 2019年11月30日
李航NSR论文:深度学习NLP的现有优势与未来挑战
机器之心
0+阅读 · 2017年10月4日
参考链接
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top