项目名称: 强化学习迁移技术及其在交互式游戏中的应用研究

项目编号: No.61175042

项目类型: 面上项目

立项/批准年度: 2012

项目学科: 自动化学科

项目作者: 高阳

作者单位: 南京大学

项目金额: 58万元

中文摘要: 在强化学习迁移技术中,研究出针对单源、多源、跨域、多Agent强化学习迁移的若干模型和相关算法。采用多示例学习、分层强化学习、强化学习函数估计、关系强化学习等具体研究手段,实现以上强化学习迁移算法。并利用算法信息理论对部分的迁移方法进行理论证明。将以上方法应用到交互式游戏领域中,实现游戏在规模变化、任务变化和角色变换时的强化学习迁移。 基于所研究成果,将在国际学术刊物、国际一流学术会议和国内一级刊物上发表论文15-20篇;申请专利3-4项;并使本课题在强化学习迁移技术方面的研究在国际上处于领先水平。

中文关键词: 强化学习;迁移学习;强化学习迁移;交互式游戏;

英文摘要:

英文关键词: Reinforcement Learning;Transfer Learning;Transfer Learning in Reinforcement Learning Domain;Interactive Video Games;

成为VIP会员查看完整内容
0

相关内容

强化学习(RL)是机器学习的一个领域,与软件代理应如何在环境中采取行动以最大化累积奖励的概念有关。除了监督学习和非监督学习外,强化学习是三种基本的机器学习范式之一。 强化学习与监督学习的不同之处在于,不需要呈现带标签的输入/输出对,也不需要显式纠正次优动作。相反,重点是在探索(未知领域)和利用(当前知识)之间找到平衡。 该环境通常以马尔可夫决策过程(MDP)的形式陈述,因为针对这种情况的许多强化学习算法都使用动态编程技术。经典动态规划方法和强化学习算法之间的主要区别在于,后者不假设MDP的确切数学模型,并且针对无法采用精确方法的大型MDP。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
智能视频监控关键技术:行人再识别研究综述
专知会员服务
36+阅读 · 2021年12月30日
【斯坦福经典书】强化学习在金融应用,414页pdf
专知会员服务
121+阅读 · 2021年3月30日
深度强化学习在智能制造中的应用展望综述
专知会员服务
93+阅读 · 2021年1月28日
专知会员服务
132+阅读 · 2021年1月13日
专知会员服务
100+阅读 · 2021年1月1日
专知会员服务
80+阅读 · 2020年12月11日
最新《深度强化学习中的迁移学习》综述论文
专知会员服务
153+阅读 · 2020年9月20日
【综述】自动驾驶领域中的强化学习,附18页论文下载
专知会员服务
169+阅读 · 2020年2月8日
专知会员服务
198+阅读 · 2019年8月30日
【网易伏羲】强化学习研究员
深度强化学习实验室
1+阅读 · 2022年3月25日
我的天,强化学习还能用在自动驾驶领域?
夕小瑶的卖萌屋
1+阅读 · 2022年3月24日
【2022新书】强化学习工业应用
专知
14+阅读 · 2022年2月3日
IJCAI 2021 | 一文了解微软亚洲研究院机器学习方向前沿进展
微软研究院AI头条
0+阅读 · 2021年8月24日
【综述】迁移自适应学习十年进展
专知
41+阅读 · 2019年11月26日
迁移自适应学习最新综述,附21页论文下载
深度强化学习入门,这一篇就够了!
机器学习算法与Python学习
26+阅读 · 2018年8月17日
强化学习族谱
CreateAMind
26+阅读 · 2017年8月2日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
7+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
3+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
21+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
42+阅读 · 2009年12月31日
国家自然科学基金
1+阅读 · 2008年12月31日
Arxiv
0+阅读 · 2022年4月18日
Arxiv
10+阅读 · 2020年11月26日
Arxiv
29+阅读 · 2019年3月13日
Arxiv
21+阅读 · 2018年8月30日
Arxiv
11+阅读 · 2018年4月25日
小贴士
相关VIP内容
智能视频监控关键技术:行人再识别研究综述
专知会员服务
36+阅读 · 2021年12月30日
【斯坦福经典书】强化学习在金融应用,414页pdf
专知会员服务
121+阅读 · 2021年3月30日
深度强化学习在智能制造中的应用展望综述
专知会员服务
93+阅读 · 2021年1月28日
专知会员服务
132+阅读 · 2021年1月13日
专知会员服务
100+阅读 · 2021年1月1日
专知会员服务
80+阅读 · 2020年12月11日
最新《深度强化学习中的迁移学习》综述论文
专知会员服务
153+阅读 · 2020年9月20日
【综述】自动驾驶领域中的强化学习,附18页论文下载
专知会员服务
169+阅读 · 2020年2月8日
专知会员服务
198+阅读 · 2019年8月30日
相关资讯
【网易伏羲】强化学习研究员
深度强化学习实验室
1+阅读 · 2022年3月25日
我的天,强化学习还能用在自动驾驶领域?
夕小瑶的卖萌屋
1+阅读 · 2022年3月24日
【2022新书】强化学习工业应用
专知
14+阅读 · 2022年2月3日
IJCAI 2021 | 一文了解微软亚洲研究院机器学习方向前沿进展
微软研究院AI头条
0+阅读 · 2021年8月24日
【综述】迁移自适应学习十年进展
专知
41+阅读 · 2019年11月26日
迁移自适应学习最新综述,附21页论文下载
深度强化学习入门,这一篇就够了!
机器学习算法与Python学习
26+阅读 · 2018年8月17日
强化学习族谱
CreateAMind
26+阅读 · 2017年8月2日
相关基金
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
7+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
3+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
21+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
42+阅读 · 2009年12月31日
国家自然科学基金
1+阅读 · 2008年12月31日
相关论文
微信扫码咨询专知VIP会员