项目名称: 基于复杂图知识表示的终身强化学习研究

项目编号: No.61503178

项目类型: 青年科学基金项目

立项/批准年度: 2016

项目学科: 其他

项目作者: 王皓

作者单位: 南京大学

项目金额: 22万元

中文摘要: 本项目拟研究大数据背景下的新型强化学习技术——终身强化学习,其基本目标是在过去大量、异构的学习经验基础上实现选择性的知识迁移,以改进当前的学习。本项目从数据管理的角度探讨终身强化学习:使用数据库存储所有的历史强化学习数据,将选择性迁移问题转化为数据上的相似度搜索问题,并通过设计数据上的索引结构而加以高效解决。具体而言,本项目拟研究如下内容:(1)强化学习任务的复杂图知识表示;(2)基于复杂图知识表示的强化学习任务相似度定义;(3)历史数据库上的索引结构设计以及强化学习任务的相似度搜索;以及(4)选择性迁移学习算法及终身强化学习系统设计。.基于研究成果,本项目拟在重要的国际学术期刊及会议上发表高水平论文6-8篇,申报专利2项,联合培养博士研究生1人。

中文关键词: 终身强化学习;复杂图;子图匹配;相似度搜索;选择性知识迁移

英文摘要: This project proposes to study lifelong reinforcement learning (LRL), a novel extension of reinforcement learning (RL) in the era of big data, of which the ultimate goal is to implement selective transfer of knowledge from large-amount, heterogeneous past learning experiences to improve current learning. In this project we consider LRL from a perspective of data management. We use a database to maintain all RL data and transform selective transfer problems into similarity search problems over the database, which could be efficiently solved via elaborate index structures. Specifically, this project proposes to study (1) complex graphical knowledge representations of reinforcement learning tasks, (2) similarity measures between RL tasks represented as complex graphs, (3) design of index structures over the learning database and efficient similarity search algorithms, and (4) design of selective transfer algorithms and LRL systems...Based on the outcomes of this project, we plan to (1) publish 6-8 high-quality papers on important international journals and conferences, (2) apply for 2 patents, and (3) jointly train 1 doctoral student.

英文关键词: lifelong reinforcement learning;complex graph;subgraph matching;similarity search;selective knowledge transfer

成为VIP会员查看完整内容
25

相关内容

基于强化学习的推荐研究综述
专知会员服务
83+阅读 · 2021年10月21日
专知会员服务
27+阅读 · 2021年7月20日
专知会员服务
29+阅读 · 2020年12月14日
【斯坦福CS330】终身学习: 问题陈述,前后迁移,30页ppt
专知会员服务
25+阅读 · 2020年12月13日
多智能体深度强化学习的若干关键科学问题
专知会员服务
188+阅读 · 2020年5月24日
我的天,强化学习还能用在自动驾驶领域?
夕小瑶的卖萌屋
1+阅读 · 2022年3月24日
【微软亚研130PPT教程】强化学习简介
专知
36+阅读 · 2018年10月26日
【强化学习】易忽略的强化学习知识之基础知识及MDP
产业智能官
18+阅读 · 2017年12月22日
【深度强化学习】深度强化学习揭秘
产业智能官
20+阅读 · 2017年11月13日
【知识图谱】中文知识图谱构建方法研究
产业智能官
99+阅读 · 2017年10月26日
课程 |《知识图谱》第一期
开放知识图谱
22+阅读 · 2017年10月15日
肖仰华 | 基于知识图谱的问答系统
开放知识图谱
28+阅读 · 2017年9月18日
深度 | 复旦肖仰华:基于知识图谱的问答系统
全球人工智能
27+阅读 · 2017年9月7日
国家自然科学基金
41+阅读 · 2015年12月31日
国家自然科学基金
11+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
18+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
4+阅读 · 2009年12月31日
国家自然科学基金
21+阅读 · 2009年12月31日
国家自然科学基金
11+阅读 · 2008年12月31日
Arxiv
12+阅读 · 2020年6月20日
Arxiv
14+阅读 · 2019年9月11日
Knowledge Representation Learning: A Quantitative Review
Arxiv
24+阅读 · 2018年10月24日
Arxiv
22+阅读 · 2018年8月30日
小贴士
相关VIP内容
基于强化学习的推荐研究综述
专知会员服务
83+阅读 · 2021年10月21日
专知会员服务
27+阅读 · 2021年7月20日
专知会员服务
29+阅读 · 2020年12月14日
【斯坦福CS330】终身学习: 问题陈述,前后迁移,30页ppt
专知会员服务
25+阅读 · 2020年12月13日
多智能体深度强化学习的若干关键科学问题
专知会员服务
188+阅读 · 2020年5月24日
相关资讯
我的天,强化学习还能用在自动驾驶领域?
夕小瑶的卖萌屋
1+阅读 · 2022年3月24日
【微软亚研130PPT教程】强化学习简介
专知
36+阅读 · 2018年10月26日
【强化学习】易忽略的强化学习知识之基础知识及MDP
产业智能官
18+阅读 · 2017年12月22日
【深度强化学习】深度强化学习揭秘
产业智能官
20+阅读 · 2017年11月13日
【知识图谱】中文知识图谱构建方法研究
产业智能官
99+阅读 · 2017年10月26日
课程 |《知识图谱》第一期
开放知识图谱
22+阅读 · 2017年10月15日
肖仰华 | 基于知识图谱的问答系统
开放知识图谱
28+阅读 · 2017年9月18日
深度 | 复旦肖仰华:基于知识图谱的问答系统
全球人工智能
27+阅读 · 2017年9月7日
相关基金
国家自然科学基金
41+阅读 · 2015年12月31日
国家自然科学基金
11+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
18+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
4+阅读 · 2009年12月31日
国家自然科学基金
21+阅读 · 2009年12月31日
国家自然科学基金
11+阅读 · 2008年12月31日
相关论文
Arxiv
12+阅读 · 2020年6月20日
Arxiv
14+阅读 · 2019年9月11日
Knowledge Representation Learning: A Quantitative Review
Arxiv
24+阅读 · 2018年10月24日
Arxiv
22+阅读 · 2018年8月30日
微信扫码咨询专知VIP会员