基于复杂图知识表示的终身强化学习研究 - 专知基金

会员服务 ·

11

终身强化学习 · 复杂图 · 子图匹配 · 选择性知识迁移 ·

2015 年 12 月 31 日

基于复杂图知识表示的终身强化学习研究

国家自然科学基金

国家自然科学基金委员会

项目名称： 基于复杂图知识表示的终身强化学习研究

项目编号： No.61503178

项目类型： 青年科学基金项目

立项/批准年度： 2016

项目学科： 其他

项目作者： 王皓

作者单位： 南京大学

项目金额： 22万元

中文摘要： 本项目拟研究大数据背景下的新型强化学习技术——终身强化学习，其基本目标是在过去大量、异构的学习经验基础上实现选择性的知识迁移，以改进当前的学习。本项目从数据管理的角度探讨终身强化学习：使用数据库存储所有的历史强化学习数据，将选择性迁移问题转化为数据上的相似度搜索问题，并通过设计数据上的索引结构而加以高效解决。具体而言，本项目拟研究如下内容：（1）强化学习任务的复杂图知识表示；（2）基于复杂图知识表示的强化学习任务相似度定义；（3）历史数据库上的索引结构设计以及强化学习任务的相似度搜索；以及（4）选择性迁移学习算法及终身强化学习系统设计。.基于研究成果，本项目拟在重要的国际学术期刊及会议上发表高水平论文6-8篇，申报专利2项，联合培养博士研究生1人。

中文关键词： 终身强化学习；复杂图；子图匹配；相似度搜索；选择性知识迁移

英文摘要： This project proposes to study lifelong reinforcement learning (LRL), a novel extension of reinforcement learning (RL) in the era of big data, of which the ultimate goal is to implement selective transfer of knowledge from large-amount, heterogeneous past learning experiences to improve current learning. In this project we consider LRL from a perspective of data management. We use a database to maintain all RL data and transform selective transfer problems into similarity search problems over the database, which could be efficiently solved via elaborate index structures. Specifically, this project proposes to study (1) complex graphical knowledge representations of reinforcement learning tasks, (2) similarity measures between RL tasks represented as complex graphs, (3) design of index structures over the learning database and efficient similarity search algorithms, and (4) design of selective transfer algorithms and LRL systems...Based on the outcomes of this project, we plan to (1) publish 6-8 high-quality papers on important international journals and conferences, (2) apply for 2 patents, and (3) jointly train 1 doctoral student.

英文关键词： lifelong reinforcement learning;complex graph;subgraph matching;similarity search;selective knowledge transfer

成为VIP会员查看完整内容

34

相关内容

终身强化学习

终身强化学习

基于强化学习的推荐研究综述

基于强化学习的推荐研究综述

专知会员服务

84+阅读 · 2021年10月21日

【SIGIR2021教程】基于强化学习的信息检索

专知会员服务

28+阅读 · 2021年7月20日

【斯坦福-NLP-seminar】知识密集强化学习，72页ppt，Facebook TIM

专知会员服务

29+阅读 · 2021年4月27日

【AAAI2021】Lipschitz终身强化学习

专知会员服务

31+阅读 · 2020年12月14日

【斯坦福CS330】终身学习: 问题陈述，前后迁移，30页ppt

【斯坦福CS330】终身学习: 问题陈述，前后迁移，30页ppt

专知会员服务

26+阅读 · 2020年12月13日

【2020新书】基于人工智能的机器人安全学习和控制，138页pdf

【2020新书】基于人工智能的机器人安全学习和控制，138页pdf

专知会员服务

52+阅读 · 2020年12月12日

多智能体深度强化学习的若干关键科学问题

多智能体深度强化学习的若干关键科学问题

专知会员服务

194+阅读 · 2020年5月24日

【百度AutoDL教程】自动深度学习: 理论、算法、平台和应用，132PPT

【百度AutoDL教程】自动深度学习: 理论、算法、平台和应用，132PPT

专知会员服务

75+阅读 · 2020年2月4日

【报告】知识图谱中的关联搜索，南京大学计算机科学与技术系副教授| 程龚

【报告】知识图谱中的关联搜索，南京大学计算机科学与技术系副教授| 程龚

专知会员服务

126+阅读 · 2019年12月14日

第二代聊天机器人，加拿大滑铁卢大学李明教授，CCKS-2019：知识智能

第二代聊天机器人，加拿大滑铁卢大学李明教授，CCKS-2019：知识智能

专知会员服务

16+阅读 · 2019年10月25日

我的天，强化学习还能用在自动驾驶领域？

我的天，强化学习还能用在自动驾驶领域？

夕小瑶的卖萌屋

1+阅读 · 2022年3月24日

【唐建博士】知识图谱上的神经和符号逻辑推理，99页ppt

【唐建博士】知识图谱上的神经和符号逻辑推理，99页ppt

专知

19+阅读 · 2020年12月17日

八千字长文深度解读，迁移学习在强化学习中的应用及最新进展

八千字长文深度解读，迁移学习在强化学习中的应用及最新进展

机器之心

13+阅读 · 2019年10月17日

【微软亚研130PPT教程】强化学习简介

【微软亚研130PPT教程】强化学习简介

专知

36+阅读 · 2018年10月26日

【强化学习】易忽略的强化学习知识之基础知识及MDP

【强化学习】易忽略的强化学习知识之基础知识及MDP

产业智能官

19+阅读 · 2017年12月22日

【深度强化学习】深度强化学习揭秘

【深度强化学习】深度强化学习揭秘

产业智能官

21+阅读 · 2017年11月13日

【知识图谱】中文知识图谱构建方法研究

【知识图谱】中文知识图谱构建方法研究

产业智能官

99+阅读 · 2017年10月26日

课程 |《知识图谱》第一期

课程 |《知识图谱》第一期

开放知识图谱

22+阅读 · 2017年10月15日

肖仰华 | 基于知识图谱的问答系统

肖仰华 | 基于知识图谱的问答系统

开放知识图谱

29+阅读 · 2017年9月18日

深度 | 复旦肖仰华：基于知识图谱的问答系统

深度 | 复旦肖仰华：基于知识图谱的问答系统

全球人工智能

27+阅读 · 2017年9月7日

针对大规模环境下复杂任务的策略搜索强化学习方法研究

国家自然科学基金

41+阅读 · 2015年12月31日

面向大数据的知识表示、推理、在线学习理论及应用研究

国家自然科学基金

12+阅读 · 2014年12月31日

基于结构化方法的复杂研发项目多领域集成分析与优化研究

国家自然科学基金

2+阅读 · 2014年12月31日

基于描述逻辑的复杂本体非经典知识表示和推理研究

国家自然科学基金

1+阅读 · 2013年12月31日

基于贝叶斯推理的模糊逻辑强化学习模型研究

国家自然科学基金

18+阅读 · 2012年12月31日

基于图模型的海量非结构化数据查询语言及其优化实现

国家自然科学基金

0+阅读 · 2011年12月31日

多义性对象学习建模中若干问题的研究

国家自然科学基金

0+阅读 · 2011年12月31日

基于主动学习的半监督领域本体自动构建

国家自然科学基金

4+阅读 · 2009年12月31日

强化学习关键技术及其在机器人行为学习中的应用

国家自然科学基金

21+阅读 · 2009年12月31日

基于支持向量机的复杂连续系统强化学习控制研究

国家自然科学基金

11+阅读 · 2008年12月31日

WuDaoMM: A large-scale Multi-Modal Dataset for Pre-training models

Arxiv

0+阅读 · 2022年4月19日

Retrieve-then-extract Based Knowledge Graph Querying Using Graph Neural Networks

Arxiv

1+阅读 · 2022年4月15日

Adaptive Attentional Network for Few-Shot Knowledge Graph Completion

Arxiv

17+阅读 · 2020年10月19日

Embedding-based Retrieval in Facebook Search

Arxiv

12+阅读 · 2020年6月20日

Learning Conceptual-Contextual Embeddings for Medical Text

Arxiv

14+阅读 · 2020年3月12日

Learning to Propagate for Graph Meta-Learning

Arxiv

14+阅读 · 2019年9月11日

Learning Conceptual-Contexual Embeddings for Medical Text

Arxiv

27+阅读 · 2019年8月16日

Knowledge Representation Learning: A Quantitative Review

Knowledge Representation Learning: A Quantitative Review

Arxiv

28+阅读 · 2018年12月28日

Dynamic Graph Neural Networks

Arxiv

24+阅读 · 2018年10月24日

Notes on Deep Learning for NLP

Arxiv

22+阅读 · 2018年8月30日

阅读: 0 点赞: 0

小贴士

登录享主题订阅及个性化推荐

相关主题

终身强化学习

选择性知识迁移

热门VIP内容

开通专知VIP会员享更多权益服务

【博士论文】在低维和高维空间中分析、建模和转换潜在表征

从无人机到数据：揭示边缘计算作为新作战域

可解释人工智能的基础

大规模视觉模型中的基于提示的适应：综述

相关VIP内容

基于强化学习的推荐研究综述

基于强化学习的推荐研究综述

专知会员服务

84+阅读 · 2021年10月21日

【SIGIR2021教程】基于强化学习的信息检索

专知会员服务

28+阅读 · 2021年7月20日

【斯坦福-NLP-seminar】知识密集强化学习，72页ppt，Facebook TIM

专知会员服务

29+阅读 · 2021年4月27日

【AAAI2021】Lipschitz终身强化学习

专知会员服务

31+阅读 · 2020年12月14日

【斯坦福CS330】终身学习: 问题陈述，前后迁移，30页ppt

【斯坦福CS330】终身学习: 问题陈述，前后迁移，30页ppt

专知会员服务

26+阅读 · 2020年12月13日

【2020新书】基于人工智能的机器人安全学习和控制，138页pdf

【2020新书】基于人工智能的机器人安全学习和控制，138页pdf

专知会员服务

52+阅读 · 2020年12月12日

多智能体深度强化学习的若干关键科学问题

多智能体深度强化学习的若干关键科学问题

专知会员服务

194+阅读 · 2020年5月24日

【百度AutoDL教程】自动深度学习: 理论、算法、平台和应用，132PPT

【百度AutoDL教程】自动深度学习: 理论、算法、平台和应用，132PPT

专知会员服务

75+阅读 · 2020年2月4日

【报告】知识图谱中的关联搜索，南京大学计算机科学与技术系副教授| 程龚

【报告】知识图谱中的关联搜索，南京大学计算机科学与技术系副教授| 程龚

专知会员服务

126+阅读 · 2019年12月14日

第二代聊天机器人，加拿大滑铁卢大学李明教授，CCKS-2019：知识智能

第二代聊天机器人，加拿大滑铁卢大学李明教授，CCKS-2019：知识智能

专知会员服务

16+阅读 · 2019年10月25日

相关资讯

我的天，强化学习还能用在自动驾驶领域？

我的天，强化学习还能用在自动驾驶领域？

夕小瑶的卖萌屋

1+阅读 · 2022年3月24日

【唐建博士】知识图谱上的神经和符号逻辑推理，99页ppt

【唐建博士】知识图谱上的神经和符号逻辑推理，99页ppt

专知

19+阅读 · 2020年12月17日

八千字长文深度解读，迁移学习在强化学习中的应用及最新进展

八千字长文深度解读，迁移学习在强化学习中的应用及最新进展

机器之心

13+阅读 · 2019年10月17日

【微软亚研130PPT教程】强化学习简介

【微软亚研130PPT教程】强化学习简介

专知

36+阅读 · 2018年10月26日

【强化学习】易忽略的强化学习知识之基础知识及MDP

【强化学习】易忽略的强化学习知识之基础知识及MDP

产业智能官

19+阅读 · 2017年12月22日

【深度强化学习】深度强化学习揭秘

【深度强化学习】深度强化学习揭秘

产业智能官

21+阅读 · 2017年11月13日

【知识图谱】中文知识图谱构建方法研究

【知识图谱】中文知识图谱构建方法研究

产业智能官

99+阅读 · 2017年10月26日

课程 |《知识图谱》第一期

课程 |《知识图谱》第一期

开放知识图谱

22+阅读 · 2017年10月15日

肖仰华 | 基于知识图谱的问答系统

肖仰华 | 基于知识图谱的问答系统

开放知识图谱

29+阅读 · 2017年9月18日

深度 | 复旦肖仰华：基于知识图谱的问答系统

深度 | 复旦肖仰华：基于知识图谱的问答系统

全球人工智能

27+阅读 · 2017年9月7日

相关基金

针对大规模环境下复杂任务的策略搜索强化学习方法研究

国家自然科学基金

41+阅读 · 2015年12月31日

面向大数据的知识表示、推理、在线学习理论及应用研究

国家自然科学基金

12+阅读 · 2014年12月31日

基于结构化方法的复杂研发项目多领域集成分析与优化研究

国家自然科学基金

2+阅读 · 2014年12月31日

基于描述逻辑的复杂本体非经典知识表示和推理研究

国家自然科学基金

1+阅读 · 2013年12月31日

基于贝叶斯推理的模糊逻辑强化学习模型研究

国家自然科学基金

18+阅读 · 2012年12月31日

基于图模型的海量非结构化数据查询语言及其优化实现

国家自然科学基金

0+阅读 · 2011年12月31日

多义性对象学习建模中若干问题的研究

国家自然科学基金

0+阅读 · 2011年12月31日

基于主动学习的半监督领域本体自动构建

国家自然科学基金

4+阅读 · 2009年12月31日

强化学习关键技术及其在机器人行为学习中的应用

国家自然科学基金

21+阅读 · 2009年12月31日

基于支持向量机的复杂连续系统强化学习控制研究

国家自然科学基金

11+阅读 · 2008年12月31日

相关论文

WuDaoMM: A large-scale Multi-Modal Dataset for Pre-training models

Arxiv

0+阅读 · 2022年4月19日

Retrieve-then-extract Based Knowledge Graph Querying Using Graph Neural Networks

Arxiv

1+阅读 · 2022年4月15日

Adaptive Attentional Network for Few-Shot Knowledge Graph Completion

Arxiv

17+阅读 · 2020年10月19日

Embedding-based Retrieval in Facebook Search

Arxiv

12+阅读 · 2020年6月20日

Learning Conceptual-Contextual Embeddings for Medical Text

Arxiv

14+阅读 · 2020年3月12日

Learning to Propagate for Graph Meta-Learning

Arxiv

14+阅读 · 2019年9月11日

Learning Conceptual-Contexual Embeddings for Medical Text

Arxiv

27+阅读 · 2019年8月16日

Knowledge Representation Learning: A Quantitative Review

Knowledge Representation Learning: A Quantitative Review

Arxiv

28+阅读 · 2018年12月28日

Dynamic Graph Neural Networks

Arxiv

24+阅读 · 2018年10月24日

Notes on Deep Learning for NLP

Arxiv

22+阅读 · 2018年8月30日

微信扫码咨询专知VIP会员