项目名称: 基于逆向强化学习和人工智能的移动机器人自主学习方法研究

项目编号: No.61305121

项目类型: 青年科学基金项目

立项/批准年度: 2014

项目学科: 自动化技术、计算机技术

项目作者: 李德才

作者单位: 中国科学院沈阳自动化研究所

项目金额: 23万元

中文摘要: 移动机器人在复杂环境下的自主运动往往十分困难。因此如何提升机器人的智能水平,增强其在不确定环境下的自主行为能力具有较强的理论价值与现实意义。本项目针对逆向强化学习在示教策略有限和不确定条件下可能导致的学习精度不高、计算效率低下等问题,对下列内容进行研究:1)采用回声状态网络、极端学习机等智能方法建立回报函数模型。在此基础上,根据模型结构建立适当的惩罚函数,将状态特征选择同建模算法相结合,提出全新的回报函数表示方法;2)针对示教策略的不确定性,通过引入对噪声和异常点具有鲁棒性的似然函数,实现对示教轨迹中干扰信号的识别和抑制。并进一步,根据非最优示教轨迹来逼近理想情况下的回报函数;3)在研究内容1)和2)的基础上,建立面向多自主体的逆向强化学习方法,以克服单个机器人工作能力有限的问题。本项目将逆向强化学习方法与人工智能相结合,为复杂环境下移动机器人的自主学习问题提供了新的思路和方法。

中文关键词: 逆向强化学习;人工智能;移动机器人;自主学习;

英文摘要: It is a difficult mission to realize autonomous behavior of mobile robots with complex environment. Hence, how to enhance the intelligence level of robots as well as its capability of autonomous behavior with uncertainness environment have significant theoretical value and practical meaning. Regarding the finite and uncertain demonstrators in the inverse reinforcement learning and the problems they might lead to, the project focus on the following aspects: 1) Applying machine learning methods, such as echo state network and extreme learning machine to establish reward function model. Then, combing state feature selection and modeling method by constructing appropriate penalty function and propose a novel approach for reward function representation. 2) For the uncertainness of the demonstrators, the influence of interference signal in the demonstrator trajectory can be restricted by employing appropriate likelihood function which is robust to noise and outliers. In this case, reward function with ideal demonstrator trajectories can be approximated by using suboptimal ones. 3) Based on the research contents 1) and 2), multi-agent inverse reinforcement learning method will be investigated in order to overcome the limited operational capability of single robot. This project combines the inverse reinforcement learnin

英文关键词: inverse reinforcement learning;artificial intelligence;mobile robot;autonomous learning;

成为VIP会员查看完整内容
12

相关内容

斯坦福大学最新【强化学习】2022课程,含ppt
专知会员服务
124+阅读 · 2022年2月27日
基于强化学习的推荐研究综述
专知会员服务
83+阅读 · 2021年10月21日
专知会员服务
61+阅读 · 2021年4月22日
【斯坦福经典书】强化学习在金融应用,414页pdf
专知会员服务
122+阅读 · 2021年3月30日
专知会员服务
83+阅读 · 2020年12月11日
【康奈尔】最新《强化学习基础》CS 6789课程
专知会员服务
67+阅读 · 2020年9月27日
多智能体深度强化学习的若干关键科学问题
专知会员服务
186+阅读 · 2020年5月24日
基于自监督的可逆性强化学习方法
AI前线
4+阅读 · 2021年12月3日
深入理解强化学习,看这篇就够了
PaperWeekly
5+阅读 · 2021年11月28日
深度强化学习入门,这一篇就够了!
机器学习算法与Python学习
27+阅读 · 2018年8月17日
干货|浅谈强化学习的方法及学习路线
机器学习算法与Python学习
16+阅读 · 2018年3月28日
【强化学习】强化学习+深度学习=人工智能
产业智能官
52+阅读 · 2017年8月11日
国家自然科学基金
20+阅读 · 2015年12月31日
国家自然科学基金
37+阅读 · 2015年12月31日
国家自然科学基金
14+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2013年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
17+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2011年12月31日
国家自然科学基金
21+阅读 · 2009年12月31日
国家自然科学基金
45+阅读 · 2009年12月31日
Arxiv
0+阅读 · 2022年4月20日
Directional Graph Networks
Arxiv
27+阅读 · 2020年12月10日
A Multi-Objective Deep Reinforcement Learning Framework
Arxiv
11+阅读 · 2018年4月25日
小贴士
相关VIP内容
斯坦福大学最新【强化学习】2022课程,含ppt
专知会员服务
124+阅读 · 2022年2月27日
基于强化学习的推荐研究综述
专知会员服务
83+阅读 · 2021年10月21日
专知会员服务
61+阅读 · 2021年4月22日
【斯坦福经典书】强化学习在金融应用,414页pdf
专知会员服务
122+阅读 · 2021年3月30日
专知会员服务
83+阅读 · 2020年12月11日
【康奈尔】最新《强化学习基础》CS 6789课程
专知会员服务
67+阅读 · 2020年9月27日
多智能体深度强化学习的若干关键科学问题
专知会员服务
186+阅读 · 2020年5月24日
相关资讯
基于自监督的可逆性强化学习方法
AI前线
4+阅读 · 2021年12月3日
深入理解强化学习,看这篇就够了
PaperWeekly
5+阅读 · 2021年11月28日
深度强化学习入门,这一篇就够了!
机器学习算法与Python学习
27+阅读 · 2018年8月17日
干货|浅谈强化学习的方法及学习路线
机器学习算法与Python学习
16+阅读 · 2018年3月28日
【强化学习】强化学习+深度学习=人工智能
产业智能官
52+阅读 · 2017年8月11日
相关基金
国家自然科学基金
20+阅读 · 2015年12月31日
国家自然科学基金
37+阅读 · 2015年12月31日
国家自然科学基金
14+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2013年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
17+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2011年12月31日
国家自然科学基金
21+阅读 · 2009年12月31日
国家自然科学基金
45+阅读 · 2009年12月31日
微信扫码咨询专知VIP会员