第5期智能自动化学科前沿讲习班于2018年05月31日-06月01日在中科院自动化所召开。本期专题关注的主题是“深度与宽度强化学习”。
今天为大家分享的是中国科学院自动化研究所研究员赵冬斌——《深度强化学习算法及应用》。
赵冬斌教授于2017年在中国矿业大学信息与控制工程学院作了名为《深度强化学习算法与应用》的报告,主要内容如下:
将具有“决策”能力的强化学习(RL: Reinforcement Learning)和具有“感知”能力的深度学习(DL: Deep Learning)相结合,形成深度强化学习(DRL: Deep RL)方法,成为人工智能的主要方法之一。2013年,谷歌DeepMind团队提出了一种DRL方法,在一些游戏上的实验效果接近或超过人类游戏玩家,成果发表在2015年的《Nature》上。2016年,相继发表了所开发的基于DRL的围棋算法AlphaGo,以5:0战胜了欧洲围棋冠军和超一流围棋选手李世石,使人工智能的水平达到了一个前所未有的高度。2017年初,AlphaGo的升级程序Master,与60名人类顶级围棋手比赛获得不败的战绩。在不完全信息博弈中,2017年初,阿尔伯塔大学采用了与AlphaGo相似的原理,开发的德州扑克人工智能DeepStack取得了骄人的胜绩,论文发表在《Science》上,标志着人工智能的又一个里程碑事件。2017年10月,DeepMind团队在《Nature》上发表的论文中提出了AlphaGo Zero,完全不用人类围棋棋谱而完胜最高水平的AlphaGo,再次刷新了人们的认识。DRL在视频游戏、博弈、自动驾驶、机器人、自然语言理解、智能医疗等领域的应用日益增多。本报告将介绍DRL的发展历程,主要方法和应用,以及我们在DRL方面的工作。
报告人简介
赵冬斌,博士,中国科学院自动化研究所研究员、博士生导师,中国科学院大学岗位教授。任IEEE计算智能学会北京分会主席,曾任自适应动态规划和强化学习技术委员会主席、多媒体委员会主席等。IEEE高级会员、自动化学会高级会员等。任领域顶级期刊IEEE TNNLS,IEEE CIM编委等,国际期刊特邀编辑10次,包括作为首席客座编委在IEEE TNNLS上组织深度强化学习专刊。多次在权威国际会议上担任要职。发表论文300余篇,授权国际发明专利1项、国家发明专利28项。主要研究方向为计算智能、深度强化学习、自适应动态规划、智能车辆、机器人、能源系统等。
往期文章推荐
🔗【重磅发布】《重要学术会议指南(2018)》可以在线阅读啦!
🔗 【IV18】第29届IEEE国际智能车大会将于6月26号召开
🔗 【【分会新闻】安控科技牵头起草的远程终端单元(RTU) 国家标准发布
🔗【重要通知】关于开展2018年CAA优秀博士学位论文奖励 及推荐工作的通知
🔗【通知】2018数博会智能制造论坛将于5月26日在贵阳召开!