【NeurIPS 2020】优化算法升迁深化学习效率

2020 年 11 月 10 日 专知

网易伏羲实验室的论文《学习行使犒赏塑形:犒赏塑形的新方式》(《Learning to Utilize Shaping Rewards: A New Approach of Reward Shaping》)入选,凸显了国际顶尖的科研实力。

网易伏羲在论文中重点钻研的“犒赏塑 形 ”( Reward Shaping )是一栽将先验知识转化为奖励函数,从而挑深邃化学习算法效率的有效技术手腕。 现在,网易伏羲的深化学习技术已成功在《潮人篮球》、《叛变寒》等游玩中落地,而行使先验知识来设计和组织有效的附添奖励函数往往是项现在能够取得挺进的关键之一。


不过,追求卓异的附添奖励函数必要比较专科的周围知识以及一再迭代的人力投入。同时,原由涉及到人的操作,现在的一些形式将规则性的知识转化为算法能够理解的数值奖励时,往往也会将人的认知误差引入其中,对深化学习算法带来负面的影响。举例来说,在设计《潮人篮球》游玩机器人的附添奖励函数时,倘若把握不益对传球行为的奖励值的大幼,比赛中将会展现球员之间一向进走相互传球而不袭击的为难场面。


为了避免上述题目,网易伏羲此次入选的论文始次挑出自适宜地行使给定的附添奖励函数的形式,让学习算法能判定分歧状态下对答附添奖励的益坏,并选择性地添以行使。


在幼车立杆和MuJoCo环境的一系列实验终局外明,网易伏羲所挑出的算法,不光能够分辨出附添奖励的益坏并选择性地行使,甚至还能够将有害的奖励值转化为对学习有协助的奖励值。

浅易来说,网易伏羲挑出的算法不光能让人造智能的深化学习效率变高,还能协助人造智能筛选出准确的知识,让人造智能 的 学习 更添 实在 。


https://arxiv.org/abs/2011.02669




专知便捷查看

便捷下载,请关注专知公众号(点击上方蓝色专知关注)

  • 后台回复“RSL” 可以获取《【NeurIPS 2020】优化算法升迁深化学习效率》专知下载链接索引

专知,专业可信的人工智能知识分发,让认知协作更快更好!欢迎注册登录专知www.zhuanzhi.ai,获取5000+AI主题干货知识资料!
欢迎微信扫一扫加入专知人工智能知识星球群,获取最新AI专业干货知识教程资料和与专家交流咨询
点击“ 阅读原文 ”,了解使用 专知 ,查看获取5000+AI主题知识资源
登录查看更多
0

相关内容

专知会员服务
27+阅读 · 2020年12月15日
【NeurIPS 2020】深度学习的不确定性估计和鲁棒性
专知会员服务
49+阅读 · 2020年12月8日
专知会员服务
8+阅读 · 2020年11月27日
专知会员服务
124+阅读 · 2020年11月15日
专知会员服务
28+阅读 · 2020年10月24日
【NeurIPS 2020 】神经网络结构生成优化
专知会员服务
20+阅读 · 2020年10月24日
最新《生成式对抗网络数学导论》,30页pdf
专知会员服务
78+阅读 · 2020年9月3日
普林斯顿大学经典书《在线凸优化导论》,178页pdf
专知会员服务
184+阅读 · 2020年2月3日
【NeurIPS 2020】核基渐进蒸馏加法器神经网络
专知
13+阅读 · 2020年10月19日
【初学者指南】神经网络中的数学
专知
32+阅读 · 2019年12月16日
深度学习之路——论文阅读
专知
11+阅读 · 2018年9月29日
Arxiv
0+阅读 · 2021年1月22日
Learning From Positive and Unlabeled Data: A Survey
Arxiv
5+阅读 · 2018年11月12日
Arxiv
5+阅读 · 2018年5月28日
Arxiv
5+阅读 · 2017年12月14日
VIP会员
相关VIP内容
专知会员服务
27+阅读 · 2020年12月15日
【NeurIPS 2020】深度学习的不确定性估计和鲁棒性
专知会员服务
49+阅读 · 2020年12月8日
专知会员服务
8+阅读 · 2020年11月27日
专知会员服务
124+阅读 · 2020年11月15日
专知会员服务
28+阅读 · 2020年10月24日
【NeurIPS 2020 】神经网络结构生成优化
专知会员服务
20+阅读 · 2020年10月24日
最新《生成式对抗网络数学导论》,30页pdf
专知会员服务
78+阅读 · 2020年9月3日
普林斯顿大学经典书《在线凸优化导论》,178页pdf
专知会员服务
184+阅读 · 2020年2月3日
相关资讯
【NeurIPS 2020】核基渐进蒸馏加法器神经网络
专知
13+阅读 · 2020年10月19日
【初学者指南】神经网络中的数学
专知
32+阅读 · 2019年12月16日
深度学习之路——论文阅读
专知
11+阅读 · 2018年9月29日
Top
微信扫码咨询专知VIP会员