Standard models of biologically realistic, or inspired, reinforcement learning employ a global error signal which implies shallow networks. However, on the other hand, local learning rules allow networks with multiple layers. Here, we present a network combining local learning with global modulation where neuromodulation controls the amount of plasticity change in the whole network, while the sign of the error is passed via a bottom-up pathway through the network. Neuromodulation can be understood as a rectified error, or relevance, signal while the bottom-up sign of the error signal decides between long-term potentiation and long-term depression. We demonstrate the performance of this paradigm with a real robotic task as a proof of concept.


翻译:生物上现实的强化学习标准模型或受启发的强化学习标准模型采用全球错误信号,这意味着浅网络。但另一方面,地方学习规则允许多层网络。在这里,我们展示了一个将本地学习与全球调制相结合的网络,其中神经调制控制了整个网络的可塑性变化量,而错误的标志则通过网络的自下而上的路径传递。神经调制可以被理解为一个纠正错误或相关性的信号,而错误的自下而上的信号则决定长期强力和长期压抑之间的信号。我们用真正的机器人任务来证明概念。

0
下载
关闭预览

相关内容

Linux导论,Introduction to Linux,96页ppt
专知会员服务
82+阅读 · 2020年7月26日
强化学习最新教程,17页pdf
专知会员服务
182+阅读 · 2019年10月11日
【ICIG2021】Latest News & Announcements of the Tutorial
中国图象图形学学会CSIG
3+阅读 · 2021年12月20日
Hierarchically Structured Meta-learning
CreateAMind
27+阅读 · 2019年5月22日
Transferring Knowledge across Learning Processes
CreateAMind
29+阅读 · 2019年5月18日
Unsupervised Learning via Meta-Learning
CreateAMind
43+阅读 · 2019年1月3日
Capsule Networks解析
机器学习研究会
11+阅读 · 2017年11月12日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2008年12月31日
VIP会员
相关资讯
【ICIG2021】Latest News & Announcements of the Tutorial
中国图象图形学学会CSIG
3+阅读 · 2021年12月20日
Hierarchically Structured Meta-learning
CreateAMind
27+阅读 · 2019年5月22日
Transferring Knowledge across Learning Processes
CreateAMind
29+阅读 · 2019年5月18日
Unsupervised Learning via Meta-Learning
CreateAMind
43+阅读 · 2019年1月3日
Capsule Networks解析
机器学习研究会
11+阅读 · 2017年11月12日
相关基金
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2008年12月31日
Top
微信扫码咨询专知VIP会员