每日论文 | 面向统计学的神经网络介绍;梯度下降一阶和二阶通用框架;对智能体进行快速调整的线上方法

2018 年 10 月 20 日 论智

1

Neural Networks:A Review from a Statistical Perspective

这篇论文为统计学专业的读者解释了神经网络的概念,其中有一些统计学方法论的链接,鼓励大家进行跨学科研究。在统计学中,有很多能够用神经网络模型解释。本文堪称经典论文,建议读者收藏阅读。

地址:https://www.jstor.org/stable/2246275?seq=1#page_scan_tab_contents

2

First-order and second-order variants of the gradient descent: a unified framework

在这篇文章中,我们对机器学习中常用的梯度下降方法的一阶和二阶变体做了大致总结,我们提出了一种通用框架,其中6种方法都可以看作同一种方法的不同实例。

地址:https://arxiv.org/abs/1810.08102

3

Fast deep reinforcement learning using online adjustments from the past

这篇论文中,DeepMind的研究人员提出了短期价值调整(EVA),这种方法能让深度强化学习智能体在缓冲期快速作出调整,改变神经网络的预测值。EVA将最近类似情景记忆的架构融合到强化学习智能体中。最终研究人员证明,EVA在执行任务以及玩雅达利游戏中都表现良好。

地址:https://arxiv.org/abs/1810.08163


登录查看更多
3

相关内容

统计学(Statistics)是研究收集、分析、解读、展示及组织(collection, analysis, interpretation, presentation and organization)数据的学科,通过量化地研究随机性,从而理解数据的产生机制,并进行判别、预测、优化、决策。统计学理论和方法是很多现代科学分支的支柱,其广泛的应用深刻地影响现代生活,具有代表性的应用领域包括: 生物/医学(生物统计学,基因统计学,生物信息学,制药学等)
社会学/环境学(社会统计学,心理学,人口学,空间统计学,环境统计学等)
工业工程学(质量控制,可靠性分析等)
经济学/金融学(精算学,金融统计学等)
工程学/计算机科学(统计学习,数据挖掘,信号/图像采样/处理等)
基础科学(统计物理学,统计化学等)
【硬核书】不完全信息决策理论,467页pdf
专知会员服务
354+阅读 · 2020年6月24日
多智能体深度强化学习的若干关键科学问题
专知会员服务
190+阅读 · 2020年5月24日
【Nature论文】深度网络中的梯度下降复杂度控制
专知会员服务
40+阅读 · 2020年3月9日
深度强化学习策略梯度教程,53页ppt
专知会员服务
182+阅读 · 2020年2月1日
专知会员服务
210+阅读 · 2019年8月30日
真正的神经网络,敢于不学习权重
机器之心
6+阅读 · 2019年6月13日
强化学习——蒙特卡洛方法介绍
论智
12+阅读 · 2018年6月3日
一文学习基于蒙特卡罗的强化学习方法(送书)
人工智能头条
7+阅读 · 2018年3月13日
开源神经网络框架Caffe2全介绍
人工智能学家
3+阅读 · 2017年12月11日
A Modern Introduction to Online Learning
Arxiv
21+阅读 · 2019年12月31日
Meta-Learning with Implicit Gradients
Arxiv
13+阅读 · 2019年9月10日
Few-shot Learning: A Survey
Arxiv
362+阅读 · 2019年4月10日
Few-shot Adaptive Faster R-CNN
Arxiv
3+阅读 · 2019年3月22日
Arxiv
136+阅读 · 2018年10月8日
Learning Recommender Systems from Multi-Behavior Data
Arxiv
5+阅读 · 2018年5月28日
VIP会员
相关论文
A Modern Introduction to Online Learning
Arxiv
21+阅读 · 2019年12月31日
Meta-Learning with Implicit Gradients
Arxiv
13+阅读 · 2019年9月10日
Few-shot Learning: A Survey
Arxiv
362+阅读 · 2019年4月10日
Few-shot Adaptive Faster R-CNN
Arxiv
3+阅读 · 2019年3月22日
Arxiv
136+阅读 · 2018年10月8日
Learning Recommender Systems from Multi-Behavior Data
Arxiv
5+阅读 · 2018年5月28日
Top
微信扫码咨询专知VIP会员