Neural Networks:A Review from a Statistical Perspective
这篇论文为统计学专业的读者解释了神经网络的概念,其中有一些统计学方法论的链接,鼓励大家进行跨学科研究。在统计学中,有很多能够用神经网络模型解释。本文堪称经典论文,建议读者收藏阅读。
地址:https://www.jstor.org/stable/2246275?seq=1#page_scan_tab_contents
First-order and second-order variants of the gradient descent: a unified framework
在这篇文章中,我们对机器学习中常用的梯度下降方法的一阶和二阶变体做了大致总结,我们提出了一种通用框架,其中6种方法都可以看作同一种方法的不同实例。
地址:https://arxiv.org/abs/1810.08102
Fast deep reinforcement learning using online adjustments from the past
这篇论文中,DeepMind的研究人员提出了短期价值调整(EVA),这种方法能让深度强化学习智能体在缓冲期快速作出调整,改变神经网络的预测值。EVA将最近类似情景记忆的架构融合到强化学习智能体中。最终研究人员证明,EVA在执行任务以及玩雅达利游戏中都表现良好。
地址:https://arxiv.org/abs/1810.08163