每日论文 | 用循环世界模型改良策略进化；轻量级CNN：ChannelNets；强化学习知识点总结

2018 年 9 月 7 日 论智

Recurrent World Models Facilitate Policy Evolution

本文来自谷歌的David Ha，并将会在NIPS 2018上进行口头展示。这篇论文讲述了生成循环神经网络在无监督模式下快速得到训练，之后通过压缩后的时空表示建立了多种常见的强化学习环境模型。作者将World model提取出的特征输入到策略中，在多种环境下达到了领先的结果。

地址：https://arxiv.org/abs/1809.01999

ChannelNets: Compact and Efficient Convolutional Neural Networks via Channel-Wise Convolutions

卷积神经网络可以解决多种AI任务，但是模型体积越来越大，在很多资源有限的应用上都难以应用。在这篇文章中，我们提出用通道式的卷积对深度模型进行压缩，将特征映射中的密集连接换成CNN中稀疏的连接。基于此，我们创建了轻量级的CNN，成为ChannelNets。

地址：https://arxiv.org/abs/1809.01330

A (Long) Peek into Reinforcement Learning

这并不是一篇论文，而是作者Lilian Weng总结的有关强化学习的基础概念和经典算法，对新手来说是一份很详细的指南。文章非常长，建议收藏。

地址：https://lilianweng.github.io/lil-log/2018/02/19/a-long-peek-into-reinforcement-learning.html

登录查看更多

知识荟萃

精品入门和进阶教程、论文和代码整理等

查看相关VIP内容、论文、资讯等

【ICML2020-伯克利】反直觉！大模型重压缩提升Transformer的训练和推理效率，47页ppt

专知会员服务

70+阅读 · 2020年7月1日

【IJCAI2020】基于生成对抗模仿学习的多模态模仿学习算法框架

专知会员服务

58+阅读 · 2020年5月26日

【IJCAI2020-华为诺亚】面向深度强化学习的策略迁移框架

专知会员服务

28+阅读 · 2020年5月25日

紧凑的神经网络模型设计研究综述

专知会员服务

74+阅读 · 2020年5月21日

轻量级神经网络架构综述

专知会员服务

97+阅读 · 2020年4月29日

【Nature论文】深度网络中的梯度下降复杂度控制

专知会员服务

41+阅读 · 2020年3月9日

「强化学习之路」清华博士后解读83篇文献，万字长文总结

专知会员服务

67+阅读 · 2020年2月28日

【反馈循环自编码器】FEEDBACK RECURRENT AUTOENCODER

专知会员服务

23+阅读 · 2020年1月28日

深度神经网络模型压缩与加速综述

专知会员服务

129+阅读 · 2019年10月12日

MIT新书《强化学习与最优控制》

专知会员服务

280+阅读 · 2019年10月9日

计算机视觉知识点总结

极市平台

18+阅读 · 2019年4月16日

每日论文 | 用卷积网络恢复模糊图像；面向语义分割的域适应；动态图形神经网络

论智

4+阅读 · 2018年10月29日

每日论文 | 反向强化学习在电子游戏中的应用；用数学理论解释语义现象；在4k和8k视频上进行目标检测

论智

3+阅读 · 2018年10月27日

基础目标检测算法介绍（一）：CNN、RCNN、Fast RCNN和Faster RCNN

论智

16+阅读 · 2018年10月16日

每日论文 | 成功复现深度强化学习的关键因素；对SRGAN进行改善提出ESRGAN；能进行推理问答的生成式多跳QA任务

论智

8+阅读 · 2018年9月19日

每日论文 | 为智能体创建的综合平台Unity；删除无用样本有助于提高CNN性能；神经网络推荐算法总结

论智

3+阅读 · 2018年9月11日

专访 | 小白也能搭建深度模型，百度EasyDL的背后你知多少

机器之心

3+阅读 · 2018年9月10日

机器学习、深度学习知识点总结及面试题

全球人工智能

17+阅读 · 2018年1月4日

强化学习族谱

CreateAMind

26+阅读 · 2017年8月2日

卷积神经网络(CNN)学习笔记1：基础入门

黑龙江大学自然语言处理实验室

14+阅读 · 2016年6月16日

Graph Neural Networks: A Review of Methods and Applications

Arxiv

5+阅读 · 2019年7月10日

Residual Non-local Attention Networks for Image Restoration

Arxiv

9+阅读 · 2019年3月24日

CapsuleGAN: Generative Adversarial Capsule Network

Arxiv

4+阅读 · 2018年9月25日

Neural Architecture Search: A Survey

Arxiv

12+阅读 · 2018年9月5日

MnasNet: Platform-Aware Neural Architecture Search for Mobile

Arxiv

4+阅读 · 2018年7月31日

ShuffleNet V2: Practical Guidelines for Efficient CNN Architecture Design

Arxiv

4+阅读 · 2018年7月30日

Relational Deep Reinforcement Learning

Arxiv

10+阅读 · 2018年6月28日

DARTS: Differentiable Architecture Search

Arxiv

3+阅读 · 2018年6月24日

Multilingual Sentiment Analysis: An RNN-Based Framework for Limited Data

Arxiv

12+阅读 · 2018年6月8日

Learning Human Pose Models from Synthesized Data for Robust RGB-D Action Recognition

Arxiv

3+阅读 · 2018年5月1日

VIP会员

每日论文 | 用循环世界模型改良策略进化；轻量级CNN：ChannelNets；强化学习知识点总结

相关内容

知识荟萃

更多