每日论文 | 成功复现深度强化学习的关键因素;对SRGAN进行改善提出ESRGAN;能进行推理问答的生成式多跳QA任务

2018 年 9 月 19 日 论智

1

Deterministic Implementations for Reproducibility in Deep Reinforcement Learning

虽然深度强化学习近几年在很多任务上都取得了成功,但是像重新复盘还是非常困难的。深度强化学习复盘过程中最大的挑战之一就是训练过程中的非决定性(nondeterminism),会严重影响结果。针对这一问题,我们研究了在训练中删除非决定性机制后,决定方法的积极影响。我们以深度Q-learning算法为例,通过在训练过程中确定并控制所有的非决定性机制,生成一种决定性方法。我们发现这样的确会影响智能体的性能。

地址:https://arxiv.org/abs/1809.05676

2

ESRGAN: Enhanced Super-Resolution Generative Adversarial Networks

超级像素生成对抗网络(SRGAN)是一项重要的研究,它能用单一图片的超像素生成现实结构。但是,生成的结果总有人工痕迹。为了进一步提高视觉效果,我们研究了SRGAN的网络结构、对抗损失和感知损失,对其分别进行了改善,并提出了ESRGAN。

地址:https://arxiv.org/abs/1809.00219

3

Commonsense for Generative Multi-Hop Question Answering Tasks

最近有很多有关阅读理解的QA任务,但大多数研究都只关注提取信息。而我们转而关注更有挑战性的“多跳生成任务”,这就需要模型进行推理、总结、合成信息,生成答案。这就需要了解潜在的关系,通过背景知识进行推理。

地址:https://arxiv.org/abs/1809.06309

登录查看更多
8

相关内容

【IJCAI2020-CMU】结构注意力的神经抽象摘要
专知会员服务
21+阅读 · 2020年4月23日
因果关联学习,Causal Relational Learning
专知会员服务
182+阅读 · 2020年4月21日
【综述】基于图的对抗式攻击和防御,附22页论文下载
专知会员服务
68+阅读 · 2020年3月5日
生成式对抗网络GAN异常检测
专知会员服务
114+阅读 · 2019年10月13日
【学界】DeepMind论文:深度压缩感知,新框架提升GAN性能
GAN生成式对抗网络
14+阅读 · 2019年5月23日
DeepMind论文:深度压缩感知,新框架提升GAN性能
极市平台
4+阅读 · 2019年5月23日
问答系统冠军之路:用CNN做问答任务的QANet
AI科技评论
18+阅读 · 2018年5月11日
SRGAN论文笔记
统计学习与视觉计算组
109+阅读 · 2018年4月12日
论文动态 | 基于知识图谱的问答系统关键技术研究 #04
开放知识图谱
10+阅读 · 2017年7月9日
Question Generation by Transformers
Arxiv
5+阅读 · 2019年9月14日
Arxiv
19+阅读 · 2019年4月5日
Arxiv
4+阅读 · 2018年9月25日
Arxiv
8+阅读 · 2018年5月21日
Arxiv
5+阅读 · 2018年5月1日
VIP会员
Top
微信扫码咨询专知VIP会员