每日论文 | 反向强化学习在电子游戏中的应用;用数学理论解释语义现象;在4k和8k视频上进行目标检测

2018 年 10 月 27 日 论智

1

Inverse reinforcement learning for video games

深度强化学习在很多电子游戏中都超越了人类表现,但都需要人类手动设计一个奖励函数。通常,对目标行为做示范比设计奖励函数要容易。反向强化学习算法可以在低维连续控制环境中,从示范中推断出奖励,但在高维的视频游戏中,这种方法少有人用。在我们的CNN-AIRL基准环境中,我们对目前的对抗反向强化学习进行修正,用CNN作为生成器和判别器。为了稳定训练,我们对奖励进行正则化,并提高判别器训练数据集的尺寸。

地址:https://arxiv.org/abs/1810.10593

2


A mathematical theory of semantic development in deep neural networks

大量研究都解释了人类语义知识的获取、组织、应用和神经表示都有着显著的规律,所以这里有一个基本概念问题,即空针神经网络获取、组织、应用这些知识的能力是怎样的?为了解决这个问题,我们通过数学方法分析了深度线性网络在学习时的非线性活动,我们找到了对这些在语义认知中出现的各种现象的解释。

地址:https://arxiv.org/abs/1810.10531

3

Fast and accurate object detection in high resolution 4K and 8K video using GPUs

机器学习在计算机视觉上取得了很大成功,比如目标检测。但是传统的模型都是在相对较低的分辨率图像上完成的。随着设备的进步,出现了大量高分辨率的数据。我们提出了一种方法,对每张图像或视频进行两次状态评估,每个状态上我们会用YOLO v2进行快速目标检测。

地址:https://arxiv.org/abs/1810.10551

登录查看更多
3

相关内容

强化学习(RL)是机器学习的一个领域,与软件代理应如何在环境中采取行动以最大化累积奖励的概念有关。除了监督学习和非监督学习外,强化学习是三种基本的机器学习范式之一。 强化学习与监督学习的不同之处在于,不需要呈现带标签的输入/输出对,也不需要显式纠正次优动作。相反,重点是在探索(未知领域)和利用(当前知识)之间找到平衡。 该环境通常以马尔可夫决策过程(MDP)的形式陈述,因为针对这种情况的许多强化学习算法都使用动态编程技术。经典动态规划方法和强化学习算法之间的主要区别在于,后者不假设MDP的确切数学模型,并且针对无法采用精确方法的大型MDP。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
《强化学习》简介小册,24页pdf
专知会员服务
272+阅读 · 2020年4月19日
【综述】自动驾驶领域中的强化学习,附18页论文下载
专知会员服务
172+阅读 · 2020年2月8日
斯坦福&谷歌Jeff Dean最新Nature论文:医疗深度学习技术指南
文本+视觉,多篇 Visual/Video BERT 论文介绍
AI科技评论
22+阅读 · 2019年8月30日
ECCV 2018 | CornerNet:目标检测算法新思路
极市平台
13+阅读 · 2018年8月11日
【强化学习】强化学习/增强学习/再励学习介绍
产业智能官
10+阅读 · 2018年2月23日
我用Python实现了12500张猫狗图像的精准分类
51CTO博客
4+阅读 · 2018年1月12日
【论文】深度学习的数学解释
机器学习研究会
10+阅读 · 2017年12月15日
【强化学习】如何开启强化学习的大门?
产业智能官
13+阅读 · 2017年9月10日
ViZDoom Competitions: Playing Doom from Pixels
Arxiv
5+阅读 · 2018年9月10日
Arxiv
3+阅读 · 2018年6月24日
Arxiv
5+阅读 · 2018年6月5日
Arxiv
5+阅读 · 2018年5月16日
Arxiv
6+阅读 · 2018年2月6日
Arxiv
7+阅读 · 2018年1月24日
Arxiv
13+阅读 · 2017年12月5日
VIP会员
相关论文
ViZDoom Competitions: Playing Doom from Pixels
Arxiv
5+阅读 · 2018年9月10日
Arxiv
3+阅读 · 2018年6月24日
Arxiv
5+阅读 · 2018年6月5日
Arxiv
5+阅读 · 2018年5月16日
Arxiv
6+阅读 · 2018年2月6日
Arxiv
7+阅读 · 2018年1月24日
Arxiv
13+阅读 · 2017年12月5日
Top
微信扫码咨询专知VIP会员