每日论文|单眼3D对象检测的正交特征变换;CRNN音源分离;何凯明:ImageNet预训练未必那么好

2018 年 11 月 25 日 论智

Orthographic Feature Transform for Monocular 3D Object Detection

基于单眼图像进行3D对象检测是一项极具挑战性的工作,因为现有系统基本完全依赖单眼图像的视角,其中物体的形状和大小都可能有比较大的变形,深度和距离也不易推测。剑桥大学的Thomas Roddick等提出了一种基于端到端深度学习模型的正交特征变换,将图像特征映射至3D空间。这项工作在KITTI 3D对象评测上取得了当前最优的表现。

地址:https://arxiv.org/abs/1811.08188


Low Latency Sound Source Separation Using Convolutional
Recurrent Neural Networks

芬兰坦佩雷理工大学和助听器生产商Oticon研发中心Eriksholm合作,研究如何基于卷积循环神经网络分离音源。研究人员Gaurav Naithani等结合了卷积层和LSTM层,在低延迟(< 10ms)、可用训练数据相对较小的条件下,表现超过前馈深度神经网络和LSTM网络。这一方法的动机是使用卷积层学习输入的时频表示的时空结构,使用LSTM层利用长时上下文。

地址:http://www.cs.tut.fi/~tuomasv/papers/PID4978439.pdf


Rethinking ImageNet Pre-training

FAIR何凯明最新翻案,计算机视觉领域习以为常的做法,深度迁移学习的经典例子,ImageNet预训练怕是没有大家想象的那么好。ImageNet还是有用的,可以加速收敛,但是除非目标任务的数据十分匮乏,你别指望它提升表现,或者防止过拟合。想要提升表现,老老实实标注图像才是王道。

地址:https://arxiv.org/abs/1811.08883



登录查看更多
3

相关内容

【KDD2020】自适应多通道图卷积神经网络
专知会员服务
119+阅读 · 2020年7月9日
3D目标检测进展综述
专知会员服务
191+阅读 · 2020年4月24日
专知会员服务
31+阅读 · 2020年4月24日
【CVPR2020】L2 ^GCN:图卷积网络的分层学习高效训练
专知会员服务
37+阅读 · 2020年3月31日
BERT进展2019四篇必读论文
专知会员服务
67+阅读 · 2020年1月2日
利用神经网络进行序列到序列转换的学习
AI研习社
12+阅读 · 2019年4月26日
从FPN到Mask R-CNN,一文告诉你Facebook的计算机视觉有多强
人工智能头条
6+阅读 · 2018年3月20日
基于深度学习的图像目标检测(下)
机器学习研究会
12+阅读 · 2018年1月1日
专栏 | CVPR 2017论文解读:特征金字塔网络FPN
机器之心
8+阅读 · 2017年7月25日
Question Generation by Transformers
Arxiv
5+阅读 · 2019年9月14日
Universal Transformers
Arxiv
5+阅读 · 2019年3月5日
Arxiv
12+阅读 · 2019年1月24日
Arxiv
6+阅读 · 2018年7月9日
Arxiv
3+阅读 · 2018年6月1日
Arxiv
5+阅读 · 2018年1月29日
Arxiv
13+阅读 · 2017年12月5日
VIP会员
相关VIP内容
相关论文
Question Generation by Transformers
Arxiv
5+阅读 · 2019年9月14日
Universal Transformers
Arxiv
5+阅读 · 2019年3月5日
Arxiv
12+阅读 · 2019年1月24日
Arxiv
6+阅读 · 2018年7月9日
Arxiv
3+阅读 · 2018年6月1日
Arxiv
5+阅读 · 2018年1月29日
Arxiv
13+阅读 · 2017年12月5日
Top
微信扫码咨询专知VIP会员