今日 Paper | 3D门控递归融合;双注意力GAN;通用目标检测器;无监督域自适应等

2020 年 2 月 27 日 AI科技评论

  目录

用于语义场景完成的3D门控递归融合

用于大姿态人脸正面化的双注意力GAN

Universal-RCNN:基于可转移图R-CNN的通用目标检测器

用于图像深度估计的无监督域自适应

嵌套命名实体识别的神经分层模型

  用于语义场景完成的3D门控递归融合

论文名称:3D Gated Recurrent Fusion for Semantic Scene Completion

作者:Liu Yu /Li Jie /Yan Qingsen /Yuan Xia /Zhao Chunxia /Reid Ian /Cadena Cesar

发表时间:2020/2/17

论文链接:https://arxiv.org/abs/2002.07269

推荐原因

这篇论文要解决的是语义场景补全任务中的数据融合问题。

RGB图像包含对象的纹理细节,而深度图像能捕获与形状补全任务具有高度相关性的几何线索,因此同时使用RGB和深度图像可以进一步提高语义场景补全模型的精度。基于此,这篇论文提出了名为GRFNet的3D门控递归融合网络,该网络可以自适应地选择并通过使用门和存储模块来融合深度图像和RGB的相关信息。在单级融合的基础上,这篇论文还进一步提出了一种多级融合策略,可以对网络中不同级之间的相关性进行建模。在两个基准数据集上进行的实验证明了GRFNet在语义场景补全任务中进行数据融合优于现有的方法。

  用于大姿态人脸正面化的双注意力GAN

论文名称:Dual-Attention GAN for Large-Pose Face Frontalization

作者:Yin Yu /Jiang Songyao /Robinson Joseph P. /Fu Yun

发表时间:2020/2/17

论文链接:https://arxiv.org/abs/2002.07227

推荐原因

这篇论文要解决的是人脸正面化的问题。

人脸正面化为人脸数据的增强提供了一种有效的方法,进一步提高了极端姿势场景下的人脸识别性能。这篇论文提出了一种新的双注意力生成对抗网络(DA-GAN),通过在GAN训练过程中同时捕捉上下文相关性和局部一致性来实现真实感人脸正面化。DA-GAN包含一种基于自注意力的生成器,来集成具有远距离依赖性的局部特征以产生更好的特征表示和一个基于面部注意力的新型判别器,用于强调人脸区域的局部特征,从而增强了合成正面人脸的真实感。

  Universal-RCNN:基于可转移图R-CNN的通用目标检测器

论文名称:Universal-RCNN: Universal Object Detector via Transferable Graph R-CNN

作者:Xu Hang /Fang Linpu /Liang Xiaodan /Kang Wenxiong /Li Zhenguo

发表时间:2020/2/18

论文链接:https://arxiv.org/abs/2002.07417

推荐原因

这篇论文要解决的是通用对象检测的问题。

这篇论文提出了一种名为Universal-RCNN的新的通用对象检测器,结合图迁移学习可在多个数据集之间传播相关语义信息,以达到语义一致性。Universal-RCNN首先通过整合所有类的所有高级语义表示来生成全局语义池。然后,域内推理模块在空间感知图卷积网络指引下的一个数据集中学习并传播稀疏图表示。最后,Universal-RCNN中的域间传输模块利用所有域之间的多种传输依赖关系,通过全局参与和传输语义上下文来增强区域特征表示。大量实验表明,Universal-RCNN明显优于现有的多分支模型,并在多对象检测基准上达到最新水平。

  用于图像深度估计的无监督域自适应

论文名称:Unsupervised Domain Adaptation for Depth Prediction from Images

作者:Tonioni Alessio /Poggi Matteo /Mattoccia Stefano /Di Stefano Luigi

发表时间:2019/9/9

论文链接:https://arxiv.org/abs/1909.03943v1

推荐原因

论文的目标是利用无监督算法,将在大量合成数据上预训练的深度模型迁移到没有标签监督的目标域上来。作者首先利用传统的深度估计算法为目标域的图像标记含有噪声的伪标签,并生成一个逐像素的置信图。论文的创新点在于提出了一种新颖的置信度引导损失函数,它用来衡量哪些像素需要纳入深度模型预测出的深度值与传统方法计算出的深度值的误差中。作者还将控制用来计算损失的像素值的超参数设置成一个可学习的变量,进一步提升了模型的泛化能力。论文被TPAMI接收,为无监督深度估计算法提供了新的解决思路。

  嵌套命名实体识别的神经分层模型 

论文名称:A Neural Layered Model for Nested Named Entity Recognition

作者:Meizhi Ju /Makoto Miwa /Sophia Ananiadou

发表时间:2018/6/1

论文链接:https://www.aclweb.org/anthology/N18-1131.pdf

推荐原因

1. 本文解决了大多数命名实体识别系统不能有效处理内部嵌套实体的问题,如在生物医药领域,嵌套实体出现非常频繁,使用本文提出的方法可以在此背景下捕获更细粒度的语义信息。

2. 本文提出了一种动态分层模型,能够充分利用内部实体信息来加强外部实体的识别。模型基于由LSTM和CRF组成的flat NER层,因此模型能够捕获输入序列的上下文表示,并在不依赖于特征工程的情况下在flat NER层上全局解码预测标签。该模型针对于特定数据集(具有多种类别和嵌套的实体),嵌套的实体越多层次越深,实验效果越好。

3. 本文所提出的模型针对自然语言处理中命名实体识别问题,能够改善嵌套实体识别的情况,而实体识别是之后如实体对齐,构建知识图谱等问题的基础,因而意义很大。

  论文作者团队招募

为了更好地服务广大 AI 青年,AI 研习社正式推出全新「论文」版块,希望以论文作为聚合 AI 学生青年的「兴趣点」,通过论文整理推荐、点评解读、代码复现。致力成为国内外前沿研究成果学习讨论和发表的聚集地,也让优秀科研得到更为广泛的传播和认可。

我们希望热爱学术的你,可以加入我们的论文作者团队。

加入论文作者团队你可以获得

    1.署着你名字的文章,将你打造成最耀眼的学术明星

    2.丰厚的稿酬

    3.AI 名企内推、大会门票福利、独家周边纪念品等等等。

加入论文作者团队你需要:

    1.将你喜欢的论文推荐给广大的研习社社友

    2.撰写论文解读

如果你已经准备好加入 AI 研习社的论文兼职作者团队,可以添加运营小姐姐的微信(ID:julylihuaijiang),备注“论文兼职作者”

登录查看更多
1

相关内容

【CVPR2020】时序分组注意力视频超分
专知会员服务
30+阅读 · 2020年7月1日
【CVPR2020】图神经网络中的几何原理连接
专知会员服务
56+阅读 · 2020年4月8日
近期必读的7篇 CVPR 2019【视觉问答】相关论文和代码
专知会员服务
35+阅读 · 2020年1月10日
近期必读的9篇 CVPR 2019【视觉目标跟踪】相关论文和代码
必读的10篇 CVPR 2019【生成对抗网络】相关论文和代码
专知会员服务
32+阅读 · 2020年1月10日
五篇 ICCV 2019 的【图神经网络(GNN)+CV】相关论文
专知会员服务
14+阅读 · 2020年1月9日
ICCV 2019 | 精确的端到端的弱监督目标检测网络
AI科技评论
11+阅读 · 2019年12月9日
用于RGB-D室内场景语义分割的门式融合局部感知反卷积网络
机器学习研究会
7+阅读 · 2017年10月30日
Self-Attention Graph Pooling
Arxiv
13+阅读 · 2019年6月13日
Arxiv
19+阅读 · 2019年4月5日
Arxiv
6+阅读 · 2019年3月19日
Arxiv
8+阅读 · 2019年2月15日
Arxiv
9+阅读 · 2018年5月24日
Arxiv
13+阅读 · 2017年12月5日
VIP会员
相关VIP内容
Top
微信扫码咨询专知VIP会员