今日 Paper | 3D门控递归融合；双注意力GAN；通用目标检测器；无监督域自适应等

会员服务 ·

今日 Paper | 3D门控递归融合；双注意力GAN；通用目标检测器；无监督域自适应等

2020 年 2 月 27 日 AI科技评论

用于语义场景完成的3D门控递归融合

论文名称：3D Gated Recurrent Fusion for Semantic Scene Completion

作者：Liu Yu /Li Jie /Yan Qingsen /Yuan Xia /Zhao Chunxia /Reid Ian /Cadena Cesar

发表时间：2020/2/17

论文链接：https://arxiv.org/abs/2002.07269

推荐原因

这篇论文要解决的是语义场景补全任务中的数据融合问题。

RGB图像包含对象的纹理细节，而深度图像能捕获与形状补全任务具有高度相关性的几何线索，因此同时使用RGB和深度图像可以进一步提高语义场景补全模型的精度。基于此，这篇论文提出了名为GRFNet的3D门控递归融合网络，该网络可以自适应地选择并通过使用门和存储模块来融合深度图像和RGB的相关信息。在单级融合的基础上，这篇论文还进一步提出了一种多级融合策略，可以对网络中不同级之间的相关性进行建模。在两个基准数据集上进行的实验证明了GRFNet在语义场景补全任务中进行数据融合优于现有的方法。

用于大姿态人脸正面化的双注意力GAN

论文名称：Dual-Attention GAN for Large-Pose Face Frontalization

作者：Yin Yu /Jiang Songyao /Robinson Joseph P. /Fu Yun

发表时间：2020/2/17

论文链接：https://arxiv.org/abs/2002.07227

推荐原因

这篇论文要解决的是人脸正面化的问题。

人脸正面化为人脸数据的增强提供了一种有效的方法，进一步提高了极端姿势场景下的人脸识别性能。这篇论文提出了一种新的双注意力生成对抗网络（DA-GAN），通过在GAN训练过程中同时捕捉上下文相关性和局部一致性来实现真实感人脸正面化。DA-GAN包含一种基于自注意力的生成器，来集成具有远距离依赖性的局部特征以产生更好的特征表示和一个基于面部注意力的新型判别器，用于强调人脸区域的局部特征，从而增强了合成正面人脸的真实感。

Universal-RCNN：基于可转移图R-CNN的通用目标检测器

论文名称：Universal-RCNN: Universal Object Detector via Transferable Graph R-CNN

作者：Xu Hang /Fang Linpu /Liang Xiaodan /Kang Wenxiong /Li Zhenguo

发表时间：2020/2/18

论文链接：https://arxiv.org/abs/2002.07417

推荐原因

这篇论文要解决的是通用对象检测的问题。

这篇论文提出了一种名为Universal-RCNN的新的通用对象检测器，结合图迁移学习可在多个数据集之间传播相关语义信息，以达到语义一致性。Universal-RCNN首先通过整合所有类的所有高级语义表示来生成全局语义池。然后，域内推理模块在空间感知图卷积网络指引下的一个数据集中学习并传播稀疏图表示。最后，Universal-RCNN中的域间传输模块利用所有域之间的多种传输依赖关系，通过全局参与和传输语义上下文来增强区域特征表示。大量实验表明，Universal-RCNN明显优于现有的多分支模型，并在多对象检测基准上达到最新水平。

用于图像深度估计的无监督域自适应

论文名称：Unsupervised Domain Adaptation for Depth Prediction from Images

作者：Tonioni Alessio /Poggi Matteo /Mattoccia Stefano /Di Stefano Luigi

发表时间：2019/9/9

论文链接：https://arxiv.org/abs/1909.03943v1

推荐原因

论文的目标是利用无监督算法，将在大量合成数据上预训练的深度模型迁移到没有标签监督的目标域上来。作者首先利用传统的深度估计算法为目标域的图像标记含有噪声的伪标签，并生成一个逐像素的置信图。论文的创新点在于提出了一种新颖的置信度引导损失函数，它用来衡量哪些像素需要纳入深度模型预测出的深度值与传统方法计算出的深度值的误差中。作者还将控制用来计算损失的像素值的超参数设置成一个可学习的变量，进一步提升了模型的泛化能力。论文被TPAMI接收，为无监督深度估计算法提供了新的解决思路。

嵌套命名实体识别的神经分层模型

论文名称：A Neural Layered Model for Nested Named Entity Recognition

作者：Meizhi Ju /Makoto Miwa /Sophia Ananiadou

发表时间：2018/6/1

论文链接：https://www.aclweb.org/anthology/N18-1131.pdf

推荐原因

1. 本文解决了大多数命名实体识别系统不能有效处理内部嵌套实体的问题，如在生物医药领域，嵌套实体出现非常频繁，使用本文提出的方法可以在此背景下捕获更细粒度的语义信息。

2. 本文提出了一种动态分层模型，能够充分利用内部实体信息来加强外部实体的识别。模型基于由LSTM和CRF组成的flat NER层，因此模型能够捕获输入序列的上下文表示，并在不依赖于特征工程的情况下在flat NER层上全局解码预测标签。该模型针对于特定数据集（具有多种类别和嵌套的实体），嵌套的实体越多层次越深，实验效果越好。

3. 本文所提出的模型针对自然语言处理中命名实体识别问题，能够改善嵌套实体识别的情况，而实体识别是之后如实体对齐，构建知识图谱等问题的基础，因而意义很大。