7 Papers & Radios | 谷歌等用神经网络给照片打光；沈向洋等神经语言处理综述

会员服务 ·

7 Papers & Radios | 谷歌等用神经网络给照片打光；沈向洋等神经语言处理综述

2020 年 8 月 16 日 机器之心

机器之心 & ArXiv Weekly Radiostation

参与：杜伟、楚航、罗若天

本周的重要论文有谷歌等研究机构用神经光传输为照片二次打光的探索，以及沈向洋等从建模、学习和推理三方面展开的神经 NLP 综述。

Spatial Images from Temporal Data
Deep Face Recognition: A Survey*
Temporal Constraint Networks
Progress in Neural NLP: Modeling, Learning, and Reasoning
Neural Light Transport for Relighting and View Synthesis
Development and Application of the Latest generation Against the Network of GAN
Improving Monocular Depth Estimation by Leveraging Structural Awareness and Complementary Datasets
ArXiv Weekly Radiostation：NLP、CV、ML 更多精选论文（附音频）

论文 1：Spatial Images from Temporal Data

作者：Alex Turpin、Gabriella Musarra、Valentin Kapitany 等
链接：https://www.osapublishing.org/optica/abstract.cfm?uri=optica-7-8-900

摘要： 想象一下，你闭着眼睛朝一只动物大吼，然后根据回声就能判断这只动物是猫是狗。听起来是不是很不可思议？

来自英国格拉斯哥大学计算科学学院的研究者最近就做了一项类似的成像技术。 他们通过计算光反射到一个简单探测器所需的时间，来获得场景的 3D 图像 。当然，仅仅依靠光提供的信息是不够的，这项被称为「时域成像」（temporal imaging）的新技术还借助机器学习方法，从噪声中挖掘模式。

这项研究采取了一种不同的方法，通过基于包含目标检索图像类型的数据集的先验知识提供额外信息，并且为这一目标训练了一种监督式机器学习算法。

基于单点时间分辨传感器的 3D 成像。

该系统在不同情况下从时间直方图恢复 3D 图像的性能。

推荐： 这项研究登上光学期刊 Optica。

论文 2：Deep Face Recognition: A Survey

作者：Mei Wang、Weihong Deng
链接：https://arxiv.org/pdf/1804.06655.pdf

摘要： 在这篇论文中，来自 北京邮电大学的研究者对深度人脸识别进行了全面的综述 。

首先，他们总结了当前深度人脸识别方法中提出的不同网络结构和损失函数；其次，概述了两类人脸处理方法，「一对多增强」和「多对一归一化」；最后，研究者深入分析了跨因素场景、异质场景、多媒体场景和行业场景，并对未来的发展方向进行了展望。

深度人脸识别方法的发展历程。

深度人脸识别的架构。

推荐： 两位作者均来自北京邮电大学模式识别实验室。

论文 3：Temporal Constraint Networks

作者：Rina Dechter、Itay Meiri、Judea Pearl
链接：http://ftp.cs.ucla.edu/pub/stat_ser/r113-L-reprint.pdf

摘要： 这篇论文将基于网络的约束满足方法进行扩展，使其包含连续变量，从而为处理时间约束提供了框架。在这个叫做时间约束满足问题（TCSP）的框架中，代表时间点和时间信息的变量由一组一元和二元约束进行表示，每一个指定一组时间间隔。该框架的独特特征在于允许处理度量信息，即评估不同事件之间的时间差。

该论文对简单时间问题（STP）和通用时间问题进行区分，前者对任意一对时间点至多认可一个间隔约束（interval constraint）。该研究表明，包含 Vilain 和 Kautz 点代数主要部分的 STP 可以在多项式时间内解决。对于通用 TCSP，该研究展示了一种执行三个推理任务的分解机制，并提出了多种能够改善效率的技术。此外，这篇论文还研究了路径相容算法在预处理时间问题上的适用性，展示了其终止，限制了其复杂度。

示例 1.1 可表示为有向约束图。

交集和组合运算。

距离图。

推荐： 贝叶斯网络之父 Judea Pearl 的这篇旧论文获得了由 AI 顶级国际期刊 AIJ 颁发的 2020 年经典论文奖.

论文 4：Progress in Neural NLP: Modeling, Learning, and Reasoning

作者：Ming Zhou、Nan Duan、Shujie Liu、Heung-Yeung Shum
链接：https://www.sciencedirect.com/science/article/pii/S2095809919304928

摘要： 在这篇论文中，包括 沈向洋在内的几位研究者对基于神经网络的神经语言处理框架进行了综述 ，落脚点分别为建模、学习和推理。文章最后，研究者展望了神经语言处理的未来发展方向。

与上下文无关的词嵌入方法。

基于 RNN 的上下文感知词嵌入方法。

基于自注意力的上下文感知词嵌入方法。

推荐： 本文被《Engineering》期刊接收。

论文 5：Neural Light Transport for Relighting and View Synthesis

作者：XIUMING ZHANG、SEAN FANELLO、 YUN-TA TSAI 等
链接：https://arxiv.org/pdf/2008.03806.pd

摘要： 场景的光传输（LT）描述了场景在不同布光和视角方向下的样子，对场景 LT 的全面了解有助于在任意布光条件下合成新的视图。

这篇论文探讨了基于图像的 LT 采集，主要用于光照平台设置中的人体。研究者提出了一种半参数方法，以学习嵌入到已知几何特性的纹理图集空间中的 LT 的神经表示，并将所有非漫射和全局 LT 建模为残差，并将其添加到物理精确的漫反射基底渲染中。

NLT 方法的模型架构。

在使用平行光的二次打光任务上，NLT、其他方法与真值图像的效果对比。

NLT 方法可能无法生成复杂光传输效果的真实视图，如脖子上所戴项链的视图。

推荐： 在基于图像的 Relighting 场景下，人物的打光效果随着背景图像的变换而不断调整。

论文 6：Development and Application of the Latest generation Against the Network of GAN

作者：陈亮、吴攀、刘韵婷、刘晓阳、杨佳明、姜余
链接：http://dziy.cbpt.cnki.net/WKA/WebPublication/paperDigest.aspx?paperID=76215a4a-3131-4b6e-9afd-1af245c41ff1

摘要： 近年来，生成式对抗网络（generative adversarial nets, GAN）迅速发展，已经成为当前机器学习领域的主要研究方向之一。GAN 来源于零和博弈的思想, 其生成器和鉴别器对抗学习，获取给定样本的数据分布, 生成新的样本数据。对 GAN 模型在图片生成、异常样本检测和定位、文字生成图片以及图片超分辨率等多方面进行了大量的调查研究，并在这些 GAN 的应用所取得的实质性进展进行了系统的阐述。对 GAN 的提出背景与研究意义、理论模型与改进结构，以及其主要应用领域进行了总结。通过对 GAN 在各方面的应用分析，对 GAN 的不足以及未来发展方向进行综述。

推荐： 这篇论文的作者分别来自沈阳理工大学和沈阳师范大学。

论文 7：Improving Monocular Depth Estimation by Leveraging Structural Awareness and Complementary Datasets

作者：Tian Chen、Shijie An、Yuan Zhang 等
链接：https://arxiv.org/pdf/2007.11256.pdf

摘要： 深度是实现 3D 场景理解的重要信息，快手 Y-tech 利用自研的单目深度估计技术获得了高质量的深度信息，并将模型部署到移动端，结合 Y-tech 已有的多项技术研发了 3DPhoto、混合现实等多种新玩法。这些黑科技玩法不限机型，可让用户在手机上无门槛的实时体验，给用户带来全新的视觉体验和交互方式的同时，可帮助用户更好的进行创作。

这项研究主要探究了如何更好的利用三维空间的结构性信息提升单目深度估计精度，此外还针对复杂场景构建了一个新的深度数据集 HC Depth，包含六种挑战性场景，有针对性地提升模型的精度和泛化性。

网络模型结构。

空间注意力机制模块的可视化。

在 NYUv2 数据集上的可视化实验对比。

推荐： 该论文已被 ECCV 2020 收录，论文代码和模型即将在 GitHub 上开源，作者也将在 8 月 23-28 日的 ECCV 大会线上展示他们的工作。

ArXiv Weekly Radiostation

机器之心联合由楚航、罗若天发起的ArXiv Weekly Radiostation，在 7 Papers 的基础上，精选本周更多重要论文，包括NLP、CV、ML领域各10篇精选，并提供音频形式的论文摘要简介，详情如下：

本周 10 篇 NLP 精选论文是：

1. ConvBERT: Improving BERT with Span-based Dynamic Convolution. (from Shuicheng Yan)

2. Antibody Watch: Text Mining Antibody Specificity from the Literature. (from Maryann E. Martone)

3. Efficient MDI Adaptation for n-gram Language Models. (from Dan Povey, Sanjeev Khudanpur)

4. Taking Notes on the Fly Helps BERT Pre-training. (from Tie-Yan Liu)

5. Word meaning in minds and machines. (from Gregory L. Murphy)

6. Domain-Specific Language Model Pretraining for Biomedical Natural Language Processing. (from Jianfeng Gao)

7. Trove: Ontology-driven weak supervision for medical entity classification. (from Nigam H. Shah)

8. Evaluating Automatically Generated Phoneme Captions for Images. (from Mark Hasegawa-Johnson)

9. Generalized Word Shift Graphs: A Method for Visualizing and Explaining Pairwise Comparisons Between Texts. (from Peter Sheridan Dodds)

10. COVID-19 therapy target discovery with context-aware literature mining. (from Nada Lavrač)

本周 10 篇 CV 精选论文是：

1. Learning Long-term Visual Dynamics with Region Proposal Interaction Networks. (from Jitendra Malik)

2. Disentangling Human Error from the Ground Truth in Segmentation of Medical Images. (from Frederik Barkhof, Daniel C. Alexander)

3. End-to-end Birds-eye-view Flow Estimation for Autonomous Driving. (from Wolfram Burgard)

4. CaSPR: Learning Canonical Spatiotemporal Point Cloud Representations. (from Leonidas J. Guibas)

5. Weakly-Supervised Semantic Segmentation via Sub-category Exploration. (from Ming-Hsuan Yang)

6. Mixup-CAM: Weakly-supervised Semantic Segmentation via Uncertainty Regularization. (from Ming-Hsuan Yang)

7. Learning to Factorize and Relight a City. (from Alexei A. Efros, Noah Snavely)

8. Open-Edit: Open-Domain Image Manipulation with Open-Vocabulary Instructions. (from Xiaogang Wang)

9. AR-Net: Adaptive Frame Resolution for Efficient Action Recognition. (from Aude Oliva, Kate Saenko)

10. Noisy Student Training using Body Language Dataset Improves Facial Expression Recognition. (from Vikas Kumar)

本周 10 篇 ML 精选论文是：

1. Bloom Origami Assays: Practical Group Testing. (from Bernhard Scholkopf)

2. A Survey on Concept Factorization: From Shallow to Deep Representation Learning. (from Yan Zhang, Shuicheng Yan)

3. Whole MILC: generalizing learned dynamics across tasks, datasets, and populations. (from Vince D. Calhoun)

4. Generative Ensemble-Regression: Learning Stochastic Dynamics from Discrete Particle Ensemble Observations. (from George Em Karniadakis)

5. Learning-based Computer-aided Prescription Model for Parkinson's Disease: A Data-driven Perspective. (from Yang Gao, Dinggang Shen)

6. Communication-Efficient and Distributed Learning Over Wireless Networks: Principles and Applications. (from Mérouane Debbah)

7. Graph Wasserstein Correlation Analysis for Movie Retrieval. (from Tong Zhang, Jian Yang)

8. The Strategic Perceptron. (from Avrim Blum)

9. Robust Reinforcement Learning using Adversarial Populations. (from Pieter Abbeel, Alexandre Bayen)

10. Privacy Enhancing Machine Learning via Removal of Unwanted Dependencies. (from Sun-Yuan Kung)

登录查看更多

相关内容

神经语言处理

关注 0

神经机器翻译前沿综述

专知会员服务

28+阅读 · 2020年9月9日

深度学习目标检测方法及其主流框架综述

专知会员服务

148+阅读 · 2020年6月26日

神经网络与形式语言综述，12页pdf，A Survey of Neural Networks and Formal Languages

专知会员服务

21+阅读 · 2020年6月4日

【论文推荐】二值神经网络综述，Binary Neural Networks: A Survey

专知会员服务

53+阅读 · 2020年4月8日

【香港中文大学-CVPR2020】Rotate-and-Render: Unsupervised Photorealistic Face Rotation from Single-View Images

专知会员服务

22+阅读 · 2020年3月18日

综述：NLP中的深度学习优势，附21页论文下载

专知会员服务

104+阅读 · 2020年3月12日

【综述】用于语音自动处理的深度神经网络综述:从大型语料库到有限数据的调查

专知会员服务

24+阅读 · 2020年3月9日

美国埃默里大学医学院发布最新「医学图像配准深度学习」综述论文

专知会员服务

56+阅读 · 2020年1月7日

【综述】图像去噪的深度学习:综述，36页pdf，Deep Learning on Image Denoising: An overview

专知会员服务

71+阅读 · 2019年12月31日

【超分辨率| 2019最新综述】图像超分辨率的深度学习，附PDF（Deep Learning for Image Super-resolution: A Survey）

专知会员服务

60+阅读 · 2019年11月16日

综述|从9篇研究综述看图神经网络GNN的最新研究进展

DataFunTalk

26+阅读 · 2020年5月28日

CCCF专栏 | 自然语言处理中的深度学习：评析与展望

中国计算机学会

8+阅读 · 2019年9月18日

综述 | 图像配准 Image registration

计算机视觉life

19+阅读 · 2019年9月12日

从十篇热门学术论文看计算机视觉的未来

计算机视觉life

6+阅读 · 2019年9月11日

逼真3D人脸动画等，德国马普所三篇CVPR 2019论文推荐

机器之心

7+阅读 · 2019年6月23日

谷歌新研究用深度学习合成运动模糊效果，手抖也能拍出摄影师级照片

新智元

7+阅读 · 2018年12月28日

谷歌神经网络人声分离技术再突破！词错率低至23.4%

新智元

4+阅读 · 2018年10月14日

AI综述专栏 | 人脸检测算法综述

人工智能前沿讲习班

6+阅读 · 2018年9月10日

从传统方法到深度学习，人脸关键点检测方法综述

机器之心

14+阅读 · 2017年12月17日

使用张量融合神经网络的基于属性的人脸识别

统计学习与视觉计算组

3+阅读 · 2017年11月2日

Deep Learning on Image Denoising: An overview

Arxiv

13+阅读 · 2020年8月3日

3D Deep Learning on Medical Images: A Review

Arxiv

13+阅读 · 2020年4月1日

Few-Shot Knowledge Graph Completion

Arxiv

15+阅读 · 2019年11月26日

Graph Neural Networks: A Review of Methods and Applications

Arxiv

5+阅读 · 2019年7月10日

MMKG: Multi-Modal Knowledge Graphs

Arxiv

30+阅读 · 2019年3月13日

Deep Reinforcement Learning: An Overview

Arxiv

17+阅读 · 2018年11月26日

Towards Neural Phrase-based Machine Translation

Arxiv

3+阅读 · 2018年4月18日

DenseReg: Fully Convolutional Dense Shape Regression In-the-Wild

Arxiv

3+阅读 · 2018年2月1日

High-Resolution Deep Convolutional Generative Adversarial Networks

Arxiv

8+阅读 · 2018年1月27日

Biomedical Question Answering via Weighted Neural Network Passage Retrieval

Arxiv

10+阅读 · 2018年1月9日

VIP会员