【学界】7 papers | 华为、MIT韩松论文；DeepMind开源OpenSpiel；目标检测算法全面综述

2019 年 9 月 1 日 GAN生成式对抗网络

来源：机器之心

本周重点的研究有华为莫斯科研究院和莫斯科国立大学提出的新型对抗样本攻击方法、MIT韩松等的新论文、DeepMind开源的OpenSpiel等。其他还有微众银行杨强等提出的内容推荐新模型、对BERT的反思、GAN在时尚领域的研究，以及目标检测算法综述等。

目录：

AdvHat: Real-world adversarial attack on ArcFace Face ID system
Revealing the Dark Secrets of BERT
Generating High-Resolution Fashion Model Images Wearing Custom Outfits
Once for All: Train One Network and Specialize it for Efficient Deployment
OpenSpiel: A Framework for Reinforcement Learning in Games
Beyond Personalization: Social Content Recommendation for Creator Equality and Consumer Satisfaction
Deep Learning for Generic Object Detection: A Survey

论文 1： AdvHat: Real-world adversarial attack on ArcFace Face ID system

作者：Stepan Komko、Aleksandr Petiushko
论文链接：https://arxiv.org/pdf/1908.08705

摘要：在这篇论文中，研究者们提出了一种全新且易于复现的技术 AdvHat，可以在多种不同的拍摄条件下攻击目前最强的公共 Face ID 系统。想要实现这种攻击并不需要复杂的设备——只需在彩色打印机上打印特定的对抗样本，并将其贴到你的帽子上，而对抗样本的制作采用了全新的算法，可在非平面的条件下保持有效。研究人员称，这种方法已经成功地破解了目前最先进的 Face ID 模型 LResNet100E-IR、ArcFace@ms1m-refine-v2，其攻击方式也可以迁移到其他 Face ID 模型上。

AI 人脸识别系统在正常情况下的分类效果，它识别出了特定的人：Person_1。

贴上纸条以后，即使没有遮住脸，系统也会把 Person_1 识别成另外一些人「0000663」和「0000268」等。

变换角度、改变光照条件都不会改变错误的识别效果。加了贴纸后，可以看到 Person_1 的概率非常低。

图 2：攻击流程示意图。

推荐：本文是华为莫斯科实验室和莫斯科国立大学合作的项目，第一次实现了实时对抗样本攻击，而且多模型通用。

论文 2： Revealing the Dark Secrets of BERT

作者：Olga Kovaleva、Alexey Romanov、Anna Rogers、Anna Rumshisky
论文链接：https://arxiv.org/pdf/1908.08593.pdf

摘要：目前，基于 BERT 的架构在诸多自然语言处理任务中表现出了 SOTA 性能，但促成这类架构成功的具体机制却很少有人知道。在当前的研究工作中，研究人员侧重于自注意力的解读，它是 BERT 基本的底层组件之一。在本文中，借助于 GLUE 任务子集和一组感兴趣的 handicrafted 特征，研究者提出了一种方法论，并对单个 BERT 头（BERT head）所编码的信息进行定性和定量分析。分析结果显示，一组受限的注意力机制会在不同的 head 之间重复出现，这表明总体模型出现过度参数化。虽然不同的 head 始终使用相同的注意力机制，但在不同任务中对性能的影响也不同。研究表明，与常规微调 BERT 模型相比，手动禁用某些 head 中的注意力可以提升性能。

禁用了一部分注意力头之后模型在特定任务上的表现。图表说明，在禁用了一部分注意力头之后，模型效果（深紫色）反而比基线结果（橘色线）更好了。

推荐：本文是 EMNLP 2019 接收论文。利用对 BERT 结构的拆解过程研究注意力机制可解释性，非常适合还不熟悉 BERT 的读者从另一个角度审视预训练大型语言模型的架构、各个模块的功能和含义。

论文 3： Generating High-Resolution Fashion Model Images Wearing Custom Outfits

作者：Gokhan Yildirim、Nikolay Jetchev、Roland Vollgraf、Urs Bergmann、Zalando Research
论文链接：https://arxiv.org/pdf/1908.08847.pdf

摘要：买衣服时必须要考虑搭配。由于时尚物品组合方面的问题，可用图像仅限于预先确定的一套服装。在本文中，研究者通过生成身穿定制化服装的模特在输入身体姿态下的高分辨率图像，扩展了这些可视化图像。实验表明，研究者所用的方法不仅可以转换两套服装的风格和姿态，而且可以创建逼真的人体姿态和服装图像。

根据给定的服装图像和模特姿势生成特定造型的模型示意图。

根据上中的颜色、上右的模特姿势，在左下模特身上实现不同的穿衣和姿势效果。

推荐：本文入选 ICCV 2019 艺术和设计 Workshop。虽然使用 GAN 进行图像生成不是一件新鲜事，但是这是极少数的在时尚领域进行的应用。做算法的读者朋友可以参考，将算法的研究成果和现实场景结合起来。

论文 4：Once for All: Train One Network and Specialize it for Efficient Deployment

作者：Han Cai、Chuang Gan、Song Han
论文链接：https://arxiv.org/pdf/1908.09791.pdf

摘要：将神经网络部署在各种硬件平台时，不同的部署场景需要匹配的网络架构，同时网络还要尽可能精简。传统的做法是手动设计、或者使用 AutoML 搜索网络架构，之后针对每个不同网络重新进行训练。这样的做法成本很高，也不具有扩展性。随着需要部署的环境数量增加，这种做法的成本呈线性上升。本文提出了一种名为「一次构建、处处部署（Once for all：OFA）」的方法，可以高效设计神经网络架构，并同时处理多种部署情况。研究人员的方法摒弃了给每一种情况设计一个专门模型的做法，而是提出训练一个网络，支持多种架构设定（网络深度、宽度、核大小和清晰度等）。给定部署场景后，网络可以搜索出一个特定的子网络。这个子网络是从原始网络中搜索出来的，而且不需要训练。

图 1：左图：当训练了一个网络后，根据部署条件的不同，从该网络中搜索出一个子网络。中图：这样的搜索方法的设计成本从 O(N) 降低到了 O(1)。右图：相比其他网络，论文提出的方法能够在降低延迟的情况下更好地提升效果。

图 2：阶段性缩减流程示意。

推荐：本文作者为 MIT 的韩松教授等，从搜索子图的角度提出了 NAS 的替代方法。读者朋友可以参考其中的思想。

论文 5：OpenSpiel: A Framework for Reinforcement Learning in Games

论文作者：Marc Lanctot, Edward Lockhart, Jean-Baptiste Lespiau 等
论文链接：https://arxiv.org/pdf/1908.09453v1.pdf

Open-spiel 支持的游戏一览

平台支持的算法一览

石头剪刀布游戏中的策略可视化。

推荐：本文是 DeepMind 为强化学习开发的多游戏、多人博弈实验平台。这样一种强化学习平台目前是很少见的，强化学习领域的研究者可以参考使用方法，为自己的算法进行部署。

论文 6：Beyond Personalization: Social Content Recommendation for Creator Equality and Consumer Satisfaction

作者：Wenyi Xiao、Huan Zhao、Haojie Pan、Yangqiu Song、Vincent W. Zheng、Qiang Yang
论文链接：https://sci-hub.tw/https://doi.org/10.1145/3292500.3330965

摘要：本文现代社交媒体平台中的有效内容推荐应该既可以使创作者真正获益，也能够帮助消费者获得切实感兴趣的内容。本论文提出了一种用于内容推荐的社交探索注意力网络（SEAN）模型。SEAN 使用个性化内容推荐模型可以按照用户个人兴趣进行推荐。此外，该模型还可以运用个性化因素来处理用户在社交网络上的高阶朋友，以提高推荐结果的准确性和多样性。研究者在广受欢迎的分散内容分发平台——Steemit 上构建了两个数据集，将 SEAN 与协同过滤方法和基于内容的推荐方法进行比较。实验结果证明，SEAN 无论是在推荐平等的基尼系数和推荐性能的 F1 得分方面均十分有效。

SEAN 的架构。左侧为社交探索模块，为右侧的系统探索用户在社交网络中的高阶朋友。将这些朋友与用户学习到的兴趣知识表示合并，分别建立了单词级和句子级的用户表示向量。右侧是神经网络结构，使用 CNN 将单词编码到 GRU 层，随后将句子编码到文档中。

推荐：本文是 KDD2019 大会接收的一篇论文，作者是微众银行的杨强等。论文提出的推荐算法，有可能给现有的基于协同过滤的算法带来更好的性能提升。

论文 7：Deep Learning for Generic Object Detection: A Survey

作者：Li Liu、 Wanli Ouyang、Xiaogang Wang、Paul Fieguth、Jie Chen、Xinwang Liu、Matti Pietika ̈inen
论文链接：https://arxiv.org/pdf/1809.02165v4.pdf

摘要：目标检测是计算机视觉领域最根本和具有挑战性的问题之一，旨在从自然图像中的大量预定义类中定位出目标实例。深度学习技术已经成为直接从数据中学习特征表征的一种强大策略，并在通用目标检测领域取得了重大突破。本文综述了近来深度学习技术在通用目标检测领域所带来的进展，包含 300 多项研究贡献，涉及该领域的诸多方面，如检测框架、目标特征表征、目标建议生成、情境建模、训练策略和评估指标。文章结尾则确定了未来有前途的研究方向。

推荐：目标检测一直是 CV 领域的重点研究方向。本文全面综述了目标检测相关的算法和进展，值得读者阅读参考。

高质量延伸阅读

☞ OpenPV平台发布在线的ParallelEye视觉任务挑战赛

☞【学界】第1届“智能车辆中的平行视觉”研讨会成功举行

☞【学界】生成式对抗网络：从生成数据到创造智能

☞【学界】OpenPV：中科院研究人员建立开源的平行视觉研究平台

☞【学界】基于平行视觉的特定场景下行人检测

☞【学界】ParallelEye：面向交通视觉研究构建的大规模虚拟图像集

☞【CFP】Virtual Images for Visual Artificial Intelligence

☞【最详尽的GAN介绍】王飞跃等：生成式对抗网络 GAN 的研究进展与展望

☞【智能自动化学科前沿讲习班第1期】王飞跃教授：生成式对抗网络GAN的研究进展与展望

☞【智能自动化学科前沿讲习班第1期】王坤峰副研究员：GAN与平行视觉

☞【重磅】平行将成为一种常态：从SimGAN获得CVPR 2017最佳论文奖说起

☞【平行讲坛】平行图像：图像生成的一个新型理论框架

☞【学界】基于生成对抗网络的低秩图像生成方法

☞【学界】Ian Goodfellow等人提出对抗重编程，让神经网络执行其他任务

☞【学界】六种GAN评估指标的综合评估实验，迈向定量评估GAN的重要一步

☞【资源】T2T：利用StackGAN和ProGAN从文本生成人脸

☞【学界】 CVPR 2018最佳论文作者亲笔解读：研究视觉任务关联性的Taskonomy

☞【业界】英特尔OpenVINO™工具包为创新智能视觉提供更多可能

☞【学界】ECCV 2018: 对抗深度学习: 鱼 (模型准确性) 与熊掌 (模型鲁棒性) 能否兼得

☞【学界】何恺明组又出神作！最新论文提出全景分割新方法

登录查看更多

相关内容

对抗样本

关注 13

对抗样本由Christian Szegedy等人提出，是指在数据集中通过故意添加细微的干扰所形成的输入样本，导致模型以高置信度给出一个错误的输出。在正则化背景下，通过对抗训练减少原有独立同分布的测试集的错误率——在对抗扰动的训练集样本上训练网络。对抗样本是指通过在数据中故意添加细微的扰动生成的一种输入样本，能够导致神经网络模型给出一个错误的预测结果。实质：对抗样本是通过向输入中加入人类难以察觉的扰动生成，能够改变人工智能模型的行为。其基本目标有两个，一是改变模型的预测结果；二是加入到输入中的扰动在人类看起来不足以引起模型预测结果的改变，具有表面上的无害性。对抗样本的相关研究对自动驾驶、智能家居等应用场景具有非常重要的意义。

【滑铁卢大学】医学图像分析中可解释的深度学习模型，18页pdf

专知会员服务

121+阅读 · 2020年5月31日

最新《智能交通系统的深度强化学习》综述论文，22页pdf

专知会员服务

187+阅读 · 2020年5月5日

3D目标检测进展综述

专知会员服务

193+阅读 · 2020年4月24日

【浙江大学】对抗样本生成技术综述

专知会员服务

92+阅读 · 2020年1月6日