会员服务 ·

【胶囊网络】照骗终结者，新研究使用胶囊网络检测虚假图像|一周AI最火论文

2020 年 7 月 27 日 产业智能官

大数据文摘专栏作品
作者：Christopher Dossman
编译：Joey、Vicky、云舟

呜啦啦啦啦啦啦啦大家好，拖更的AIScholar Weekly栏目又和大家见面啦！

AI ScholarWeekly是AI领域的学术专栏，致力于为你带来最新潮、最全面、最深度的AI学术概览，一网打尽每周AI学术的前沿资讯。

每周更新，做AI科研，每周从这一篇开始就够啦！

本周关键词：GAN、Deep Fake、胶囊网络

本周最佳学术研究

Google AI再憋大招，为会话助手引入内容导向的对话数据集

Google AI最近推出了Schema Guided Dialogue（SGD）数据集，这是一种面向任务的对话语料库。训练集中有超过18000个对话，涵盖来自17个领域的26种服务，这也是目前最大的已标记、面向任务的对话数据集。这个数据集的标记包括每个用户话语的活动意图、对话状态，以及对应于系统话语的系统动作。同时，SGD还是第一个涵盖多个领域并为每个领域提供多个API的数据集。

Google还提出了一种用来解决一些对话助手领域挑战的方法：利用对话架构来指导构建虚拟助手。该方法通用于所有服务和领域的模型，且没有特定于领域的参数。

在现有数据集无法充分描述现实世界时，SGD数据集将能很大地帮助到我们。与此同时，它还通过简化新服务和API与大规模虚拟助手进行集成，为虚拟助手提供可扩展的建模方法。该数据集还被设计为在大型虚拟助手中用于意图预测、状态跟踪、插槽填充和语言生成以及其他更多任务的有效测试平台。

原文：

https://arxiv.org/pdf/1909.05855.pdf

文本转图像过程中语意对象准确性的研究

在本文中，研究人员介绍了一种新的GAN架构（OPGAN），该架构可以根据一些文本图像描述对单个对象进行建模。他们通过向“生成器”和“鉴别器”添加对象路径来实现此目的，这些生成器和鉴别器以不同的分辨率和比例学习单个对象的特征。基于定量和定性评估，该模型持续改进了基线结构。此外，它以通用的定量评估指标获得了目前业界最优秀的结果，并增加了对图像生成过程的控制。

他们还引入了一种称为语义对象准确度（SOA）的新评估指标，该指标可评估模型在复杂场景中生成单个对象的能力。新的SOA评估可以更详细地评估文本转图像的效果，与此同时它还能检测单个对象失败和成功的具体细节。

文本转图像在现实生活中有许多实际应用，包括照片编辑或生成计算机辅助内容等等。尽管某些模型可以对几个最常见的对象实现高精度转换，但在对稀有对象或不具有易于识别外表特征的对象进行建模时，现有的所有模型均会失败。

本文中提出的SOA是一个评估文本转图像模型的重要指标，因为它提供了有关不同对象类和图像标题更详细的信息，这对于构建良好的生成模型和指导未来的模型改进非常有价值。

代码传送门：

https://github.com/tohinz/semantic-object-accuracy-for-generative-text-to-image-synthesis

原文：

https://arxiv.org/abs/1910.13321v1

基于双重情感的假新闻检测框架

在这篇论文中，研究人员研究了在虚假新闻检测中学习双重情感的问题，并提出了一个新的基于双重情感的虚假新闻检测框架（DEAN）。

DEAN由三个部分组成。第一个模块分析发布者的信息，其中包括新闻内容中的语义和情感信息；第二个部分是注释模块，用于捕获用户的语义和情感信息；第三个是伪造新闻的预测组件，它将新闻内容和用户评论中得到的潜在表示融合在一起，以此判定这一新闻是否为伪造。

该框架可以分别为发布者和用户学习内容和情感表示。DEAN还能够同时利用双重情感表示来检测假新闻。

假新闻的产生和传播会带来很多有害的社会后果。我们需要努力构建自动有效的检测假新闻的工具。而这一最新提出的DEAN框架可以捕获和整合双重情感，通过学习新闻来检测假新闻。在使用微博和Twitter数据集进行评估时，DEAN优于现有的几种最新的假新闻检测方法，这也证明了其有效性。

原文：

https://arxiv.org/abs/1903.01728v2

用胶囊网络检测虚假图像和视频

针对DeepFake所提出的对策有不少，但它们大多针对特定领域，并且在应用于其它领域或面对新的攻击时丧失有效性。

本文介绍了一种胶囊网络（capsule network），它可以利用印刷图像和使用深度学习创建的回放视频来检测各种DeepFake的攻击。与具有相似性能的传统卷积神经网络相比，胶囊网络运用的参数要少得多。

此外，研究人员首次通过详细分析和可视化解释了将胶囊网络应用于法医学问题背后的原理。

这一胶囊取证方法可以应用于数字图像和视频取证，包括检测计算机操作／生成的图像和视频以及检测演示攻击。

该方法在使用较少参数的情况下，在测试任务中等效于或优于目前最先进的方法，从而极大降低了计算成本。

原文：

https://arxiv.org/abs/1910.12467v2

生成对抗网络的前世今生

生成对抗网络（GAN）激发了人们对生成模型的极大兴趣，从而产生了一波能让新的研究人员望而生畏的新研究成果。

本文旨在通过将现有的研究分成6个“前沿”来帮助解决这种情况：架构贡献、条件技术、归一化和约束贡献、损失函数、图像到图像的转换和验证指标。

前沿的划分将文献组织成可接近的区块，最终显示出该领域是如何演变的。这项工作也以表格形式列出了该领域先前的研究，重点集中在其中的一些前沿，从而使研究人员建议用更完整、更全面的概述来填补其留下的空白。

据谷歌学术称，Goodfellow等人的开创性论文《生成对抗网络（Generative Adversarial Nets）》被引用了12000多次，这个趋势自2017年起有了显著提高。因此，有必要对相关作品的演变进行调查。这项工作对GAN进行了简单回顾，目的是成为其大量文献的切入点。同时，这项工作还着眼于帮助研究人员们更新他们的技术。

原文：

https://arxiv.org/abs/1910.13076v1、

其他爆款论文

研究人员介绍了适用于个人ReID公共数据集和现实设置的网络和训练修正：

https://arxiv.org/pdf/1910.07038v2.pdf

基于EEG的语音增强：

https://arxiv.org/pdf/1909.09132v3.pdf

为商品推荐所设计的新变分贝叶斯上下文感知表示（VBCAR）模型，优于现有的最新方法：

https://arxiv.org/abs/1909.07705v2

以角色为基础的聊天生成框架：
https://arxiv.org/abs/1910.13008v1

第三届神经生成与翻译研讨会的发现：

https://arxiv.org/abs/1910.13299v1

基于变压器的级联多峰语音翻译：

https://arxiv.org/abs/1910.13215v1

数据集

用于视觉注意力建模的合成图像基准数据集：

http://www.cvc.uab.es

第一个用来训练与评估交互式导航的综合基准：

https://sites.google.com/view/interactivegibsonenv

AI大事件

Faceboook强调了将二维对象转换成三维形态的人工智能：

https://venturebeat.com/2019/10/29/facebook-highlights-ai-that-converts-2d-objects-into-3d-shapes/?utm_campaign=Artificial%2BIntelligence%2BWeekly&utm_medium=email&utm_source=Artificial_Intelligence_Weekly_130

人类一败涂地！AI征服《星际争霸2》：

https://www.independent.co.uk/life-style/gadgets-and-tech/gaming/artificial-intelligence-starcraft-2-ai-deepmind-a9176601.html

世界首屈一指的计算机视觉会议之一上周在韩国首尔举行：

http://iccv2019.thecvf.com/

员工信任机器人胜过经理？

https://www.forbes.com/sites/gilpress/2019/11/01/ai-stats-news-64-of-workers-trust-a-robot-more-than-their-manager/#7bf06c072b21

机器两脚兽如何在奔跑跳跃的过程中模仿人类保持平衡：

https://www.sciencedaily.com/releases/2019/10/191030151155.htm

专栏作者介绍

Christopher Dossman是Wonder Technologies的首席数据科学家，在北京生活5年。他是深度学习系统部署方面的专家，在开发新的AI产品方面拥有丰富的经验。除了卓越的工程经验，他还教授了1000名学生了解深度学习基础。

LinkedIn：

https：//www.linkedin.com/in/christopherdossman/

先进制造业+工业互联网

产业智能官 AI-CPS

加入知识星球“产业智能研究院”：先进制造业OT（自动化+机器人+工艺+精益）和工业互联网IT（云计算+大数据+物联网+区块链+人工智能）产业智能化技术深度融合，在场景中构建“状态感知-实时分析-自主决策-精准执行-学习提升”的产业智能化平台；实现产业转型升级、DT驱动业务、价值创新创造的产业互联生态链。

产业智能化平台作为第四次工业革命的核心驱动力，将进一步释放历次科技革命和产业变革积蓄的巨大能量，并创造新的强大引擎；重构设计、生产、物流、服务等经济活动各环节，形成从宏观到微观各领域的智能化新需求，催生 新技术、新产品、新产业、新业态和新模式； 引发经济结构重大变革，深刻改变人类生产生活方式和思维模式，实现社会生产力的整体跃升。

产业智能化技术分支用来的今天，制造业者必须了解如何将“智能技术”全面渗入整个公司、产品、业务等商业场景中， 利用工业互联网形成数字化、网络化和智能化力量，实现行业的重新布局、企业的重新构建和焕然新生。