语义分割,对抗生成,图学习和算法研究,京东数科 6 篇AAAI 论文精华解读

2020 年 2 月 13 日 AI科技评论
作者 | 京东数科
责编 | 贾伟

AAAI 2020 已经在纽约步入最后一天,然而还有许多优秀工作未能分享给关注AI 前沿研究的读者。AI科技评论在接下来的时间里将快马加鞭,努力工作。

本次AAAI会议是进入21世纪20年代(一个将真正属于人工智能的十年)中首个会议。但这次会议却因中国新冠疫情而出现别具一格的场面,许多国内近800名小伙伴因疫情影响无法到现场参加会议,导致许多会议的技术报告出现整场在播放视频。这也成为首个进行“云参会”的AI顶会,甚至有人建议以后会议应该允许作者不到现场进行报告。

在本届会议中,京东数科共有 6 篇论文入选,其中 1篇涉及语义分割,1篇为对抗生成,1 篇与图机器学习有关,3 篇为算法研究。本文将对京东数科在AAAI 2020 中这 6 篇文章进行介绍。

关注「AI科技评论」微信公众号,后台回复「京东数科@AAAI2020」下载论文合集。

一、语义分割研究

1、基于空间语义网络调制的深度协同物体分割

论文链接: https://arxiv.org/pdf/1911.12950.pdf

协同目标分割是对多幅相关图像中的共同目标进行分割。在很多计算机视觉相关问题中,协同目标分割都有着广泛的应用。

本文提出了一个基于空间和语义调制的协同分割深度学习网络框架。


该方法首先用骨干网提取多分辨率图像特征。之后我们用图像的多分辨率深度特征作为输入,采用文中所设计的空间调制器来学习每个图像的掩模。

空间调制器通过无监督学习获取图像特征描述符的相关性,学习得到的掩模可以在抑制背景的同时定位目标物体。我们将语义调制器建模为一个有监督的图像分类任务。


在语义调制器模块我们提出了一个多级的二阶池化模块对图像特征做变换以供分类使用。这两个调制器的引入能够指导网络提取更有针对性的图像特征。


所提出的模型采用端到端训练。在四个图像协同分割基准数据集上的大量实验表明,与最新方法相比,我们的方法具有更高的精度。

二、对抗生成研究
 
2、 基于成对比较样本标注的鲁棒条件生成对抗网络


论文链接:https://arxiv.org/pdf/1911.09298v1.pdf

条件对抗生成网络(conditional GAN, CGAN)在图片属性编辑等领域有成功的应用。但是,训练CGAN往往需要大量标注。


针对这一问题,现有方法大多基于无监督聚类,比如先用无监督学习方法得到伪标注,再用伪标注当作真标注训练CGAN。然而,当目标属性是连续值而非离散值,或者目标属性不能表征数据间的主要差异,那么这种基于无监督聚类的方法就难以取得理想效果。我们进而考虑用弱监督信息去训练CGAN,在文中我们考虑成对比较这种弱监督。成对比较相较于绝对标注具有以下优点:1.更容易标注;2.更准确;3.不易受主观影响。
 

我们提出先训练一个比较网络来预测每张图片的得分,再将这个得分当做条件训练CGAN。第一部分的比较网络我们受到国际象棋等比赛中常用的等级分(Elo rating system)算法的启发,将一次成对比较的标注视为一次比赛,用一个网络预测图片的得分,我们根据等级分设计了可以反向传播学习的神经网络。

我们还考虑了网络的贝叶斯版本,使网络具有估计不确定性的能力。对于图像生成部分,我们将鲁棒条件对抗生成网络(Robust Conditional GAN, RCGAN)拓展到条件是连续值的情形。

我们在四个数据集上进行了实验,分别改变人脸图像的年龄和颜值。实验结果表明提出的弱监督方法和全监督基线相当,并远远好于非监督方法。

三、图机器学习研究
 
3、基于小样本学习的知识图谱补全

论文链接:https://arxiv.org/pdf/1911.11298.pdf

知识图谱作为重要的数据资源已经被大量应用于推荐以及自然语言处理的各项应用当中。在实际场景中,知识图谱的不完整性则作为一个重要的研究课题。

尽管大量的知识图谱补全的算法致力于解决该问题,当前算法都依赖于大量的训练数据才能较好地学习到知识图谱中各类节点间的关系。在实际的应用场景中,训练数据缺失的情况普遍存在。因此,一个更加实际的场景是如何在有限的训练数据中,准确地通过对各种模态关系的研究学习,从而对不完整的知识图谱进行补全。

为了解决该问题,本文提出了一种基于小样本的知识图谱关系学习架构来预测在知识图谱中各类实体节点间的连接关系。

模型架构图

在所提出的方法架构中,我们首先设计了一种基于注意力机制的异构网络中邻接关系的编码器。该编码器能够在对到在异构网络中实体节点嵌入学习的过程中,考虑到不同邻居节点以及其对应的不同关系的影响。

其次,我们开发了一种基于循环神经网络的自编码架构来对小样本中不同实体样例间的交互信息。通过对该实体间交互的建模,我们可以更好地发现在知识图谱中具有相同特性的实体节点,从而精确地补全知识图谱中缺失的相关信息。


通过在两个公共知识图谱数据集上和现有算法的对比实验,我们验证了提出的方法能够产生更好的知识图谱补全的结果。

四、算法研究

4、针对鲁棒支持向量机的快速数据筛选算法

论文地址:https://arxiv.org/pdf/1912.11217.pdf

在现实机器学习应用中,我们经常使用鲁棒支持向量机提高预测性能,减小噪声的影响。由于鲁棒支持向量机使用非凸的的目标函数,差分优化方法经常被采用来计算,并使用多个外循环,从而大大地增加了计算复杂性,限制了鲁棒支持向量机在大数据上的使用。
在我们最新的工作,我们设计了新的快速数据筛选算法,快速找到并去掉代表性差的数据,在不影响预测结果的前提下,大大降低训练数据的数目,从而解决了鲁棒支持向量机无法在大数据上应用的难点。

已有的快速数据筛选算法只能使用在凸的目标函数上,因此不能直接应用到鲁棒支持向量机模型。


因此我们设计了新的快速数据筛选算法,基于凸函数和凹函数共同表达的框架,我们提供了新的数据筛选规则,并提供理论支持,保证我们的算法可以筛选到所以有代表性的数据,没有遗漏。

这是第一个针对非凸目标函数的快速数据筛选算法。

我们在多个大数据集上进行了测试,我们的新算法可以大大提高鲁棒支持向量机的效率,从而可以解决大数据中的预测问题。
 
5、基于四重随机梯度的大规模非线性半监督有序回归AUC优化

论文链接:https://arxiv.org/pdf/1912.11193.pdf

有序回归问题(类别标记存在有序关系)广泛存在于现实世界中,例如天气预报中的级别关系,预警系统中的级别关系, 金融风险预测的级别关系。传统的有序回归算法通常是基于有序二分类分解方法,即将原问题分解为多个二分类的子问题,再最小化子问题的分类误差来进行求解。但是,这种方法会天然的会使每个二分类问题出现类别不均衡的问题。最小化分类误差的方法无法有效的解决这种类别不均衡问题。有研究指出,在有序回归问题中,利用AUC指标类别不明感的特点,直接优化AUC指标能得到一个更好的有序回归模型。


进一步地,在现实问题中,收集大量的有标签的等级数据非常困难。然而存在很多没有标记的数据。如何利用这些无标记数据提升有序回归分类器是一个重要的问题。

本文考虑在半监督有序回归数据集上通过优化AUC指标来训练分类器。通过二分类分解法,我们给出了半监督有序回归AUC优化的目标函数。同时,针对大规模的带有核的优化问题,我们给出一种基于双重随机梯度的优化算法,QS3ORAO。

我们的算法的具有O(1/t)的收敛速度。 此外,实验结果表明,我们的算法在速度,处理数据规模方面优于现有的方法,同时具有相似的推广性能。

6、学习从轨迹中生成电子地图

论文链接:https://www.ntu.edu.sg/home/c.long/paper/AAAI-RuanS.361.pdf

最新且准确的路网数据对于城市中的很多应用,比如车载导航和线路优化等,都非常重要。传统的道路数据采集方法依赖于现场调查,消耗大量的人力物力。

随着GPS设备的普及,海量轨迹数据在城市里产生,给我们提供了一种用轨迹数据生成路网的机遇。但是,现有的轨迹数据恢复地图的方法,需要很多经验参数,并且没有很好的利用现有地图中的先验知识,导致生成的地图被过度简化,或者过度复杂化。

因此,我们提出了一种基于深度学习来从轨迹中生成电子地图的方法DeepMG, 它能够学习现有路网的结构,并克服GPS定位中存在的噪声。DeepMG的框架如下图所示:

DeepMG框架.

它先从空间视角和转移视角从轨迹中抽取特征,并利用深度卷积神经网络T2RNet(如下图)推测道路中心线。

T2RNet网络结构.

T2RNet通过引入辅助任务道路覆盖区域预测,提升中心线预测的准确性。之后,再次利用轨迹数据精细化得到的路网,保证路网拓扑的联通性以及正确性。


实验表明DeepMG从量化指标和视觉效果上都显著优于非深度学习的方法。




AAAI 2020 报道:
新型冠状病毒疫情下,AAAI2020 还去开会吗?
美国拒绝入境,AAAI2020现场参会告吹,论文如何分享?
AAAI 最佳论文公布

AAAI 2020正式开幕,37%录用论文来自中国,连续三年制霸榜首


AAAI 2020 论文集:
AAAI 2020 论文解读会 @ 望京(附PPT下载)
AAAI 2020上的NLP有哪些研究风向?
微软 6 篇精选 AAAI 2020 论文

AAAI 2020 论文解读系列:
01. [中科院自动化所] 通过识别和翻译交互打造更优的语音翻译模型
02. [中科院自动化所] 全新视角,探究「目标检测」与「实例分割」的互惠关系
03. [北理工] 新角度看双线性池化,冗余、突发性问题本质源于哪里?
04. [复旦大学] 利用场景图针对图像序列进行故事生成
05. [腾讯 AI Lab] 2100场王者荣耀,1v1胜率99.8%,腾讯绝悟 AI 技术解读
06. [复旦大学] 多任务学习,如何设计一个更好的参数共享机制?
07. [清华大学] 话到嘴边却忘了?这个模型能帮你 | 多通道反向词典模型
08. [北航等] DualVD: 一种视觉对话新框架
09. [清华大学] 借助BabelNet构建多语言义原知识库
10. [微软亚研] 沟壑易填:端到端语音翻译中预训练和微调的衔接方法
11. [微软亚研] 时间可以是二维的吗?基于二维时间图的视频内容片段检测
12. [清华大学] 用于少次关系学习的神经网络雪球机制
13. [中科院自动化所] 通过解纠缠模型探测语义和语法的大脑表征机制
14. [中科院自动化所] 多模态基准指导的生成式多模态自动文摘
15. [南京大学] 利用多头注意力机制生成多样性翻译
16. [UCSB 王威廉组] 零样本学习,来扩充知识图谱(视频解读)
17. [上海交大] 基于图像查询的视频检索,代码已开源!
18. [奥卢大学] 基于 NAS 的 GCN 网络设计(视频解读)
19. [中科大] 智能教育系统中的神经认知诊断,从数据中学习交互函数
20. [北京大学] 图卷积中的多阶段自监督学习算法
21. [清华大学] 全新模型,对话生成更流畅、更具个性化(视频解读,附PPT)
22. [华南理工] 面向文本识别的去耦注意力网络
23. [自动化所] 基于对抗视觉特征残差的零样本学习方法
24. [计算所] 引入评估模块,提升机器翻译流畅度和忠实度(已开源)
25. [北大&上交大] 姿态辅助下的多相机协作实现主动目标追踪
26. [快手] 重新审视图像美学评估 & 寻找精彩片段聚焦点
27. [计算所&微信AI] 改进训练目标,提升非自回归模型翻译质量(已开源)
28. [中科院&云从科技]: 双视图分类,利用多个弱标签提高分类性能
29. [中山大学] 基于树状结构策略的渐进强化学习
30. [东北大学] 基于联合表示的神经机器翻译(视频解读)
31. [计算所]引入评估模块,提升机器翻译流畅度和忠实度(视频解读)
32. [清华大学]用于少次关系学习的神经网络雪球机制(视频解读)
33. [计算所]非自回归机器翻译,基于n元组的训练目标(视频解读)
34. [清华大学] 司法考试数据集(视频解读,附下载链接)
35. [自动化所] 弱监督语义分割(视频解读)
36. [自动化所] 稀疏二值神经网络,不需要任何技巧,取得SOTA精度(视频解读)
37. [华科&阿里] 从边界到文本—一种任意形状文本的检测方法
38. [上交大&云从科技] DCMN+ 模型:破解「阅读理解」难题,获全球领先成绩
39. [自动化所&微信AI] 双通道多步推理模型,更好解决视觉对话生成问题
40. [ETH Zurich] 反向R? 削弱显著特征为细粒度分类带来提升
41. [中科大] RiskOracle: 一种时空细粒度交通事故预测方法
42. [华为] 短小时序,如何预测? ——基于特征重构的张量ARIMA
43. [清华大学] 棋盘游戏做辅助,进行跳跃式标注(视频解读)
44. [商汤] 新视频语义分割和光流联合学习算法
45. [商汤] 新弱监督目标检测框架
46. [第四范式] 优化NAS算法,速度提高10倍!
47. [牛津大学] 利用注意力机制,实现最优相机定位(视频解读)
48. [天津大学] DIoU和CIoU: IoU在目标检测中的正确打开方式
49. [宁夏大学] 面向大规模无标注视频的人脸对齐方法




点击“ 阅读原文” 前往 AAAI 2020 专题页
登录查看更多
2

相关内容

带条件约束的GAN,在生成模型(D)和判别模型(G)的建模中均引入条件变量y(conditional variable y),使用额外信息y对模型增加条件,可以指导数据生成过程。
【CVPR2020-北京大学】自适应间隔损失的提升小样本学习
专知会员服务
84+阅读 · 2020年6月9日
专知会员服务
108+阅读 · 2020年5月21日
近期必读的8篇 AAAI 2020【图神经网络(GNN)】相关论文
专知会员服务
76+阅读 · 2020年1月15日
必读的10篇 CVPR 2019【生成对抗网络】相关论文和代码
专知会员服务
32+阅读 · 2020年1月10日
KDD 2019论文解读:异构信息网络上的对抗生成学习
云栖社区
22+阅读 · 2019年8月21日
CVPR 2019 论文解读精选
AI研习社
7+阅读 · 2019年6月16日
CVPR 2019 Oral 论文解读 | 无监督域适应语义分割
AI科技评论
49+阅读 · 2019年5月29日
CMU论文解读:基于GAN和VAE的跨模态图像生成
PaperWeekly
9+阅读 · 2018年8月20日
CVPR 2018 论文解读(部分)
计算机视觉战队
5+阅读 · 2018年5月8日
Few-shot Adaptive Faster R-CNN
Arxiv
3+阅读 · 2019年3月22日
Arxiv
7+阅读 · 2018年3月19日
VIP会员
Top
微信扫码咨询专知VIP会员