本栏目每周将推荐若干篇由师生精心挑选的前沿论文,分周三、周五两次推送。
本次推荐了关于迁移学习、多对象情感分类、噪音建模的三篇论文。
1
推荐组:SP
推荐人:蔡碧波(研究方向:消费意图识别)
论文题目:Partial Transfer Learning with Selective Adversarial Networks
作者:Zhangjie Cao, Mingsheng Long*, Jianmin Wang, Michael I. Jordan
出处:CVPR 2018 (Spotlight Paper)
论文主要相关:迁移学习
简评:在传统迁移学习中,源领域和目标领域有着相同的类别空间。即源领域的类别个数与目标领域的类别个数相同。而实际情况中,我们通常有大量的源领域的数据,在类别上, 源领域的数据比目标领域的数据更为丰富。即目标领域的类别只是源领域数据的类别的一部分。而在训练过程中,那些只存在于源领域独有的类别的数据并不能对目标领域的训练起到正向作用甚至会导致负迁移。基于此,本文首次提出部分迁移学习的概念,在此情景中,源领域的类别数大于目标领域的类别数,且目标领域无标签,并不知道目标领域和源领域中的哪个类别更相似,另外利用了对抗网络去学习领域不变特征来解决部分迁移问题。在迁移学习中的判别器的作用是最大限度地区分源领域和目标领域,生成器的作用是提取领域不变特征用于迷惑判别器。本文提出的SDA网络通过协同对抗网络和基于源领域数据训练得到的分类器的功能,尽可能的只迁移源领域中与目标领域相关的那部分的样本,达到了避免负迁移的效果。最后进行的实验证明,本文提出的方法成功的解决了目标领域的类别空间包含于源领域的类别空间时的部分迁移学习的问题。
论文链接:
https://arxiv.org/pdf/1707.07901.pdf
2
推荐组:SA
推荐人:王帅(研究方向:情感分析)
论文题目:Document-Level Multi-Aspect SentimentClassification as Machine Comprehension
作者:Yichun Yin, Yangqiu Song, Ming Zhang
出处:EMNLP 2017
论文主要相关:多对象情感分类
简评:篇章级的多对象情感分类旨在分析包含多个对象的评论长文中评论者对每个对象的情感,是非常有实用意义的一种情感分析任务。通常的方法是对每个对象做一个分类任务,作为对象的评级。本文另辟蹊径,将该任务看做一个机器理解问题,将对象看做问题,将对象的评级看做答案,从文章中得到问题的答案。本文使用了多层迭代的注意力模型来构建文章对于特定对象的表示,并将这个表示用于生成问题的答案,即对象的评级。该方法在TripAdvisor和BeerAdvocate数据集上与MHLSTM、MHAN相比效果有明显的提高。
论文链接:
https://www.aclweb.org/anthology/D/D17/D17-1217.pdf
源码链接:
https://github.com/HKUST-KnowComp/DMSC
3
推荐人:陈双(研究方向:文本生成)
论文题目: Learningwith Noise: Enhance Distantly Supervised Relation Extraction with DynamicTransition Matrix
作者: Bingfeng Luo, Yansong Feng,Zheng Wang, Zhanxing Zhu, Songfang Huang, Rui Yan and Dongyan Zhao
出处: ACL2017
论文主要相关:基于距离监督的关系抽取,噪音建模
简评:在关系抽取领域,其广泛依赖于基于知识库对齐所构建的距离监督语料。距离监督方法为模型提供更多训练数据的同时,也引入了噪声。为了解决噪音数据的影响,本文提出了一种对噪音建模的新视角,即在经典的关系抽取模型基础上,引入动态转移矩阵建模训练数据的真实类别和误标注类别间的条件概率,并将其与模型预测的类别分布相结合得到观测概率分布。同时,为了解决训练模型的挑战,本文还提出了一种基于课程学习的训练方法,即让模型首先学习一些基本的能力,然后在学习处理噪声的能力。具体来讲,本文提出两种设计课程学习方案的方法:1) 控制转移矩阵的迹作为正则化项 2) 在对数据质量有先验知识的前提下,先使用噪音较小的数据对模型进行训练,然后逐步引入噪音稍大的数据。最后本文通过实验证明了对噪音建模可以帮助提升已有关系抽取模型的准确率,并且基于课程学习的训练方法能够帮助模型学习到噪音建模模块。
论文链接:
https://arxiv.org/abs/1705.03995
往期链接:
点击文末“阅读原文”即可查看完整赛尔推荐目录
(信息检索、生成式摘要、开放域问答)
(句子表示学习、描述生成、迁移学习)
(自然答案生成、问句重新表述和问答系统)
(事件抽取、image caption、对象级情感分析)
本期责任编辑: 张伟男
本期编辑: 孙 卓
“哈工大SCIR”公众号
主编:车万翔
副主编: 张伟男,丁效
责任编辑: 张伟男,丁效,赵森栋,刘一佳
编辑: 李家琦,赵得志,赵怀鹏,吴洋,刘元兴,蔡碧波,孙卓
长按下图并点击 “识别图中二维码”,即可关注哈尔滨工业大学社会计算与信息检索研究中心微信公共号:”哈工大SCIR” 。