本期为本学期最后一期赛尔推荐,下学期开学后将继续发布,敬请期待!
本次推荐了三篇关于迁移学习、强化学习和文本摘要的论文。
1
推荐组:SA
推荐人: 袁建华(研究方向:情感分析)
论文题目:Using millions of emoji occurrences to learn any-domain representations for detecting sentiment, emotion and sarcasm
作者:Bjarke Felbo, Alan Mislove, Anders Søgaard, Iyad Rahwan, Sune Lehmann
出处:EMNLP 2017
论文主要相关:远距离监督、Twitter情感分类、迁移学习
简评:本文使用远距离监督(Distant Supervision)方法,从Twitter数据上收集大规模的含表情符、带噪声的情绪语料。接着移除语料中的表情符作为ground-truth标签,预测Tweet文本剩余部分可能的表情符。通过预测表情符,本文提出的DeepMoji模型能学到文本情绪相关的特征表示。作者通过迁移学习将上述模型应用到情感、情绪、反讽分类任务上,取得了目前最好的结果。本文与之前使用Emoji和Emoticon情感分析模型的最大区别在于,DeepMoji使用多达64种表情符,表情符的多样性使得模型能学习到更好的文本情绪表示,而且学习的结果更加鲁棒。
论文链接:
https://www.aclweb.org/anthology/D17-1169
数据链接:
https://github.com/bfelbo/DeepMoji
2
推荐组:SP
推荐人:石继豪(研究方向:社会计算、智能金融)
论文题目:Mining Evidences for Concept Stock Recommendation
作者:Qi Liu, Yue Zhang
出处:NAACL 2018
论文主要相关:信息检索、强化学习
简评:本文的任务是根据给定股票市场中某一概念,从新闻、财报等数据源中发现相关概念股。文中作者将给定的“概念”比作信息检索中的查询,将相关概念股比作信息检索中查询得到的结果,根据新闻、财报等数据源建立概念及概念股之间的关系。首先想到的方法是对查询结果进行排序,但这种方法需要大量的标注语料才能达到不错的效果。同时,这种方法还面临着另一个问题,数据集高度不均衡。股票市场中有数以千计的股票,但特定概念的概念股相对来说数量较少,这种情形极大地影响训练过程的性能。本文采用查询扩展的方法,但不同于以往的人工构建规则的查询扩展(例如k近邻查询扩展),本文通过利用强化学习对查询进行动态扩展。k近邻查询每次扩增固定数量k个,有时会引入无关查询,而采用强化学习的方法可以学到策略——某一候选概念是否对概念股推荐的准确性起到提升、降低还是无影响的作用。在金融界和同花顺数据集上的实验结果优于很强的信息检索技术的baseline。
--Sample Output--
Query: 房地产
Results:招商地产,滨江集团,世荣兆业, 绿景地产, 万科, 大龙地产, 苏宁环球, 上实发展, 阳光发展
论文链接:
http://aclweb.org/anthology/N18-1191
源代码链接:
https://github.com/leuchine/concept-stock-recommendation
3
推荐组:TG
推荐人:孙亚威(研究方向:文本摘要)
论文题目:Neural Document Summarization by Jointly Learning to Score and Select Sentences
作者:Qingyu Zhou, Nan Yang, Furu Wei, Shaohan Huang, Ming Zhou, Tiejun Zhao
出处: ACL 2018
论文主要相关: NEUSUM模型,最大边缘相关模型(MMR), 文本摘要
简评:句子评分和句子选择是文本摘要系统的两个主要步骤,但在之前的工作中,这两个步骤作为系统的两个子任务被分开。这种分割任务的坏处在于两个任务不能互相利用彼此的信息。这篇论文提供了一种端到端神经网络架构的文本摘要系统,该系统将句子评分和句子选择这两个孤立的步骤连接起来。本文利用CNN/Daily Mail数据集,在最大边缘相关模型基础之上加以改进进而提出NEUSUM模型,这个模型主要分为文本编码和句子抽取两部分。首先它用分层编码器读取文本的句子,以获取句子的抽象表示,其中编码器分为文档层编码和句子层编码两层,采用GRU模型。接着它利用句子评分和选择的结果逐个抽取句子,从而构造文本摘要输出,在这个过程中句子评分和句子选择被统一为一个整体,不仅句子评分可以利用之前迭代中已近选取句子的信息,句子的选择过程也会被简化。实验结果将LEAD3、TEXTRANK、CRSUM、NN-SE、SUMMAR-RUNNER以及PGN六种常见模型作为BASELINE,进行比较,文本摘要效果明显优于前面两步骤割裂的传统模型方法。本文的亮点在于基于最大边缘相关模型基础之上,提出一种将句子评分和句子选择两个独立步骤统一结合的思想,在每次选择句子的时候它都会依据之前部分抽取摘要以及当前句子状态联合评分。
论文链接:
暂无
往期链接:
点击文末“阅读原文”即可查看完整赛尔推荐目录
(个性化聊天机器人、对话状态跟踪、简单词向量模型和注意力机制)
(评价对象、情感分类、知识图谱、机器翻译和层次化)
(共指消解、注意力机制、指称识别、指称聚类、问答系统和动词分类)
(跨语言、情感分类、词向量、事件检测、文本问答、视觉问答、记忆网络和关系推理)
本期责任编辑: 张伟男
本期编辑: 孙 卓
“哈工大SCIR”公众号
主编:车万翔
副主编: 张伟男,丁效
责任编辑: 张伟男,丁效,赵森栋,刘一佳
编辑: 李家琦,赵得志,赵怀鹏,吴洋,刘元兴,蔡碧波,孙卓,赖勇魁
长按下图并点击 “识别图中二维码”,即可关注哈尔滨工业大学社会计算与信息检索研究中心微信公共号:”哈工大SCIR” 。