情感分析研究的新视野

2020 年 4 月 1 日 AINLP

作者：Caroline Brun

编译：ronghuaiyang

导读

对情感分析研究领域做了非常好的总结和展望。

假新闻、受欢迎程度、健康状况、金融和社会风险：情感分析正在帮助理解这一切。甚至可能引导我们理解为什么。。。

人们从一开始就对彼此的观点感兴趣，这是很自然的。然而，分析观点的科学工作可以追溯到20世纪初，当时人们试图从问卷中获取、分析和量化公众意见。与此同时，学术期刊“Public Opinion Quarterly”于1937年出版。然而，正是社交媒体平台的出现和采用导致了“情感分析”研究领域的诞生，以分析这种大规模的在线非结构化意见资源。

一般来说，情感分析利用文本分析来获取公众意见。它是自然语言处理(NLP)最有吸引力的用例之一，业界和学术界对此都很感兴趣。在情感分析中，基于nlp的数据挖掘过程和技术被应用于从用户生成内容(UGC)中提取和分析主观信息，其中大部分来自社交媒体(因为社交媒体太多了)。

它允许你衡量对某些产品、人或想法的情感(意见，但也包括情感)。情感分析传统上是关于意见的极性，即一个人是否对某人或某事有积极的、中立的或消极的看法，但它也可以是关于一个人或物体的特定方面。

它的流行自然源于它的广泛用途。客户服务、商业智能和产品或品牌声誉管理等商业应用尤其突出。在医疗保健领域，它可以用于检测药物不良反应的异常。它可以帮助监控金融市场的犯罪活动或情绪，但也可以衡量公众如何看待政治候选人。

如今，任何事件都可以在社交媒体上以闪电般的速度发布、查看、评论和分享，潜在的数百万人都可以参与其中。情感分析是一个重要工具，可以帮助人们理解所有事件，并在必要时做出反应。

情感分析是如何随着时间演变的

随着社交媒体渠道的发展，情感分析的研究任务和方法也在不断增加。在它的初期，情感分析仅仅是给英语语言的客户评论分配一个全局的，全面的极性标签(积极的，消极的，有时是中立的)。现阶段的研究包括了句子级别的主题检测，基于不同aspect的情感分析，在比喻型语言上的情感分析，基于主题的极性分类，事件的隐性的的极性分类，比如在没有显式的极性标记被提起的情况下，识别“pleasant”或者“unpleasant”事件。情感分类，现在更多的是在一个宽泛的多样的语言上和多种媒体资源上（使用Twitter数据已经成为必须品的了）进行立场的检测和论据的挖掘。任务的定义随后发展为更复杂的挑战，其中主观性、极性识别和意见挖掘已经使用细粒度的aspect和基于主题的预测变得更加丰富了。极性这个概念已经被心理学研究中定义的情感模型所补充。

情绪分析的方法、算法和资源也在不断发展。现有的研究已经产生了许多不同任务的技术，包括监督和非监督的方法。在监督环境下，早期的论文使用了各种监督机器学习方法(如支持向量机、最大熵、朴素贝叶斯等)和特征组合。非监督方法包括利用情感词汇、语法分析和句法模型的方法。近年来，深度学习在其他领域的成功和普及导致了它在情绪分析中的应用，经常使用词嵌入来表示输入文本。

在情感分类方面，递归神经网络(RNN)特别是长短时记忆(LSTM)网络及其捕获长距离依赖关系的能力已经取得了极性分类的最新成果。注意力模型也已经被证明可以提供有趣的结果，因为它们可以捕获句子中有关aspects的重要信息。

NLP与深度学习方法并存。经典的NLP方法利用语言先验知识来降低监督水平，以保证在包括情感分析在内的各种任务上的准确性。深度学习方法的主要缺点是需要大量带标注的数据。这意味着一定的成本，特别是对于复杂和结构化的语义。鉴于这一点，当前的研究趋势提倡整合先验语法知识用到深度学习架构中用于文本分析，还有一些工作得到了情感分析方面的有趣的结果。

长期存在的挑战和新的领域

尽管在情感分析上，越来越多的研究取得了进展，但处理文本中的“‘affective phenomena”，如主体性、aspects、情感、情绪、语气、态度和感受，已被证明是一个复杂的、跨学科的问题，远远没有得到解决。必须考虑许多参数，如作者的个人资料、文本类型、样式、域、文档来源、目标语言和最终应用的目标。公开的实验结果(通常在相对有利的环境中获得)与系统在真实环境中获得的结果之间也存在差距。

自然语言

准确的情绪分析的主要障碍一直是自然语言，现在仍然是，原因有很多。

自然语言是模糊的，词可能有不同的极性方向，这取决于上下文和领域。例如，形容词“predictable”在描述电影结尾时可能是否定的，但在描述产品质量时可能是肯定的。

为了表达自己的观点，人们经常使用形象化的语言，如反讽和讽刺。这些对于NLP来说是极具挑战性的任务，在这些任务中，机器学习方法很容易被具有强烈极性的词汇误导，但这些词汇却被讽刺地使用(意思是相反的极性是有意的)。

否定(虚假性的表达)和模态(必然性、可容许性和概率的表达，例如"应该是"或"可能是")是复杂的语言现象，它们对表达观点时所使用的表达方式的语义有很大的影响。处理否定的场景和的模态在情感分析中尤为重要。

理解上下文是理解观点的必要条件。指代消解，即分辨代词或名词短语所指的人或物，是NLP技术面临的一个众所周知的挑战，也是理解观点的重要一步。

最后，UGC中充斥着隐含情绪(事实性表达，暗示积极或消极情绪)，例如“She is still looking for another Oscar nod. Not here though”中暗含推理的语句。这些表达与可用的和不可用的事实或行为有关，但不要使用自以为是的词汇，这意味着很难自动捕获它们。

挑战性的任务

情感分析在本质上是具有挑战性的，但人们对其他相关任务的兴趣越来越大，而这些任务可能会更加困难。

基于aspect的情感分析 (ABSA)旨在捕捉用户生成的评论中对产品、电影、公司等实体的不同方面所表达的情感。Aspect是一个实体的属性，例如手机屏幕(相对于它的重量或大小等)，餐馆的服务(相对于位置或价格等)，或相机的图像质量等。它可以由与实体相关联的本体来描述。ABSA意味着识别一个实体的不同aspect以及相应的情感。特别是随着SemEval挑战赛致力于这个方面，对这个任务的兴趣最近有所增加。除了基本的基线检测之外，它正成为情感分析的“标准”任务。我们开发的一个ABSA系统获得的结果在2016年SemEval挑战赛的最佳结果。我们现在将它集成到地图搜索引擎中，以创建感兴趣点的感知地图搜索。我们也调查了ABSA在最终的应用设置上的评价，并为此创造了一个新的ABSA标注数据集(基于FourSquare数据)，可以从这个网站(http://www.europe.naverlabs.com/Research/Natural-Language-Processing/Aspect-Based-Sentiment-Analysis-Dataset)下载。

情绪分析，检测并识别文本中的情绪类型，如愤怒、厌恶、恐惧、快乐、悲伤和惊讶。根据美国心理学家Paul Ekman和Wallace V. Friesen的理论，这六种基本情绪是最广泛使用的。这里最大的挑战之一是，在大多数情况下，情绪是隐含在文本中的，例如，一个句子中可能有“愤怒”的元素，但是没有使用“愤怒”这个词或它的任何同义词。再加上没有标注过的文本数据，这使它变得更加困难。目前通常使用标准的分类技术，结合WordNet Affect或SentiWordnet等资源，辅以隐含情绪获取常识知识。

垃圾内容和虚假检测：虚假评论和虚假新闻是一个紧密相关的现象，它们都是由写作和传播虚假信息或信仰组成的。这里最大的挑战是缺乏一种有效的方法来区分真实的评论和虚假的评论。即使是人类也很难分辨出其中的区别。再一次，我们面临着严重缺乏ground truth数据集来帮助我们。大多数方法关注于评论的内容(评论的长度、特定的词汇、词性等)和评论者的行为(如发表时间、发表频率、文章的第一审稿人等)。

多语种情感分析 目前大多数的情绪分析系统通常只涉及英语，但网上的意见存在于更多的语言。只使用一种语言的情绪分析工具会极大地增加丢失用其他语言编写的重要信息的风险。为了解决这一难题，目前的方法主要是将极性信息与多语言词嵌入相结合。

多模态情感分析 随着社交多媒体的普及，多模态情感分析将带来新的机遇，它将整合其他互补的数据流，如面部和声音的显示和表达，往往以一种非常有力的方式表达情感。这样做不仅能改进基于文本的情绪分析，甚至还能超越它。难点在于如何在真实环境中提取视觉情感(低分辨率、主体运动)，以及如何从音频文本中可靠提取语言和副语言特征。

实时情感分析：全球每秒钟都会产生大量的实时数据，其中大部分是非结构化的文本消息。如果我们能够实时分析这些数据，我们不仅能快速发现问题的答案，还能解决实时问题。这将需要专门的预处理或分布式架构的开发，这些架构本身就致力于在线分析算法。

最后，论点挖掘是未来情感分析技术最具挑战性的方向之一。情感分析是了解用户对某些方面的看法，论证的目的是找出这些看法产生的原因和整体的推理路径。

主要目标是从通用文本语料库中自动提取参数，为参数和推理引擎的计算模型提供结构化数据。从理论上讲，论点挖掘可以发现知识，使我们能够发现一般观点的“正当性”，例如(为什么人们会这样想)，为复杂的政治问题生成细粒度的辩论图，或者改进一般观点挖掘算法。论点挖掘与另一个新兴的任务立场分类高度相关，其(更简单的)目标是确定评论的作者是否支持评论的(通常)有争议的目标主题。挖掘论证是一项极具挑战性的任务，因为它需要大量的常识、全局知识、领域知识和上下文知识。人们提出了许多论证模型，并将其应用于自动识别，它们是文本论证标注的基础。

近年来，深度学习模型被广泛地应用于模型上下文的论证挖掘中，对全局知识的获取有很大的帮助。然而，这些模型在自动从文本数据获取常识和全局知识方面存在局限性。论证挖掘在某些方面可以看作是情感分析的一种演变：意见挖掘的目的是了解人对某事的看法，而论证挖掘的目的是了解为什么，即挖掘人的正反论点，从而揭示推理过程。

情感分析是自然语言处理中最活跃的研究领域之一，但它还远远没有成为一个可以解决的问题。它涉及对词汇、句法和语义规则的深刻理解，并结合背景知识。在大数据背景下，自然语言的内在复杂性和新的具有挑战性的情感分析任务意味着，在情感语言理解方面存在着比以往任何时候都更引人入胜的研究视角。我发现最鼓舞人心的是一些复杂的问题，如检测隐性的情绪、能够处理多种语言、欺骗检测、实时事件分析以及自动获取常识、全局和上下文知识。

—END—

英文原文：https://europe.naverlabs.com/blog/new-horizons-in-sentiment-analysis-research/

推荐阅读

AINLP年度阅读收藏清单

自动作诗机&藏头诗生成器：五言、七言、绝句、律诗全了

逆向而行，中文轻量级预训练模型的探索之路

From Word Embeddings To Document Distances 阅读笔记

模型压缩实践系列之——bert-of-theseus，一个非常亲民的bert压缩方法

这门斯坦福大学自然语言处理经典入门课，我放到B站了

可解释性论文阅读笔记1-Tree Regularization

关于AINLP

AINLP 是一个有趣有AI的自然语言处理社区，专注于 AI、NLP、机器学习、深度学习、推荐算法等相关技术的分享，主题包括文本摘要、智能问答、聊天机器人、机器翻译、自动生成、知识图谱、预训练模型、推荐系统、计算广告、招聘信息、求职经验分享等，欢迎关注！加技术交流群请添加AINLPer(id：ainlper)，备注工作/研究方向+加群目的。