ACL 2019 | 巧用文本语境信息：基于上下文感知的向量优化

2019 年 6 月 18 日 PaperWeekly

「论文访谈间」是由 PaperWeekly 和中国中文信息学会社会媒体处理专委会（SMP）联合发起的论文报道栏目，旨在让国内优质论文得到更多关注和认可。

论文动机

作为典型的细粒度情感分析任务，目标-方面级别情感分析是自然语言处理领域的研究热点之一，结合注意力机制的深度网络模型在目标-方面级别情感分析任务中取得了令人瞩目的成功，但是仍存在一些待解决问题。

本文主要解决以下两个问题：

1. 现有的方法在表示目标（target）和方面（aspect）时往往会脱离上下文。这种随机初始化或不依赖于上下文的表示方法有三个弊端：1）同一个目标或方面的向量表示在表达不同情感极性的句子中没有得到区分；2）目标不是确定实体时（例如“这个酒店”，“这个餐馆”，“那部电影”等），输入信息无法体现实体本身的价值；3）忽略了目标和方面之间的相互联系。

2. 目标和方面在上下文中存在重叠的关联映射关系。在一句话中，一个目标可能会对应多个方面，而不同的方面可能会包含不同的情感极性。另一方面，在同一句话中往往会存在多个目标，所以目标和方面之间会存在错综复杂的对应关系。如图 1：

句子中的“location1”和“location2”是两个不同的目标，每一个目标会对应多个方面（Safety，Price，Transit 等），并且不同的方面可能会存在不同的情感极性。这里有一个有趣的现象，如果将“location1”和“location2”的位置交换，那么“location1”和“location2”所表达的方面和情感都会发生改变。所以，如何通过语境上下文精确推断目标和方面的相互关系以及文本对不同方面对象表达的情感是目标-方面级别情感分析任务的主要挑战之一。

方法

为解决上述问题，本文提出了一种结合上下文信息优化目标和方面向量表示的方法，该方法可以直接和现有基于神经网络的目标-方面级别情感分析模型相结合（如图 2 所示）。

因为句子中的目标是任务的基础，然而考虑到同一个句子存在多个目标，如何针对不同目标从上下文中自动学习向量表示呢？

具体来说，我们使用一个稀疏系数向量来提取文本中与目标相关度较高的词语，并使用这些词语作为目标的上下文信息。通过对目标上下文词向量的聚合获得目标的最终表示。通过这种方法，目标的向量表示可以从上下文中自动学习，所以就算句子中的目标不是确定的实体，我们也能得到有价值的向量表示。

上下文感知的向量优化主要包含两个部分：重新构建目标向量和微调方面向量。为了使文本词向量里带有目标与方面信息，此处首先将文本的词向量序列输入一个全连接网络，之后利用一个阶跃函数将得到的文本向量稀疏化，以此表示文本中与目标相关的词语的掩码。最后通过将稀疏系数向量和输入的文本向量结合可以得到上下文相关的目标和方面表示。

在训练过程中，1）针对目标表示，我们希望获得的上下文相关目标向量尽量接近输入的目标向量，2）针对方面表示，我们希望上下文相关的方面表示尽可能靠近和它相关联的目标，远离无关的目标。

上下文相关的目标向量表示

为了使目标表示从上下文中自动生成，所以我们将提取上下文中和目标有高度关联的重要词语来优化目标向量表示：