本文研究了新闻中的宣传手段(propaganda)检测。和之前仅仅从训练数据中的输入-输出数据中进行学习不同,本文进一步提出了一种方法在细粒度的宣传手段检测中引入了声明性知识(declarative knowledge)。具体来说,本文同时利用了一阶逻辑和自然语言文本中的声明性知识。前者是指粗粒度预测和细粒度预测之间的逻辑一致性,通过布尔表达式来对训练过程进行正则化。后者指每一种宣传手段的定义,它被利用于获得这一类宣传手段的特征表示,从而对模型参数进行正则化。本文在“Propaganda Techniques Corpus (PTC)”数据集上进行实验,它是一个大规模的人工标注的数据集,用于细粒度的宣传手段检测。实验结果表明,本文提出的模型取得了优异的性能,验证了利用声明性知识可以帮助模型进行更准确的预测。
https://www.zhuanzhi.ai/paper/69553c6775073b80179e52ebb4e90ce9