文本简化(TS)旨在降低内容的语言复杂性,使其更容易理解。人们对TS的研究很感兴趣,特别是当TS的方法从手工制定的规则转向自动化简化的时候。本综述旨在提供TS的全面概述,包括对早期使用的方法的简要描述,对简化的各个方面(词汇、语义和句法)的讨论,以及在该领域使用的最新技术。我们注意到,该领域的研究已经明显转向利用深度学习技术执行TS,并特别关注于开发解决方案,以解决简化可用数据的缺乏问题。我们还讨论了常用的数据集和评估指标,以及自然语言处理(NLP)中的相关领域,比如语义相似度。
https://arxiv.org/abs/2008.08612