自然语言处理(NLP)的目标是促进计算机与人类语言之间的通信,使计算机能够处理和分析大量的自然语言数据。语言的层次结构长期以来一直是语义分析的关键方面,并被认为是可以增强NLP任务结果的基础知识。纳入层次结构可以帮助NLP模型理解语言组件之间的关系并有效传达意义。 本论文旨在增强语言模型对文本层次结构的理解。为此,我们建议使用一个深层次的RNN模型,该模型考虑到层次信息并使用潜在指标来表示层次结构。此外,采用了一个层次注意机制来提高模型的性能和可解释性。

为了解决计算复杂性并优化潜在指标,我们提出了各种统计训练方法。我们进一步研究了如何将模型扩展到一个序列到序列的模型,并提供了一个预训练模型的实用方法和一个层次解码方法,以增强其在文本生成任务(如翻译)中的性能。 具体来说,我们的方法包括以下步骤:首先,我们区分显式和隐式的层次信息,并通过使用多尺度RNN和层次注意机制创建一个纳入这两种信息的层次RNN模型。其次,为了进一步改进模型,我们通过期望最大化(EM)算法整合潜在指标,使用Bootstrap抽样方法减少计算复杂性,并实施分层训练以进行更深层次的RNN。第三,我们将层次语言模型扩展到翻译任务的层次序列到序列模型。为了克服在生成过程中潜在指标的不稳定性,我们使用遮罩训练来预训练序列到序列模型,并提议一个结合遮罩预测和层次信息的层次解码方法。

此外,我们通过在各种NLP任务中的表现展示了我们方法的优越性。我们的方法达到了与大型语言模型相当的结果,同时提供了更高的可解释性。

成为VIP会员查看完整内容
34

相关内容

博士论文是由攻读博士学位的研究生所撰写的学术论文。它要求作者在博士生导师的指导下,选择自己能够把握和驾驭的潜在的研究方向,开辟新的研究领域。由此可见,这就对作者提出了较高要求,它要求作者必须在本学科的专业领域具备大量的理论知识,并对所学专业的理论知识有相当深入的理解和思考,同时还要具有相当水平的独立科学研究能力,能够为在学科领域提出独创性的见解和有价值的科研成果。因而,较之学士论文、硕士论文,博士论文具有更高的学术价值,对学科的发展具有重要的推动作用。
【MIT博士论文】数据高效强化学习,176页pdf
最新《图嵌入组合优化》综述论文,40页pdf
【KDD2020】图神经网络:基础与应用,322页ppt
最新《动态网络嵌入》综述论文,25页pdf
专知
34+阅读 · 2020年6月17日
国家自然科学基金
11+阅读 · 2017年12月31日
国家自然科学基金
2+阅读 · 2016年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Arxiv
158+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
408+阅读 · 2023年3月31日
Arxiv
68+阅读 · 2023年3月26日
VIP会员
相关基金
国家自然科学基金
11+阅读 · 2017年12月31日
国家自然科学基金
2+阅读 · 2016年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
微信扫码咨询专知VIP会员