【普渡博士论文】具有深度层次结构和有效统计训练的可解释自然语言处理模型，121页pdf

自然语言处理（NLP）的目标是促进计算机与人类语言之间的通信，使计算机能够处理和分析大量的自然语言数据。语言的层次结构长期以来一直是语义分析的关键方面，并被认为是可以增强NLP任务结果的基础知识。纳入层次结构可以帮助NLP模型理解语言组件之间的关系并有效传达意义。本论文旨在增强语言模型对文本层次结构的理解。为此，我们建议使用一个深层次的RNN模型，该模型考虑到层次信息并使用潜在指标来表示层次结构。此外，采用了一个层次注意机制来提高模型的性能和可解释性。

为了解决计算复杂性并优化潜在指标，我们提出了各种统计训练方法。我们进一步研究了如何将模型扩展到一个序列到序列的模型，并提供了一个预训练模型的实用方法和一个层次解码方法，以增强其在文本生成任务（如翻译）中的性能。具体来说，我们的方法包括以下步骤：首先，我们区分显式和隐式的层次信息，并通过使用多尺度RNN和层次注意机制创建一个纳入这两种信息的层次RNN模型。其次，为了进一步改进模型，我们通过期望最大化（EM）算法整合潜在指标，使用Bootstrap抽样方法减少计算复杂性，并实施分层训练以进行更深层次的RNN。第三，我们将层次语言模型扩展到翻译任务的层次序列到序列模型。为了克服在生成过程中潜在指标的不稳定性，我们使用遮罩训练来预训练序列到序列模型，并提议一个结合遮罩预测和层次信息的层次解码方法。

此外，我们通过在各种NLP任务中的表现展示了我们方法的优越性。我们的方法达到了与大型语言模型相当的结果，同时提供了更高的可解释性。

成为VIP会员查看完整内容

相关内容

博士论文

关注 118

博士论文是由攻读博士学位的研究生所撰写的学术论文。它要求作者在博士生导师的指导下，选择自己能够把握和驾驭的潜在的研究方向，开辟新的研究领域。由此可见，这就对作者提出了较高要求，它要求作者必须在本学科的专业领域具备大量的理论知识，并对所学专业的理论知识有相当深入的理解和思考，同时还要具有相当水平的独立科学研究能力，能够为在学科领域提出独创性的见解和有价值的科研成果。因而，较之学士论文、硕士论文，博士论文具有更高的学术价值，对学科的发展具有重要的推动作用。

【普林斯顿博士论文】可扩展和可解释的学习：用于知识发现的概率模型， 140页pdf

专知会员服务

55+阅读 · 2023年10月10日

【斯坦福博士论文】非线性潜变量模型的推理和学习，180页pdf

专知会员服务

28+阅读 · 2023年9月9日

【斯坦福大学博士论文】面向现实应用的深度生成模型，222页pdf

专知会员服务

45+阅读 · 2023年9月7日

【CMU博士论文】资源受限场景下探索语言结构预测，228页pdf

专知会员服务

29+阅读 · 2023年9月3日