CMU-Sam Thomson博士论文《自然语言的编码和解码图表示》

【导读】CMU博士Sam Thomson近日公开其博士毕业论文,Sam博士主要研究文本的图形化表示,提出一种新的编码和解码模型,有助于自然语言语义分析等关键问题。



【CMU博士论文全文下载】

请关注专知公众号(点击上方蓝色专知关注

  • 后台回复“NL编码解码” 就可以获取CMU-Sam Thomson博士论文的下载链接~ 


在分析文本时,将文本处理成表示其语言内容的更丰富的结构往往是有帮助的。有向图是一种自然而灵活的表示形式,特别是在自然语言语义方面。例如,它们对树的通用性使它们能够在处理共指消解(coreference and coordination等现象时表示关系语义。


本文主要研究文本的图形化表示。我们开发了一种新的解码算法和模型,用于从原始文本中自动提取图形;以及将图编码成张量,以便将它们用作下游神经网络的输入。我们主要关注语义图-表示句子意义的图形。语义图不一定是树,所以它们需要能够处理任意图的方法。


我们作出了三大贡献。

首先,我们介绍了神经Trubo(Neurbo)解析(neural Turbo (Neurbo) parsing),并证明了它是一种有效的语义依赖分析方法,特别是多任务语义依赖分析。接着,我们证明了对连通语义图进行解码的任务可以表述为一个节点边加权连通子图(Newcs)问题,这是网络优化中一个经典的、经过深入研究的问题的一个新的扩展,称为prize colting steiner tree(PCST)问题。这使得我们可以证明在连通性约束下解码的理论性质,并将现有的PCST求解技术应用于语义图的解码。最后,我们介绍了一种新的神经编码器,其约束形式允许通过动态规划进行有效的精确推理。我们介绍了两个模型:编码序列的软模式(SoPa)和编码图中所有路径的Kleene图编码网络(KGEN)。


-END-

专 · 知

专知《深度学习:算法到实战》课程全部完成!510+位同学在学习,现在报名,限时优惠!网易云课堂人工智能畅销榜首位!

欢迎微信扫一扫加入专知人工智能知识星球群,获取最新AI专业干货知识教程视频资料和与专家交流咨询!

请加专知小助手微信(扫一扫如下二维码添加),加入专知人工智能主题群,咨询《深度学习:算法到实战》课程,咨询技术商务合作~

请PC登录www.zhuanzhi.ai或者点击阅读原文,注册登录专知,获取更多AI知识资料!

点击“阅读原文”,了解报名专知《深度学习:算法到实战》课程

展开全文
Top
微信扫码咨询专知VIP会员