【多伦多大学博士论文】整合语言学理论与神经语言模型,104页pdf

2022 年 8 月 4 日 专知


基于Transformer的语言模型最近在许多自然语言任务中取得了显著的成果。然而,在排行榜上的表现通常是通过利用大量的训练数据和计算来实现的,而很少通过将显性语言知识编码到神经模型中来实现。这导致许多人质疑语言学与现代自然语言处理的相关性。在本论文中,我提出了几个案例研究,以说明如何理论语言学和深度神经语言模型仍然相互关联。首先,语言模型为语言学家提供了一个自动、客观的工具来测量语义距离,这是传统方法难以做到的。另一方面,语言学理论通过提供框架和数据来源,为语言理解的特定方面探索我们的语言模型,从而为语言建模研究做出贡献。


这篇论文贡献了三个研究,探讨了语言模型中语法-语义接口的不同方面。在论文的第一部分,我将语言模型应用于词类灵活性问题,这是理论语言学中一个长期争论的问题。使用mBERT作为跨多种语言的语义距离度量来源,我提出了支持将词类灵活性分析为定向过程的证据。在论文的第二部分,我提出了一种利用高斯模型进行密度估计的方法来测量语言模型中间层的惊讶度。我的实验表明,在语言模型中,包含形态句法异常的句子比语义和常识异常更早触发意外现象。最后,在我的论文的第三部分,我改编了几个心理语言学的研究,以表明语言模型包含论点结构结构的知识(从结构语法理论的动词配价分析)。总之,我的论文在自然语言处理、语言理论和心理语言学之间建立了新的联系,为语言模型的解释提供了新的视角。






专知便捷查看

便捷下载,请关注专知公众号(点击上方蓝色专知关注)

  • 后台回复“L104” 就可以获取【多伦多大学博士论文】整合语言学理论与神经语言模型,104页pdf》专知下载链接


                       
专知,专业可信的人工智能知识分发 ,让认知协作更快更好!欢迎注册登录专知www.zhuanzhi.ai,获取100000+AI(AI与军事、医药、公安等)主题干货知识资料!
欢迎微信扫一扫加入专知人工智能知识星球群,获取最新AI专业干货知识教程资料和与专家交流咨询
点击“ 阅读原文 ”,了解使用 专知 ,查看获取100000+AI主题知识资料
登录查看更多
6

相关内容

神经语言模型(Neural Language Model,NLM)是一类用来克服维数灾难的语言模型,它使用词的分布式表示对自然语言序列建模。不同于基于类的n-gram模型,神经语言模型在能够识别两个相似的词,并且不丧失将每个词编码为彼此不同的能力。神经语言模型共享一个词(及其上下文)和其他类似词。
【牛津大学博士论文】多模态自监督学习,172页pdf
专知会员服务
134+阅读 · 2022年10月4日
【CMU硬核书】数理逻辑与计算,526页pdf
专知会员服务
105+阅读 · 2022年9月14日
【CMU博士论文】神经序列建模与应用,102页pdf
专知会员服务
55+阅读 · 2022年8月23日
【2021新书稿】在线凸优化导论(第二版),260页pdf
专知会员服务
71+阅读 · 2021年12月23日
专知会员服务
87+阅读 · 2021年9月4日
专知会员服务
81+阅读 · 2021年7月29日
专知会员服务
63+阅读 · 2021年4月11日
【2022新书】视觉问答 (VQA):从理论到应用
【2022开放书】因果推理统计工具,377页pdf
【ETH博士论文】贝叶斯深度学习,241页pdf
专知
9+阅读 · 2022年1月16日
【干货书】高维统计学,572页pdf
专知
15+阅读 · 2021年12月3日
【干货书】计算机科学离散数学,627页pdf
专知
61+阅读 · 2020年8月31日
国家自然科学基金
8+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
2+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
1+阅读 · 2008年12月31日
Arxiv
0+阅读 · 2022年10月1日
已删除
Arxiv
32+阅读 · 2020年3月23日
A Multi-Objective Deep Reinforcement Learning Framework
Arxiv
14+阅读 · 2018年5月15日
VIP会员
相关VIP内容
【牛津大学博士论文】多模态自监督学习,172页pdf
专知会员服务
134+阅读 · 2022年10月4日
【CMU硬核书】数理逻辑与计算,526页pdf
专知会员服务
105+阅读 · 2022年9月14日
【CMU博士论文】神经序列建模与应用,102页pdf
专知会员服务
55+阅读 · 2022年8月23日
【2021新书稿】在线凸优化导论(第二版),260页pdf
专知会员服务
71+阅读 · 2021年12月23日
专知会员服务
87+阅读 · 2021年9月4日
专知会员服务
81+阅读 · 2021年7月29日
专知会员服务
63+阅读 · 2021年4月11日
相关基金
国家自然科学基金
8+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
2+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
1+阅读 · 2008年12月31日
Top
微信扫码咨询专知VIP会员