【多伦多大学博士论文】整合语言学理论与神经语言模型，104页pdf - 专知

会员服务 ·

0

【多伦多大学博士论文】整合语言学理论与神经语言模型，104页pdf

2022 年 8 月 4 日 专知

基于Transformer的语言模型最近在许多自然语言任务中取得了显著的成果。然而，在排行榜上的表现通常是通过利用大量的训练数据和计算来实现的，而很少通过将显性语言知识编码到神经模型中来实现。这导致许多人质疑语言学与现代自然语言处理的相关性。在本论文中，我提出了几个案例研究，以说明如何理论语言学和深度神经语言模型仍然相互关联。首先，语言模型为语言学家提供了一个自动、客观的工具来测量语义距离，这是传统方法难以做到的。另一方面，语言学理论通过提供框架和数据来源，为语言理解的特定方面探索我们的语言模型，从而为语言建模研究做出贡献。

这篇论文贡献了三个研究，探讨了语言模型中语法-语义接口的不同方面。在论文的第一部分，我将语言模型应用于词类灵活性问题，这是理论语言学中一个长期争论的问题。使用mBERT作为跨多种语言的语义距离度量来源，我提出了支持将词类灵活性分析为定向过程的证据。在论文的第二部分，我提出了一种利用高斯模型进行密度估计的方法来测量语言模型中间层的惊讶度。我的实验表明，在语言模型中，包含形态句法异常的句子比语义和常识异常更早触发意外现象。最后，在我的论文的第三部分，我改编了几个心理语言学的研究，以表明语言模型包含论点结构结构的知识(从结构语法理论的动词配价分析)。总之，我的论文在自然语言处理、语言理论和心理语言学之间建立了新的联系，为语言模型的解释提供了新的视角。

专知便捷查看

便捷下载，请关注专知公众号（点击上方蓝色专知关注）

后台回复“L104” 就可以获取《【多伦多大学博士论文】整合语言学理论与神经语言模型，104页pdf》专知下载链接

专知，专业可信的人工智能知识分发 ，让认知协作更快更好！欢迎注册登录专知www.zhuanzhi.ai，获取100000+AI(AI与军事、医药、公安等)主题干货知识资料！

欢迎微信扫一扫加入专知人工智能知识星球群，获取最新AI专业干货知识教程资料和与专家交流咨询！

点击“ 阅读原文 ”，了解使用专知 ，查看获取100000+AI主题知识资料

登录查看更多

6

相关内容

神经语言模型

神经语言模型

神经语言模型（Neural Language Model，NLM）是一类用来克服维数灾难的语言模型，它使用词的分布式表示对自然语言序列建模。不同于基于类的n-gram模型，神经语言模型在能够识别两个相似的词，并且不丧失将每个词编码为彼此不同的能力。神经语言模型共享一个词（及其上下文）和其他类似词。

【牛津大学博士论文】多模态自监督学习，172页pdf

【牛津大学博士论文】多模态自监督学习，172页pdf

专知会员服务

136+阅读 · 2022年10月4日

【CMU硬核书】数理逻辑与计算，526页pdf

【CMU硬核书】数理逻辑与计算，526页pdf

专知会员服务

108+阅读 · 2022年9月14日

【CMU博士论文】神经序列建模与应用，102页pdf

【CMU博士论文】神经序列建模与应用，102页pdf

专知会员服务

58+阅读 · 2022年8月23日

【2021新书稿】在线凸优化导论(第二版)，260页pdf

【2021新书稿】在线凸优化导论(第二版)，260页pdf

专知会员服务

73+阅读 · 2021年12月23日

【博士论文】基于深度学习的联合实体关系抽取

专知会员服务

91+阅读 · 2021年9月4日

《深度学习自然语言处理》新书，141页pdf，Arizona大学

专知会员服务

84+阅读 · 2021年7月29日

【UMASS博士论文】几何表示学习，162页pdf

专知会员服务

65+阅读 · 2021年4月11日

机器阅读理解的任务与模式研究，61页pdf，多伦多约克大学

机器阅读理解的任务与模式研究，61页pdf，多伦多约克大学

专知会员服务

22+阅读 · 2020年1月28日

慕尼黑大学LMU博士论文：自然语言文本神经网络信息提取，240页pdf

慕尼黑大学LMU博士论文：自然语言文本神经网络信息提取，240页pdf

专知会员服务

74+阅读 · 2020年1月13日

【伯克利博士论文】从自然语言中学习（附106页pdf全文下载）

【伯克利博士论文】从自然语言中学习（附106页pdf全文下载）

专知会员服务

51+阅读 · 2019年10月26日

【IJCAI2022教程】口语语言理解:最新进展和新领域，99页ppt

【IJCAI2022教程】口语语言理解:最新进展和新领域，99页ppt

专知

0+阅读 · 2022年7月30日

【斯坦福大学博士论文】监督和自监督深度学习泛化的理论见解

【斯坦福大学博士论文】监督和自监督深度学习泛化的理论见解

专知

3+阅读 · 2022年7月9日

【实用书】统计显著性测试以及在自然语言中的应用，118页pdf

【实用书】统计显著性测试以及在自然语言中的应用，118页pdf

专知

1+阅读 · 2022年6月4日

【2022新书】视觉问答 (VQA)：从理论到应用

【2022新书】视觉问答 (VQA)：从理论到应用

专知

7+阅读 · 2022年5月24日

【2022开放书】因果推理统计工具，377页pdf

【2022开放书】因果推理统计工具，377页pdf

专知

6+阅读 · 2022年4月20日

【Chen Guanyi博士论文】汉语名词短语的计算生成，282页pdf

【Chen Guanyi博士论文】汉语名词短语的计算生成，282页pdf

专知

0+阅读 · 2022年4月14日

【ETH博士论文】贝叶斯深度学习，241页pdf

【ETH博士论文】贝叶斯深度学习，241页pdf

专知

9+阅读 · 2022年1月16日

【2021新书稿】在线凸优化导论(第二版)，260页pdf

【2021新书稿】在线凸优化导论(第二版)，260页pdf

专知

3+阅读 · 2021年12月23日

【干货书】高维统计学，572页pdf

【干货书】高维统计学，572页pdf

专知

19+阅读 · 2021年12月3日

【干货书】计算机科学离散数学，627页pdf

【干货书】计算机科学离散数学，627页pdf

专知

64+阅读 · 2020年8月31日

面向汉语文本理解的语义计算方法

国家自然科学基金

8+阅读 · 2014年12月31日

基于因果构造和推理的专家判断关键技术研究

国家自然科学基金

3+阅读 · 2012年12月31日

基于领域本体的蒙古文数字资源整合机制研究

国家自然科学基金

0+阅读 · 2011年12月31日

基于半监督结构化学习的跨语言映射研究

国家自然科学基金

2+阅读 · 2011年12月31日

汉语文本推理的资源建设和统计分析研究

国家自然科学基金

0+阅读 · 2011年12月31日

基于“#24847;象”#24605;维的缺血性中风发病早期中医诊断模式的科学内涵研究

国家自然科学基金

0+阅读 · 2011年12月31日

隐喻识别与理解的理论与方法研究

国家自然科学基金

0+阅读 · 2011年12月31日

中英双语者语言理解转换中的词汇加工机制

国家自然科学基金

1+阅读 · 2009年12月31日

汉语句子理解中语义和句法整合的认知神经机制

国家自然科学基金

0+阅读 · 2009年12月31日

知识证明协议及其应用研究

国家自然科学基金

1+阅读 · 2008年12月31日

The openVA Toolkit for Verbal Autopsies

Arxiv

0+阅读 · 2022年10月1日

End-to-End Label Uncertainty Modeling in Speech Emotion Recognition using Bayesian Neural Networks and Label Distribution Learning

Arxiv

1+阅读 · 2022年9月30日

Generated Knowledge Prompting for Commonsense Reasoning

Arxiv

0+阅读 · 2022年9月28日

Enable Deep Learning on Mobile Devices: Methods, Systems, and Applications

Arxiv

35+阅读 · 2022年4月25日

AI for Next Generation Computing: Emerging Trends and Future Directions

Arxiv

19+阅读 · 2022年3月5日

Causality and Generalizability: Identifiability and Learning Methods

Arxiv

12+阅读 · 2021年10月4日

已删除

Arxiv

32+阅读 · 2020年3月23日

A Multi-Objective Deep Reinforcement Learning Framework

A Multi-Objective Deep Reinforcement Learning Framework

Arxiv

16+阅读 · 2018年6月27日

Chinese NER Using Lattice LSTM

Arxiv

14+阅读 · 2018年5月15日

VQA-E: Explaining, Elaborating, and Enhancing Your Answers for Visual Questions

Arxiv

17+阅读 · 2018年3月20日

VIP会员

相关主题

神经语言模型

深度神经语言模型

相关VIP内容

【牛津大学博士论文】多模态自监督学习，172页pdf

【牛津大学博士论文】多模态自监督学习，172页pdf

专知会员服务

136+阅读 · 2022年10月4日

【CMU硬核书】数理逻辑与计算，526页pdf

【CMU硬核书】数理逻辑与计算，526页pdf

专知会员服务

108+阅读 · 2022年9月14日

【CMU博士论文】神经序列建模与应用，102页pdf

【CMU博士论文】神经序列建模与应用，102页pdf

专知会员服务

58+阅读 · 2022年8月23日

【2021新书稿】在线凸优化导论(第二版)，260页pdf

【2021新书稿】在线凸优化导论(第二版)，260页pdf

专知会员服务

73+阅读 · 2021年12月23日

【博士论文】基于深度学习的联合实体关系抽取

专知会员服务

91+阅读 · 2021年9月4日

《深度学习自然语言处理》新书，141页pdf，Arizona大学

专知会员服务

84+阅读 · 2021年7月29日

【UMASS博士论文】几何表示学习，162页pdf

专知会员服务

65+阅读 · 2021年4月11日

机器阅读理解的任务与模式研究，61页pdf，多伦多约克大学

机器阅读理解的任务与模式研究，61页pdf，多伦多约克大学

专知会员服务

22+阅读 · 2020年1月28日

慕尼黑大学LMU博士论文：自然语言文本神经网络信息提取，240页pdf

慕尼黑大学LMU博士论文：自然语言文本神经网络信息提取，240页pdf

专知会员服务

74+阅读 · 2020年1月13日

【伯克利博士论文】从自然语言中学习（附106页pdf全文下载）

【伯克利博士论文】从自然语言中学习（附106页pdf全文下载）

专知会员服务

51+阅读 · 2019年10月26日

热门VIP内容

开通专知VIP会员享更多权益服务

新书册《几何深度学习的数学基础》

中程单向攻击无人机的战略意义：俄乌战争启示

在无标注条件下适配视觉—语言模型：全面综述

面向视觉语言模型的持续学习：遗忘之外的综述与分类体系

相关资讯

【IJCAI2022教程】口语语言理解:最新进展和新领域，99页ppt

【IJCAI2022教程】口语语言理解:最新进展和新领域，99页ppt

专知

0+阅读 · 2022年7月30日

【斯坦福大学博士论文】监督和自监督深度学习泛化的理论见解

【斯坦福大学博士论文】监督和自监督深度学习泛化的理论见解

专知

3+阅读 · 2022年7月9日

【实用书】统计显著性测试以及在自然语言中的应用，118页pdf

【实用书】统计显著性测试以及在自然语言中的应用，118页pdf

专知

1+阅读 · 2022年6月4日

【2022新书】视觉问答 (VQA)：从理论到应用

【2022新书】视觉问答 (VQA)：从理论到应用

专知

7+阅读 · 2022年5月24日

【2022开放书】因果推理统计工具，377页pdf

【2022开放书】因果推理统计工具，377页pdf

专知

6+阅读 · 2022年4月20日

【Chen Guanyi博士论文】汉语名词短语的计算生成，282页pdf

【Chen Guanyi博士论文】汉语名词短语的计算生成，282页pdf

专知

0+阅读 · 2022年4月14日

【ETH博士论文】贝叶斯深度学习，241页pdf

【ETH博士论文】贝叶斯深度学习，241页pdf

专知

9+阅读 · 2022年1月16日

【2021新书稿】在线凸优化导论(第二版)，260页pdf

【2021新书稿】在线凸优化导论(第二版)，260页pdf

专知

3+阅读 · 2021年12月23日

【干货书】高维统计学，572页pdf

【干货书】高维统计学，572页pdf

专知

19+阅读 · 2021年12月3日

【干货书】计算机科学离散数学，627页pdf

【干货书】计算机科学离散数学，627页pdf

专知

64+阅读 · 2020年8月31日

相关基金

面向汉语文本理解的语义计算方法

国家自然科学基金

8+阅读 · 2014年12月31日

基于因果构造和推理的专家判断关键技术研究

国家自然科学基金

3+阅读 · 2012年12月31日

基于领域本体的蒙古文数字资源整合机制研究

国家自然科学基金

0+阅读 · 2011年12月31日

基于半监督结构化学习的跨语言映射研究

国家自然科学基金

2+阅读 · 2011年12月31日

汉语文本推理的资源建设和统计分析研究

国家自然科学基金

0+阅读 · 2011年12月31日

基于“#24847;象”#24605;维的缺血性中风发病早期中医诊断模式的科学内涵研究

国家自然科学基金

0+阅读 · 2011年12月31日

隐喻识别与理解的理论与方法研究

国家自然科学基金

0+阅读 · 2011年12月31日

中英双语者语言理解转换中的词汇加工机制

国家自然科学基金

1+阅读 · 2009年12月31日

汉语句子理解中语义和句法整合的认知神经机制

国家自然科学基金

0+阅读 · 2009年12月31日

知识证明协议及其应用研究

国家自然科学基金

1+阅读 · 2008年12月31日

相关论文

The openVA Toolkit for Verbal Autopsies

Arxiv

0+阅读 · 2022年10月1日

End-to-End Label Uncertainty Modeling in Speech Emotion Recognition using Bayesian Neural Networks and Label Distribution Learning

Arxiv

1+阅读 · 2022年9月30日

Generated Knowledge Prompting for Commonsense Reasoning

Arxiv

0+阅读 · 2022年9月28日

Enable Deep Learning on Mobile Devices: Methods, Systems, and Applications

Arxiv

35+阅读 · 2022年4月25日

AI for Next Generation Computing: Emerging Trends and Future Directions

Arxiv

19+阅读 · 2022年3月5日

Causality and Generalizability: Identifiability and Learning Methods

Arxiv

12+阅读 · 2021年10月4日

已删除

Arxiv

32+阅读 · 2020年3月23日

A Multi-Objective Deep Reinforcement Learning Framework

A Multi-Objective Deep Reinforcement Learning Framework

Arxiv

16+阅读 · 2018年6月27日

Chinese NER Using Lattice LSTM

Arxiv

14+阅读 · 2018年5月15日

VQA-E: Explaining, Elaborating, and Enhancing Your Answers for Visual Questions

Arxiv

17+阅读 · 2018年3月20日

大家都在搜

大型语言模型

无人机集群

久别重逢话双塔

软件无线电

无人机航拍交通事故现场勘查处置系统——行业第一的警用事故处理软件

微信扫码咨询专知VIP会员