【多伦多大学博士论文】整合语言学理论与神经语言模型，104页pdf - 专知VIP

会员服务 ·

14

Transformer · 语言模型 · 博士论文 ·

2022 年 8 月 3 日

【多伦多大学博士论文】整合语言学理论与神经语言模型，104页pdf

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

基于Transformer的语言模型最近在许多自然语言任务中取得了显著的成果。然而，在排行榜上的表现通常是通过利用大量的训练数据和计算来实现的，而很少通过将显性语言知识编码到神经模型中来实现。这导致许多人质疑语言学与现代自然语言处理的相关性。在本论文中，我提出了几个案例研究，以说明如何理论语言学和深度神经语言模型仍然相互关联。首先，语言模型为语言学家提供了一个自动、客观的工具来测量语义距离，这是传统方法难以做到的。另一方面，语言学理论通过提供框架和数据来源，为语言理解的特定方面探索我们的语言模型，从而为语言建模研究做出贡献。

这篇论文贡献了三个研究，探讨了语言模型中语法-语义接口的不同方面。在论文的第一部分，我将语言模型应用于词类灵活性问题，这是理论语言学中一个长期争论的问题。使用mBERT作为跨多种语言的语义距离度量来源，我提出了支持将词类灵活性分析为定向过程的证据。在论文的第二部分，我提出了一种利用高斯模型进行密度估计的方法来测量语言模型中间层的惊讶度。我的实验表明，在语言模型中，包含形态句法异常的句子比语义和常识异常更早触发意外现象。最后，在我的论文的第三部分，我改编了几个心理语言学的研究，以表明语言模型包含论点结构结构的知识(从结构语法理论的动词配价分析)。总之，我的论文在自然语言处理、语言理论和心理语言学之间建立了新的联系，为语言模型的解释提供了新的视角。

成为VIP会员查看完整内容

25

相关内容

Transformer

Transformer是谷歌发表的论文《Attention Is All You Need》提出一种完全基于Attention的翻译架构

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等

【CMU硬核书】数理逻辑与计算，526页pdf

【CMU硬核书】数理逻辑与计算，526页pdf

专知会员服务

109+阅读 · 2022年9月14日

《将机器中的语言与大脑中的语言联系起来》150页博士论文，卡耐基梅隆大学

《将机器中的语言与大脑中的语言联系起来》150页博士论文，卡耐基梅隆大学

专知会员服务

48+阅读 · 2022年5月12日

神经文本生成可用么？斯坦福Abigail博士论文《开放式文本和对话的神经生成》，192页pdf

专知会员服务

26+阅读 · 2021年9月1日

【斯坦福博士论文】视觉语言的多模态表示，102页pdf

专知会员服务

72+阅读 · 2021年7月29日

最新《知识驱动的文本生成》综述论文，44页pdf

最新《知识驱动的文本生成》综述论文，44页pdf

专知会员服务

78+阅读 · 2020年10月13日

【神经语言生成：形式化，方法与评价，70页pdf】

【神经语言生成：形式化，方法与评价，70页pdf】

专知会员服务

37+阅读 · 2020年8月8日

【斯坦福大学博士论文】统计模型的代数与机器表示，224页pdf

专知会员服务

34+阅读 · 2020年6月18日

机器阅读理解的任务与模式研究，61页pdf，多伦多约克大学

机器阅读理解的任务与模式研究，61页pdf，多伦多约克大学

专知会员服务

45+阅读 · 2020年1月23日

慕尼黑大学LMU博士论文：自然语言文本神经网络信息提取，240页pdf

慕尼黑大学LMU博士论文：自然语言文本神经网络信息提取，240页pdf

专知会员服务

74+阅读 · 2020年1月13日

【伯克利博士论文】从自然语言中学习（附106页pdf全文下载）

【伯克利博士论文】从自然语言中学习（附106页pdf全文下载）

专知会员服务

52+阅读 · 2019年10月26日

【干货书】神经信息检索，50页pdf

【干货书】神经信息检索，50页pdf

专知

1+阅读 · 2022年7月29日

【经典】图神经网络新书《图表示学习》，161页pdf，加拿大麦吉尔大学计算机科学助理教授 William Hamilton

【经典】图神经网络新书《图表示学习》，161页pdf，加拿大麦吉尔大学计算机科学助理教授 William Hamilton

专知

4+阅读 · 2022年5月27日

【Chen Guanyi博士论文】汉语名词短语的计算生成，282页pdf

【Chen Guanyi博士论文】汉语名词短语的计算生成，282页pdf

专知

0+阅读 · 2022年4月14日

【2022新书】机器学习数学基础，328页pdf，密西西比州立大学Seongjai Kim教授

【2022新书】机器学习数学基础，328页pdf，密西西比州立大学Seongjai Kim教授

专知

2+阅读 · 2022年3月16日

香港中文大学最新《基于Aspect的情感分析》综述论文，涵盖近200篇文献阐述ABSA方法体系

香港中文大学最新《基于Aspect的情感分析》综述论文，涵盖近200篇文献阐述ABSA方法体系

专知

3+阅读 · 2022年3月3日

最新《知识驱动的文本生成》综述论文，44页pdf

最新《知识驱动的文本生成》综述论文，44页pdf

专知

25+阅读 · 2020年10月14日

自然语言处理常识推理综述论文，60页pdf

自然语言处理常识推理综述论文，60页pdf

专知

73+阅读 · 2019年4月4日

斯坦福陈丹琦博士论文：神经网络阅读理解与更多【附156页pdf】

斯坦福陈丹琦博士论文：神经网络阅读理解与更多【附156页pdf】

专知

62+阅读 · 2018年12月15日

专栏 | 用神经推理来帮助命名实体识别

专栏 | 用神经推理来帮助命名实体识别

机器之心

15+阅读 · 2018年11月8日

【干货】基于属性学习和额外知识库的图像描述生成和视觉问答

【干货】基于属性学习和额外知识库的图像描述生成和视觉问答

专知

18+阅读 · 2017年12月25日

基于概率化SC文法的多策略机器翻译研究

国家自然科学基金

0+阅读 · 2012年12月31日

社会认知中信念冲突的认知神经机制及其计算模型

国家自然科学基金

6+阅读 · 2012年12月31日

基于深层学习的汉语句法语义分析研究

国家自然科学基金

3+阅读 · 2012年12月31日

知识生产组织的制度-运行模式协同演化机制及绩效研究

国家自然科学基金

1+阅读 · 2012年12月31日

人类记忆过程：概念启动与熟悉性的神经机制

国家自然科学基金

2+阅读 · 2012年12月31日

形象记忆过程中信息编码和提取的脑机制研究

国家自然科学基金

0+阅读 · 2011年12月31日

基于半监督结构化学习的跨语言映射研究

国家自然科学基金

2+阅读 · 2011年12月31日

汉语句子理解中语义和句法整合的认知神经机制

国家自然科学基金

0+阅读 · 2009年12月31日

不同层级句法结构中语义加工的认知神经机制

国家自然科学基金

0+阅读 · 2009年12月31日

基于心理学归因理论的社会推理计算模型研究

国家自然科学基金

1+阅读 · 2008年12月31日

A New Index for Clustering Evaluation Based on Density Estimation

Arxiv

0+阅读 · 2022年9月29日

Quantitative Khintchine in Simultaneous Approximation

Arxiv

0+阅读 · 2022年9月28日

Data-driven Parsing Evaluation for Child-Parent Interactions

Arxiv

0+阅读 · 2022年9月28日

MTU-Net: Multi-level TransUNet for Space-based Infrared Tiny Ship Detection

Arxiv

0+阅读 · 2022年9月28日

A Survey on Contextual Embeddings

Arxiv

29+阅读 · 2020年3月16日

The Book of Why: Review

Arxiv

15+阅读 · 2019年9月30日

Aspect-based Sentiment Classification with Aspect-specific Graph Convolutional Networks

Arxiv

11+阅读 · 2019年9月8日

CAN-NER: Convolutional Attention Network forChinese Named Entity Recognition

Arxiv

16+阅读 · 2019年4月3日

Rethinking Knowledge Graph Propagation for Zero-Shot Learning

Rethinking Knowledge Graph Propagation for Zero-Shot Learning

Arxiv

21+阅读 · 2019年3月27日

Deep Representation Learning for Domain Adaptation of Semantic Image Segmentation

Arxiv

10+阅读 · 2018年5月10日

VIP会员

相关主题

相关VIP内容

【CMU硬核书】数理逻辑与计算，526页pdf

【CMU硬核书】数理逻辑与计算，526页pdf

专知会员服务

109+阅读 · 2022年9月14日

《将机器中的语言与大脑中的语言联系起来》150页博士论文，卡耐基梅隆大学

《将机器中的语言与大脑中的语言联系起来》150页博士论文，卡耐基梅隆大学

专知会员服务

48+阅读 · 2022年5月12日

神经文本生成可用么？斯坦福Abigail博士论文《开放式文本和对话的神经生成》，192页pdf

专知会员服务

26+阅读 · 2021年9月1日

【斯坦福博士论文】视觉语言的多模态表示，102页pdf

专知会员服务

72+阅读 · 2021年7月29日

最新《知识驱动的文本生成》综述论文，44页pdf

最新《知识驱动的文本生成》综述论文，44页pdf

专知会员服务

78+阅读 · 2020年10月13日

【神经语言生成：形式化，方法与评价，70页pdf】

【神经语言生成：形式化，方法与评价，70页pdf】

专知会员服务

37+阅读 · 2020年8月8日

【斯坦福大学博士论文】统计模型的代数与机器表示，224页pdf

专知会员服务

34+阅读 · 2020年6月18日

机器阅读理解的任务与模式研究，61页pdf，多伦多约克大学

机器阅读理解的任务与模式研究，61页pdf，多伦多约克大学

专知会员服务

45+阅读 · 2020年1月23日

慕尼黑大学LMU博士论文：自然语言文本神经网络信息提取，240页pdf

慕尼黑大学LMU博士论文：自然语言文本神经网络信息提取，240页pdf

专知会员服务

74+阅读 · 2020年1月13日

【伯克利博士论文】从自然语言中学习（附106页pdf全文下载）

【伯克利博士论文】从自然语言中学习（附106页pdf全文下载）

专知会员服务

52+阅读 · 2019年10月26日

热门VIP内容

开通专知VIP会员享更多权益服务

【NeurIPS2025】语言模型是高效的推理者吗？——来自逻辑编程的视角

美陆军在“艾布拉姆斯”坦克与“布拉德利”步战车上测试“牛蛙”反无人机炮塔

【剑桥大学博士论文】基于注意力的图表示学习

《深度文本哈希综述：基于二进制表示的高效语义文本检索》

相关资讯

【干货书】神经信息检索，50页pdf

【干货书】神经信息检索，50页pdf

专知

1+阅读 · 2022年7月29日

【经典】图神经网络新书《图表示学习》，161页pdf，加拿大麦吉尔大学计算机科学助理教授 William Hamilton

【经典】图神经网络新书《图表示学习》，161页pdf，加拿大麦吉尔大学计算机科学助理教授 William Hamilton

专知

4+阅读 · 2022年5月27日

【Chen Guanyi博士论文】汉语名词短语的计算生成，282页pdf

【Chen Guanyi博士论文】汉语名词短语的计算生成，282页pdf

专知

0+阅读 · 2022年4月14日

【2022新书】机器学习数学基础，328页pdf，密西西比州立大学Seongjai Kim教授

【2022新书】机器学习数学基础，328页pdf，密西西比州立大学Seongjai Kim教授

专知

2+阅读 · 2022年3月16日

香港中文大学最新《基于Aspect的情感分析》综述论文，涵盖近200篇文献阐述ABSA方法体系

香港中文大学最新《基于Aspect的情感分析》综述论文，涵盖近200篇文献阐述ABSA方法体系

专知

3+阅读 · 2022年3月3日

最新《知识驱动的文本生成》综述论文，44页pdf

最新《知识驱动的文本生成》综述论文，44页pdf

专知

25+阅读 · 2020年10月14日

自然语言处理常识推理综述论文，60页pdf

自然语言处理常识推理综述论文，60页pdf

专知

73+阅读 · 2019年4月4日

斯坦福陈丹琦博士论文：神经网络阅读理解与更多【附156页pdf】

斯坦福陈丹琦博士论文：神经网络阅读理解与更多【附156页pdf】

专知

62+阅读 · 2018年12月15日

专栏 | 用神经推理来帮助命名实体识别

专栏 | 用神经推理来帮助命名实体识别

机器之心

15+阅读 · 2018年11月8日

【干货】基于属性学习和额外知识库的图像描述生成和视觉问答

【干货】基于属性学习和额外知识库的图像描述生成和视觉问答

专知

18+阅读 · 2017年12月25日

相关基金

基于概率化SC文法的多策略机器翻译研究

国家自然科学基金

0+阅读 · 2012年12月31日

社会认知中信念冲突的认知神经机制及其计算模型

国家自然科学基金

6+阅读 · 2012年12月31日

基于深层学习的汉语句法语义分析研究

国家自然科学基金

3+阅读 · 2012年12月31日

知识生产组织的制度-运行模式协同演化机制及绩效研究

国家自然科学基金

1+阅读 · 2012年12月31日

人类记忆过程：概念启动与熟悉性的神经机制

国家自然科学基金

2+阅读 · 2012年12月31日

形象记忆过程中信息编码和提取的脑机制研究

国家自然科学基金

0+阅读 · 2011年12月31日

基于半监督结构化学习的跨语言映射研究

国家自然科学基金

2+阅读 · 2011年12月31日

汉语句子理解中语义和句法整合的认知神经机制

国家自然科学基金

0+阅读 · 2009年12月31日

不同层级句法结构中语义加工的认知神经机制

国家自然科学基金

0+阅读 · 2009年12月31日

基于心理学归因理论的社会推理计算模型研究

国家自然科学基金

1+阅读 · 2008年12月31日

相关论文

A New Index for Clustering Evaluation Based on Density Estimation

Arxiv

0+阅读 · 2022年9月29日

Quantitative Khintchine in Simultaneous Approximation

Arxiv

0+阅读 · 2022年9月28日

Data-driven Parsing Evaluation for Child-Parent Interactions

Arxiv

0+阅读 · 2022年9月28日

MTU-Net: Multi-level TransUNet for Space-based Infrared Tiny Ship Detection

Arxiv

0+阅读 · 2022年9月28日

A Survey on Contextual Embeddings

Arxiv

29+阅读 · 2020年3月16日

The Book of Why: Review

Arxiv

15+阅读 · 2019年9月30日

Aspect-based Sentiment Classification with Aspect-specific Graph Convolutional Networks

Arxiv

11+阅读 · 2019年9月8日

CAN-NER: Convolutional Attention Network forChinese Named Entity Recognition

Arxiv

16+阅读 · 2019年4月3日

Rethinking Knowledge Graph Propagation for Zero-Shot Learning

Rethinking Knowledge Graph Propagation for Zero-Shot Learning

Arxiv

21+阅读 · 2019年3月27日

Deep Representation Learning for Domain Adaptation of Semantic Image Segmentation

Arxiv

10+阅读 · 2018年5月10日

微信扫码咨询专知VIP会员