当我们说话、写作或聆听时,我们不断地基于对语言语法的知识进行预测。令人惊讶的是,儿童仅仅在几年内便能掌握这种语法知识,使得他们能够理解并将这种知识推广到从未说过的新结构中。语言模型是强大的工具,它们通过逐步预测句子中的下一个词来构建语言的表示,并且在近年来对社会产生了巨大影响。本文的核心研究问题是,这些模型是否拥有类似于人类的深刻语法结构理解。这个问题位于自然语言处理、语言学和可解释性研究的交叉点。为了回答这个问题,我们将开发新的可解释性技术,以加深我们对大规模语言模型复杂本质的理解。我们将从三个方向来探索这个研究问题。首先,我们通过结构性启动(structural priming)这一心理语言学中的关键范式,探索抽象语言信息的存在,这一范式可以揭示人类语言处理中的语法结构。接下来,我们考察各种语言现象,如形容词顺序和否定极性项目,并将模型对这些现象的理解与其训练数据分布进行关联。最后,我们引入一个受控的测试平台,用于研究语言模型中的层级结构,采用各种逐步增加复杂度的合成语言,并考察特征交互在建模这些结构中的作用。我们的研究结果提供了关于语言模型表示中蕴含的语法知识的详细描述,并为使用计算方法研究基本语言学问题提供了若干方向。

成为VIP会员查看完整内容
0

相关内容

博士论文是由攻读博士学位的研究生所撰写的学术论文。它要求作者在博士生导师的指导下,选择自己能够把握和驾驭的潜在的研究方向,开辟新的研究领域。由此可见,这就对作者提出了较高要求,它要求作者必须在本学科的专业领域具备大量的理论知识,并对所学专业的理论知识有相当深入的理解和思考,同时还要具有相当水平的独立科学研究能力,能够为在学科领域提出独创性的见解和有价值的科研成果。因而,较之学士论文、硕士论文,博士论文具有更高的学术价值,对学科的发展具有重要的推动作用。
【斯坦福博士论文】生成模型的视觉与行为
专知会员服务
31+阅读 · 7月11日
【伯克利博士论文】学习跨领域的可迁移表示
专知会员服务
46+阅读 · 2022年8月17日
基于模型的强化学习综述
专知
30+阅读 · 2022年7月13日
【KDD2020】图神经网络生成式预训练
专知
22+阅读 · 2020年7月3日
论文浅尝 | 采用多层注意力机制的事件检测
开放知识图谱
23+阅读 · 2019年8月24日
【机器学习】深入剖析机器学习中的统计思想
产业智能官
14+阅读 · 2019年1月24日
论文浅尝 | 基于置信度的知识图谱表示学习框架
开放知识图谱
24+阅读 · 2018年2月27日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
25+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
8+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
15+阅读 · 2013年12月31日
Arxiv
157+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
400+阅读 · 2023年3月31日
Arxiv
66+阅读 · 2023年3月26日
Arxiv
139+阅读 · 2023年3月24日
Arxiv
20+阅读 · 2023年3月17日
VIP会员
相关基金
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
25+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
8+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
15+阅读 · 2013年12月31日
微信扫码咨询专知VIP会员