在从大规模语言数据语料库中学习表示时,一个普遍的策略是将该数据视为一系列独立同分布(IID)样本,这些样本相互独立地建模。虽然这种方法在某些方面是有益的,因为它允许通过随机梯度下降(SGD)进行高效训练,并且不依赖于可能并不总是存在的元数据,但它确实存在局限性。利用个别数据点之间更复杂的结构联系可以让信息在我们的语料库内流动,使得学习到的表示更具上下文敏感性,并允许更多的参数共享,从而更容易泛化到未见类别的示例。在这项工作中,我们将把这一思想应用于各种设置——主要是那些处于语言和其他模态之间边界的设置——对于这些设置,现有的先前工作大多没有明确利用数据内的可观察结构,我们还将展示如何通过更低级的建模选择为我们的模型添加有用的归纳偏见。为了保持可解释性和控制性,我们将同时使用概率变分学习框架和非变分方法(如检查列表模型和检索引导生成)来做到这一点。这篇论文分为三个部分,将这一广泛主题应用于各种具体应用。首先,我们将检查在数字字体中学习风格和结构的解耦表示的任务,然后将类似的建模思想应用于分析线性B文手写风格的任务。在下一部分,我们将探索学习时间排序数据的上下文化表示的方法,其中一个数据点的预测可能会影响附近的预测,例如钢琴指法估计和社交媒体上的话语主题建模。最后,我们将为输入信号本身是多模态的设置提出新的方法,例如为图像和音乐编写描述性标题的任务。

成为VIP会员查看完整内容
21

相关内容

博士论文是由攻读博士学位的研究生所撰写的学术论文。它要求作者在博士生导师的指导下,选择自己能够把握和驾驭的潜在的研究方向,开辟新的研究领域。由此可见,这就对作者提出了较高要求,它要求作者必须在本学科的专业领域具备大量的理论知识,并对所学专业的理论知识有相当深入的理解和思考,同时还要具有相当水平的独立科学研究能力,能够为在学科领域提出独创性的见解和有价值的科研成果。因而,较之学士论文、硕士论文,博士论文具有更高的学术价值,对学科的发展具有重要的推动作用。
【EMNLP2023】基于文本属性异构图的语言模型预训练
专知会员服务
21+阅读 · 2023年10月21日
【ICCV2023】保留模态结构改进多模态学习
专知会员服务
28+阅读 · 2023年8月28日
【KDD2023】发现动态因果空间进行DAG结构学习
专知会员服务
32+阅读 · 2023年6月9日
【CVPR2023】GeoLayoutLM:视觉信息提取的几何预训练
专知会员服务
30+阅读 · 2023年4月25日
【CMU博士论文】多视图上下文理解的知识增强表示学习
专知会员服务
34+阅读 · 2022年8月11日
【NAACL2022】自然语言处理的对比数据与学习
专知会员服务
45+阅读 · 2022年7月10日
【CVPR2022】带噪声标签的少样本学习
专知会员服务
39+阅读 · 2022年4月15日
【CVPR2022】三元组对比学习的视觉-语言预训练
专知会员服务
31+阅读 · 2022年3月3日
【CMU博士论文】通过记忆的元强化学习
专知会员服务
53+阅读 · 2021年10月16日
专知会员服务
12+阅读 · 2021年10月11日
【KDD2020】图神经网络生成式预训练
专知
22+阅读 · 2020年7月3日
国家自然科学基金
11+阅读 · 2017年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
Arxiv
157+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
398+阅读 · 2023年3月31日
Arxiv
66+阅读 · 2023年3月26日
Arxiv
68+阅读 · 2022年9月7日
Arxiv
10+阅读 · 2020年11月26日
VIP会员
相关VIP内容
【EMNLP2023】基于文本属性异构图的语言模型预训练
专知会员服务
21+阅读 · 2023年10月21日
【ICCV2023】保留模态结构改进多模态学习
专知会员服务
28+阅读 · 2023年8月28日
【KDD2023】发现动态因果空间进行DAG结构学习
专知会员服务
32+阅读 · 2023年6月9日
【CVPR2023】GeoLayoutLM:视觉信息提取的几何预训练
专知会员服务
30+阅读 · 2023年4月25日
【CMU博士论文】多视图上下文理解的知识增强表示学习
专知会员服务
34+阅读 · 2022年8月11日
【NAACL2022】自然语言处理的对比数据与学习
专知会员服务
45+阅读 · 2022年7月10日
【CVPR2022】带噪声标签的少样本学习
专知会员服务
39+阅读 · 2022年4月15日
【CVPR2022】三元组对比学习的视觉-语言预训练
专知会员服务
31+阅读 · 2022年3月3日
【CMU博士论文】通过记忆的元强化学习
专知会员服务
53+阅读 · 2021年10月16日
专知会员服务
12+阅读 · 2021年10月11日
相关基金
国家自然科学基金
11+阅读 · 2017年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
相关论文
微信扫码咨询专知VIP会员