【DTU博士论文】面向自然语言处理的深度潜变量模型，232页pdf - 专知VIP

会员服务 ·

13

博士论文 · 自然语言处理 · 深度潜变量模型 ·

2022 年 12 月 22 日

【DTU博士论文】面向自然语言处理的深度潜变量模型，232页pdf

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

多人工智能任务的改进。隐变量模型提供了一个优雅的框架，以新的功能来增强生成算法。然而，在自然语言处理领域，尚不清楚如何最好地将潜变量与强大且无处不在的语言模型相结合。

本文探索先进的优化方法和潜变量模型的设计，以完成自然语言处理任务。全文共分为三个部分。在第一部分中，我们提出了隐变量语言模型的三种结构。本文讨论了结构化的潜空间，可以结构化为大型知识库(如维基百科)或以潜文本生成过程为特征。在第二部分中，我们深入研究变分推理和优化的主题。本文提出一种新的离散潜变量梯度估计器OVIS。我们发现，即使使用OVIS，优化深度潜变量模型仍然具有挑战性。本文根据经验数据表明，Rényi散度变分推理可以应用于规避一些学习问题。在第三部分中，我们重点解决医疗问答和信息检索任务。实验提示预训练大型语言模型(GPT-3)生成逐步的问题解决方案。本文报告称，在许多情况下，GPT-3可以推理具有挑战性的医学问题。提出了一个新的框架VOD，用于用变分推理学习检索增强语言模型。本文应用VOD来优化由大量维基百科增强的问答系统，并报告了在医疗问答基准上的最先进性能。最后，将得到的模型应用于罕见病诊断领域的信息检索任务。

成为VIP会员查看完整内容

21

相关内容

博士论文

博士论文是由攻读博士学位的研究生所撰写的学术论文。它要求作者在博士生导师的指导下，选择自己能够把握和驾驭的潜在的研究方向，开辟新的研究领域。由此可见，这就对作者提出了较高要求，它要求作者必须在本学科的专业领域具备大量的理论知识，并对所学专业的理论知识有相当深入的理解和思考，同时还要具有相当水平的独立科学研究能力，能够为在学科领域提出独创性的见解和有价值的科研成果。因而，较之学士论文、硕士论文，博士论文具有更高的学术价值，对学科的发展具有重要的推动作用。

【CMU博士论文】强化学习泛化性与效率研究，206页pdf

【CMU博士论文】强化学习泛化性与效率研究，206页pdf

专知会员服务

72+阅读 · 2023年2月23日

【普林斯顿博士论文】基于深度模型的高效强化学习，186页pdf

【普林斯顿博士论文】基于深度模型的高效强化学习，186页pdf

专知会员服务

83+阅读 · 2023年1月30日

【MIT博士论文】多模态模型学习语言，138页pdf

【MIT博士论文】多模态模型学习语言，138页pdf

专知会员服务

58+阅读 · 2022年12月23日

【MIT博士论文】异构医疗数据表示学习，193页pdf

【MIT博士论文】异构医疗数据表示学习，193页pdf

专知会员服务

59+阅读 · 2022年9月3日

【CMU博士论文】面向分布偏移的自然语言处理学习神经模型，148页pdf

专知会员服务

37+阅读 · 2021年9月7日

【哥伦比亚大学博士论文】深度概率图建模147页pdf

【哥伦比亚大学博士论文】深度概率图建模147页pdf

专知会员服务

90+阅读 · 2021年4月27日

【伯克利胡戎航博士论文】视觉与语言推理的结构化模型，124页pdf

【伯克利胡戎航博士论文】视觉与语言推理的结构化模型，124页pdf

专知会员服务

43+阅读 · 2020年10月31日

【牛津大学博士论文】解释深度神经网络，134页pdf

【牛津大学博士论文】解释深度神经网络，134页pdf

专知会员服务

220+阅读 · 2020年10月8日

【CMU博士论文】信息检索中的神经匹配和重要性学习，163页pdf

【CMU博士论文】信息检索中的神经匹配和重要性学习，163页pdf

专知会员服务

58+阅读 · 2020年7月20日

【伯克利博士论文】如何让机器人多技能？通过最大熵强化学习(107页pdf)

【伯克利博士论文】如何让机器人多技能？通过最大熵强化学习(107页pdf)

专知会员服务

78+阅读 · 2019年10月27日

【斯坦福博士论文】生成模型中深度概率推理的扩展与应用，262页pdf

【斯坦福博士论文】生成模型中深度概率推理的扩展与应用，262页pdf

专知

8+阅读 · 2022年11月30日

【哈佛大学博士论文】小数据医学成像中的可泛化和可解释深度学习，199页pdf

【哈佛大学博士论文】小数据医学成像中的可泛化和可解释深度学习，199页pdf

专知

8+阅读 · 2022年11月15日

【牛津大学博士论文】深度强化学习的归纳偏差和泛化,168页pdf

【牛津大学博士论文】深度强化学习的归纳偏差和泛化,168页pdf

专知

10+阅读 · 2022年10月6日

【斯坦福博士论文】利用先验知识和结构进行数据高效的机器学习，154页pdf

【斯坦福博士论文】利用先验知识和结构进行数据高效的机器学习，154页pdf

专知

28+阅读 · 2022年9月11日

【MIT博士论文】异构医疗数据表示学习，193页pdf

【MIT博士论文】异构医疗数据表示学习，193页pdf

专知

2+阅读 · 2022年9月3日

【MIT博士论文】自监督学习语音处理，148页pdf

【MIT博士论文】自监督学习语音处理，148页pdf

专知

8+阅读 · 2022年8月31日

【CMU博士论文】神经序列建模与应用，102页pdf

【CMU博士论文】神经序列建模与应用，102页pdf

专知

3+阅读 · 2022年8月23日

【CMU博士论文】多视图上下文理解的知识增强表示学习，179页pdf

【CMU博士论文】多视图上下文理解的知识增强表示学习，179页pdf

专知

5+阅读 · 2022年8月11日

【斯坦福大学博士论文】监督和自监督深度学习泛化的理论见解

【斯坦福大学博士论文】监督和自监督深度学习泛化的理论见解

专知

3+阅读 · 2022年7月9日

【CMU博士论文】缓解负迁移提高迁移学习的泛化和效率，201页pdf

【CMU博士论文】缓解负迁移提高迁移学习的泛化和效率，201页pdf

专知

3+阅读 · 2022年4月19日

随机文法作为通用统计模型的扩展

国家自然科学基金

1+阅读 · 2015年12月31日

面向大数据的安全迁移学习方法

国家自然科学基金

28+阅读 · 2015年12月31日

面向机器翻译的多词表达语义分析及应用研究

国家自然科学基金

1+阅读 · 2014年12月31日

基于结构语义的视觉对象分析与处理技术研究

国家自然科学基金

2+阅读 · 2013年12月31日

面向大数据的相似连接操作关键技术研究

国家自然科学基金

0+阅读 · 2013年12月31日

汉英双语依存句法分析模型和算法研究

国家自然科学基金

0+阅读 · 2012年12月31日

面向Web主观性文本意见挖掘研究

国家自然科学基金

0+阅读 · 2012年12月31日

混合贝叶斯网的概率推理

国家自然科学基金

5+阅读 · 2011年12月31日

物联网轻量级健壮安全中的关键问题研究

国家自然科学基金

1+阅读 · 2011年12月31日

面向不确定数据的Skyline查询关键问题研究

国家自然科学基金

0+阅读 · 2009年12月31日

Algebraic Semantics of Datalog with Equality

Arxiv

0+阅读 · 2023年2月22日

Instabilities Appearing in Cosmological Effective Field theories: When and How?

Arxiv

0+阅读 · 2023年2月21日

Scaling Laws for Multilingual Neural Machine Translation

Arxiv

0+阅读 · 2023年2月19日

Understanding how the use of AI decision support tools affect critical thinking and over-reliance on technology by drug dispensers in Tanzania

Arxiv

0+阅读 · 2023年2月19日

Maximin optimal cluster randomized designs for assessing treatment effect heterogeneity

Arxiv

0+阅读 · 2023年2月17日

Uniformity Testing over Hypergrids with Subcube Conditioning

Arxiv

0+阅读 · 2023年2月17日

Numerical Nonlinear Algebra

Arxiv

0+阅读 · 2023年2月16日

Survey on Graph Neural Network Acceleration: An Algorithmic Perspective

Arxiv

12+阅读 · 2022年2月10日

Recent Advances in Reinforcement Learning in Finance

Arxiv

11+阅读 · 2021年12月8日

A Survey of Transformers

Arxiv

103+阅读 · 2021年6月8日

VIP会员

相关主题

自然语言处理

深度潜变量模型

相关VIP内容

【CMU博士论文】强化学习泛化性与效率研究，206页pdf

【CMU博士论文】强化学习泛化性与效率研究，206页pdf

专知会员服务

72+阅读 · 2023年2月23日

【普林斯顿博士论文】基于深度模型的高效强化学习，186页pdf

【普林斯顿博士论文】基于深度模型的高效强化学习，186页pdf

专知会员服务

83+阅读 · 2023年1月30日

【MIT博士论文】多模态模型学习语言，138页pdf

【MIT博士论文】多模态模型学习语言，138页pdf

专知会员服务

58+阅读 · 2022年12月23日

【MIT博士论文】异构医疗数据表示学习，193页pdf

【MIT博士论文】异构医疗数据表示学习，193页pdf

专知会员服务

59+阅读 · 2022年9月3日

【CMU博士论文】面向分布偏移的自然语言处理学习神经模型，148页pdf

专知会员服务

37+阅读 · 2021年9月7日

【哥伦比亚大学博士论文】深度概率图建模147页pdf

【哥伦比亚大学博士论文】深度概率图建模147页pdf

专知会员服务

90+阅读 · 2021年4月27日

【伯克利胡戎航博士论文】视觉与语言推理的结构化模型，124页pdf

【伯克利胡戎航博士论文】视觉与语言推理的结构化模型，124页pdf

专知会员服务

43+阅读 · 2020年10月31日

【牛津大学博士论文】解释深度神经网络，134页pdf

【牛津大学博士论文】解释深度神经网络，134页pdf

专知会员服务

220+阅读 · 2020年10月8日

【CMU博士论文】信息检索中的神经匹配和重要性学习，163页pdf

【CMU博士论文】信息检索中的神经匹配和重要性学习，163页pdf

专知会员服务

58+阅读 · 2020年7月20日

【伯克利博士论文】如何让机器人多技能？通过最大熵强化学习(107页pdf)

【伯克利博士论文】如何让机器人多技能？通过最大熵强化学习(107页pdf)

专知会员服务

78+阅读 · 2019年10月27日

热门VIP内容

开通专知VIP会员享更多权益服务

数据驱动死亡：以色列AI战争机器如何锁定目标

【普林斯顿博士论文】通过以人为本的评估推动负责任的人工智能

ICML 2025 | BiAssemble: 双臂机器人几何拼合问题的协同可供性学习

ICML 2025杰出论文出炉：8篇获奖，南大研究者榜上有名

相关资讯

【斯坦福博士论文】生成模型中深度概率推理的扩展与应用，262页pdf

【斯坦福博士论文】生成模型中深度概率推理的扩展与应用，262页pdf

专知

8+阅读 · 2022年11月30日

【哈佛大学博士论文】小数据医学成像中的可泛化和可解释深度学习，199页pdf

【哈佛大学博士论文】小数据医学成像中的可泛化和可解释深度学习，199页pdf

专知

8+阅读 · 2022年11月15日

【牛津大学博士论文】深度强化学习的归纳偏差和泛化,168页pdf

【牛津大学博士论文】深度强化学习的归纳偏差和泛化,168页pdf

专知

10+阅读 · 2022年10月6日

【斯坦福博士论文】利用先验知识和结构进行数据高效的机器学习，154页pdf

【斯坦福博士论文】利用先验知识和结构进行数据高效的机器学习，154页pdf

专知

28+阅读 · 2022年9月11日

【MIT博士论文】异构医疗数据表示学习，193页pdf

【MIT博士论文】异构医疗数据表示学习，193页pdf

专知

2+阅读 · 2022年9月3日

【MIT博士论文】自监督学习语音处理，148页pdf

【MIT博士论文】自监督学习语音处理，148页pdf

专知

8+阅读 · 2022年8月31日

【CMU博士论文】神经序列建模与应用，102页pdf

【CMU博士论文】神经序列建模与应用，102页pdf

专知

3+阅读 · 2022年8月23日

【CMU博士论文】多视图上下文理解的知识增强表示学习，179页pdf

【CMU博士论文】多视图上下文理解的知识增强表示学习，179页pdf

专知

5+阅读 · 2022年8月11日

【斯坦福大学博士论文】监督和自监督深度学习泛化的理论见解

【斯坦福大学博士论文】监督和自监督深度学习泛化的理论见解

专知

3+阅读 · 2022年7月9日

【CMU博士论文】缓解负迁移提高迁移学习的泛化和效率，201页pdf

【CMU博士论文】缓解负迁移提高迁移学习的泛化和效率，201页pdf

专知

3+阅读 · 2022年4月19日

相关基金

随机文法作为通用统计模型的扩展

国家自然科学基金

1+阅读 · 2015年12月31日

面向大数据的安全迁移学习方法

国家自然科学基金

28+阅读 · 2015年12月31日

面向机器翻译的多词表达语义分析及应用研究

国家自然科学基金

1+阅读 · 2014年12月31日

基于结构语义的视觉对象分析与处理技术研究

国家自然科学基金

2+阅读 · 2013年12月31日

面向大数据的相似连接操作关键技术研究

国家自然科学基金

0+阅读 · 2013年12月31日

汉英双语依存句法分析模型和算法研究

国家自然科学基金

0+阅读 · 2012年12月31日

面向Web主观性文本意见挖掘研究

国家自然科学基金

0+阅读 · 2012年12月31日

混合贝叶斯网的概率推理

国家自然科学基金

5+阅读 · 2011年12月31日

物联网轻量级健壮安全中的关键问题研究

国家自然科学基金

1+阅读 · 2011年12月31日

面向不确定数据的Skyline查询关键问题研究

国家自然科学基金

0+阅读 · 2009年12月31日

相关论文

Algebraic Semantics of Datalog with Equality

Arxiv

0+阅读 · 2023年2月22日

Instabilities Appearing in Cosmological Effective Field theories: When and How?

Arxiv

0+阅读 · 2023年2月21日

Scaling Laws for Multilingual Neural Machine Translation

Arxiv

0+阅读 · 2023年2月19日

Understanding how the use of AI decision support tools affect critical thinking and over-reliance on technology by drug dispensers in Tanzania

Arxiv

0+阅读 · 2023年2月19日

Maximin optimal cluster randomized designs for assessing treatment effect heterogeneity

Arxiv

0+阅读 · 2023年2月17日

Uniformity Testing over Hypergrids with Subcube Conditioning

Arxiv

0+阅读 · 2023年2月17日

Numerical Nonlinear Algebra

Arxiv

0+阅读 · 2023年2月16日

Survey on Graph Neural Network Acceleration: An Algorithmic Perspective

Arxiv

12+阅读 · 2022年2月10日

Recent Advances in Reinforcement Learning in Finance

Arxiv

11+阅读 · 2021年12月8日

A Survey of Transformers

Arxiv

103+阅读 · 2021年6月8日

微信扫码咨询专知VIP会员