【CMU博士论文】通过可解释的层级操作实现基础自然语言生成 - 专知VIP

会员服务 ·

12

CMU · 博士论文 · 自然语言生成 ·

2024 年 7 月 24 日

【CMU博士论文】通过可解释的层级操作实现基础自然语言生成

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

近年来，自然语言生成的许多工作依赖于深度学习，通常使用带有软注意机制的神经网络从数据中选择显著方面，然后构建流畅的自然语言文本。然而，在对数据的自然描述中，人类通常会提到更高级别的模式，这可能需要对数据进行复杂的计算。在许多情况下，仅使用软注意机制的神经模型难以提取这些模式。此外，用户可能会发现这些模型难以解释和控制。在本论文中，我提出了一种通过在数据和文本上引入某些类型的离散层级操作的方法，以实现基础自然语言生成。与仅使用注意力机制相比，这种层级操作可以更好地对数据中的复杂模式建模，揭示可解释的中间计算，并实现可控的生成。

在论文的前半部分，我将讨论在不同的基础自然语言生成任务中向神经模型添加特定的离散层级操作，如图像和表格标题生成、对话响应生成以及构建多跳问题回答的推理链。这些任务涵盖了各种数据模态（包括图像、表格数据、数值数据和知识库）。在论文的后半部分，我将描述用于文本解码器中的内容规划的层级方法，研究诗歌生成中的押韵模式以及用于连贯叙事文本生成的离散计划。

成为VIP会员查看完整内容

18

相关内容

CMU

【CMU博士论文】利用结构化中间表示构建可靠且透明的机器学习系统

【CMU博士论文】利用结构化中间表示构建可靠且透明的机器学习系统

专知会员服务

28+阅读 · 2024年9月19日

【MIT博士论文】非线性优化在机器学习应用中的平滑性与自适应性

【MIT博士论文】非线性优化在机器学习应用中的平滑性与自适应性

专知会员服务

25+阅读 · 2024年8月27日

【MIT博士论文】大规模机器学习算法：效率、估计误差及其拓展

【MIT博士论文】大规模机器学习算法：效率、估计误差及其拓展

专知会员服务

28+阅读 · 2024年8月3日

【CMU博士论文】朝着更准确的大型语言模型：参数化和非参数化方法

【CMU博士论文】朝着更准确的大型语言模型：参数化和非参数化方法

专知会员服务

34+阅读 · 2024年7月24日

【CMU博士论文】鲁棒机器学习：在分布变化下的检测、评估和适应

【CMU博士论文】鲁棒机器学习：在分布变化下的检测、评估和适应

专知会员服务

24+阅读 · 2024年7月2日

【ETHZ博士论文】有限数据中的元学习先验：从理论到实践

【ETHZ博士论文】有限数据中的元学习先验：从理论到实践

专知会员服务

36+阅读 · 2024年6月4日

【CMU博士论文】高效的深度神经网络终身学习：架构、训练和数据的优化

【CMU博士论文】高效的深度神经网络终身学习：架构、训练和数据的优化

专知会员服务

41+阅读 · 2024年4月24日

【UIUC博士论文】生成式深度学习：走向更好的视觉表征和多模态

【UIUC博士论文】生成式深度学习：走向更好的视觉表征和多模态

专知会员服务

42+阅读 · 2024年2月2日

【CMU博士论文】从强化学习到机器人学习：利用先前数据和共享评估，

【CMU博士论文】从强化学习到机器人学习：利用先前数据和共享评估，

专知会员服务

44+阅读 · 2023年8月19日

【CMU博士论文】概率强化学习：使用数据定义期望的结果并推断如何达到

【CMU博士论文】概率强化学习：使用数据定义期望的结果并推断如何达到

专知会员服务

42+阅读 · 2023年7月31日

图上如何建模因果性？PSU等最新《图反事实学习》综述，50页pdf全面综述图公平性、可解释性等方法

图上如何建模因果性？PSU等最新《图反事实学习》综述，50页pdf全面综述图公平性、可解释性等方法

专知

52+阅读 · 2023年4月13日

【经典书】图数据挖掘算法，安全性及应用，256页pdf

【经典书】图数据挖掘算法，安全性及应用，256页pdf

专知

17+阅读 · 2022年8月22日

NLP如何用元学习？李宏毅老师NAACL2022最新《元学习自然语言处理》综述论文阐述最新研究进展

NLP如何用元学习？李宏毅老师NAACL2022最新《元学习自然语言处理》综述论文阐述最新研究进展

专知

24+阅读 · 2022年5月4日

图神经网络如何时序化？看Twitter最新《动态图深度学习:时序图网络TGN》研究，附论文与PPT下载

图神经网络如何时序化？看Twitter最新《动态图深度学习:时序图网络TGN》研究，附论文与PPT下载

专知

17+阅读 · 2021年1月24日

【KDD2020】图神经网络生成式预训练

【KDD2020】图神经网络生成式预训练

专知

22+阅读 · 2020年7月3日

【Google AI新论文】REALM:检索增强语言模型预训练，QA的SOTA提升4-16%准确性

【Google AI新论文】REALM:检索增强语言模型预训练，QA的SOTA提升4-16%准确性

专知

12+阅读 · 2020年2月12日

【伯克利PNAS最新论文】可解释机器学习的定义、方法和应用

【伯克利PNAS最新论文】可解释机器学习的定义、方法和应用

专知

77+阅读 · 2019年10月20日

论文浅尝 | 采用多层注意力机制的事件检测

论文浅尝 | 采用多层注意力机制的事件检测

开放知识图谱

24+阅读 · 2019年8月24日

每日论文 | 图形深度神经网络并行框架NGra；用人类注意力进行序列分类；针对多智能体协作的图卷积强化学习

每日论文 | 图形深度神经网络并行框架NGra；用人类注意力进行序列分类；针对多智能体协作的图卷积强化学习

论智

26+阅读 · 2018年10月30日

北邮张庆恒：如何基于 rasa 搭建一个中文对话系统（有源码视频）| 分享总结

北邮张庆恒：如何基于 rasa 搭建一个中文对话系统（有源码视频）| 分享总结

AI研习社

24+阅读 · 2018年1月31日

有效融合多源异构数据的集成分类器研究

国家自然科学基金

5+阅读 · 2015年12月31日

基于对称识别方法的贝叶斯probit模型稳健性研究

国家自然科学基金

3+阅读 · 2015年12月31日

动态异质大图匹配模型及算法研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于云计算平台的下一代测序数据错误修正算法研究与实现

国家自然科学基金

2+阅读 · 2015年12月31日

基于最大相关熵准则的支持向量机模型与算法研究

国家自然科学基金

3+阅读 · 2015年12月31日

面向大数据的安全迁移学习方法

国家自然科学基金

28+阅读 · 2015年12月31日

状态空间搜索的anytime模式及其高效算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于异构信息网络的分类算法推荐方法研究

国家自然科学基金

7+阅读 · 2015年12月31日

项目知识情境提取与展现方法研究：基于主题模型和知识地图的大数据视角

国家自然科学基金

2+阅读 · 2014年12月31日

面向地理模型集成与运行的数据适配方法研究

国家自然科学基金

1+阅读 · 2014年12月31日

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

171+阅读 · 2023年4月20日

A Comprehensive Survey on Deep Graph Representation Learning

Arxiv

103+阅读 · 2023年4月11日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

215+阅读 · 2023年4月7日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

474+阅读 · 2023年3月31日

Knowledge Graphs: Opportunities and Challenges

Arxiv

172+阅读 · 2023年3月24日

Revolutionizing Modern Networks: Advances in AI, Machine Learning, and Blockchain for Quantum Satellites and UAV-based Communication

Arxiv

32+阅读 · 2023年3月21日

Is Prompt All You Need? No. A Comprehensive and Broader View of Instruction Learning

Is Prompt All You Need? No. A Comprehensive and Broader View of Instruction Learning

Arxiv

20+阅读 · 2023年3月21日

Data-centric Artificial Intelligence: A Survey

Arxiv

24+阅读 · 2023年3月17日

A survey and taxonomy of loss functions in machine learning

Arxiv

25+阅读 · 2023年1月13日

Interpretable machine learning: definitions, methods, and applications

Interpretable machine learning: definitions, methods, and applications

Arxiv

19+阅读 · 2019年1月14日

VIP会员

相关主题

自然语言生成

相关VIP内容

【CMU博士论文】利用结构化中间表示构建可靠且透明的机器学习系统

【CMU博士论文】利用结构化中间表示构建可靠且透明的机器学习系统

专知会员服务

28+阅读 · 2024年9月19日

【MIT博士论文】非线性优化在机器学习应用中的平滑性与自适应性

【MIT博士论文】非线性优化在机器学习应用中的平滑性与自适应性

专知会员服务

25+阅读 · 2024年8月27日

【MIT博士论文】大规模机器学习算法：效率、估计误差及其拓展

【MIT博士论文】大规模机器学习算法：效率、估计误差及其拓展

专知会员服务

28+阅读 · 2024年8月3日

【CMU博士论文】朝着更准确的大型语言模型：参数化和非参数化方法

【CMU博士论文】朝着更准确的大型语言模型：参数化和非参数化方法

专知会员服务

34+阅读 · 2024年7月24日

【CMU博士论文】鲁棒机器学习：在分布变化下的检测、评估和适应

【CMU博士论文】鲁棒机器学习：在分布变化下的检测、评估和适应

专知会员服务

24+阅读 · 2024年7月2日

【ETHZ博士论文】有限数据中的元学习先验：从理论到实践

【ETHZ博士论文】有限数据中的元学习先验：从理论到实践

专知会员服务

36+阅读 · 2024年6月4日

【CMU博士论文】高效的深度神经网络终身学习：架构、训练和数据的优化

【CMU博士论文】高效的深度神经网络终身学习：架构、训练和数据的优化

专知会员服务

41+阅读 · 2024年4月24日

【UIUC博士论文】生成式深度学习：走向更好的视觉表征和多模态

【UIUC博士论文】生成式深度学习：走向更好的视觉表征和多模态

专知会员服务

42+阅读 · 2024年2月2日

【CMU博士论文】从强化学习到机器人学习：利用先前数据和共享评估，

【CMU博士论文】从强化学习到机器人学习：利用先前数据和共享评估，

专知会员服务

44+阅读 · 2023年8月19日

【CMU博士论文】概率强化学习：使用数据定义期望的结果并推断如何达到

【CMU博士论文】概率强化学习：使用数据定义期望的结果并推断如何达到

专知会员服务

42+阅读 · 2023年7月31日

热门VIP内容

开通专知VIP会员享更多权益服务

未来战场：AI赋能无人作战新范式，39页ppt

【牛津博士论文】无限维空间中的广义变分推断

DeepSeek AI 从入门到付费专家·第一卷：动手实践、真实应用与可扩展 AI 解决方案全掌握

2025中国AI Agent商业应用场景洞察研究

相关资讯

图上如何建模因果性？PSU等最新《图反事实学习》综述，50页pdf全面综述图公平性、可解释性等方法

图上如何建模因果性？PSU等最新《图反事实学习》综述，50页pdf全面综述图公平性、可解释性等方法

专知

52+阅读 · 2023年4月13日

【经典书】图数据挖掘算法，安全性及应用，256页pdf

【经典书】图数据挖掘算法，安全性及应用，256页pdf

专知

17+阅读 · 2022年8月22日

NLP如何用元学习？李宏毅老师NAACL2022最新《元学习自然语言处理》综述论文阐述最新研究进展

NLP如何用元学习？李宏毅老师NAACL2022最新《元学习自然语言处理》综述论文阐述最新研究进展

专知

24+阅读 · 2022年5月4日

图神经网络如何时序化？看Twitter最新《动态图深度学习:时序图网络TGN》研究，附论文与PPT下载

图神经网络如何时序化？看Twitter最新《动态图深度学习:时序图网络TGN》研究，附论文与PPT下载

专知

17+阅读 · 2021年1月24日

【KDD2020】图神经网络生成式预训练

【KDD2020】图神经网络生成式预训练

专知

22+阅读 · 2020年7月3日

【Google AI新论文】REALM:检索增强语言模型预训练，QA的SOTA提升4-16%准确性

【Google AI新论文】REALM:检索增强语言模型预训练，QA的SOTA提升4-16%准确性

专知

12+阅读 · 2020年2月12日

【伯克利PNAS最新论文】可解释机器学习的定义、方法和应用

【伯克利PNAS最新论文】可解释机器学习的定义、方法和应用

专知

77+阅读 · 2019年10月20日

论文浅尝 | 采用多层注意力机制的事件检测

论文浅尝 | 采用多层注意力机制的事件检测

开放知识图谱

24+阅读 · 2019年8月24日

每日论文 | 图形深度神经网络并行框架NGra；用人类注意力进行序列分类；针对多智能体协作的图卷积强化学习

每日论文 | 图形深度神经网络并行框架NGra；用人类注意力进行序列分类；针对多智能体协作的图卷积强化学习

论智

26+阅读 · 2018年10月30日

北邮张庆恒：如何基于 rasa 搭建一个中文对话系统（有源码视频）| 分享总结

北邮张庆恒：如何基于 rasa 搭建一个中文对话系统（有源码视频）| 分享总结

AI研习社

24+阅读 · 2018年1月31日

相关基金

有效融合多源异构数据的集成分类器研究

国家自然科学基金

5+阅读 · 2015年12月31日

基于对称识别方法的贝叶斯probit模型稳健性研究

国家自然科学基金

3+阅读 · 2015年12月31日

动态异质大图匹配模型及算法研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于云计算平台的下一代测序数据错误修正算法研究与实现

国家自然科学基金

2+阅读 · 2015年12月31日

基于最大相关熵准则的支持向量机模型与算法研究

国家自然科学基金

3+阅读 · 2015年12月31日

面向大数据的安全迁移学习方法

国家自然科学基金

28+阅读 · 2015年12月31日

状态空间搜索的anytime模式及其高效算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于异构信息网络的分类算法推荐方法研究

国家自然科学基金

7+阅读 · 2015年12月31日

项目知识情境提取与展现方法研究：基于主题模型和知识地图的大数据视角

国家自然科学基金

2+阅读 · 2014年12月31日

面向地理模型集成与运行的数据适配方法研究

国家自然科学基金

1+阅读 · 2014年12月31日

相关论文

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

171+阅读 · 2023年4月20日

A Comprehensive Survey on Deep Graph Representation Learning

Arxiv

103+阅读 · 2023年4月11日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

215+阅读 · 2023年4月7日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

474+阅读 · 2023年3月31日

Knowledge Graphs: Opportunities and Challenges

Arxiv

172+阅读 · 2023年3月24日

Revolutionizing Modern Networks: Advances in AI, Machine Learning, and Blockchain for Quantum Satellites and UAV-based Communication

Arxiv

32+阅读 · 2023年3月21日

Is Prompt All You Need? No. A Comprehensive and Broader View of Instruction Learning

Is Prompt All You Need? No. A Comprehensive and Broader View of Instruction Learning

Arxiv

20+阅读 · 2023年3月21日

Data-centric Artificial Intelligence: A Survey

Arxiv

24+阅读 · 2023年3月17日

A survey and taxonomy of loss functions in machine learning

Arxiv

25+阅读 · 2023年1月13日

Interpretable machine learning: definitions, methods, and applications

Interpretable machine learning: definitions, methods, and applications

Arxiv

19+阅读 · 2019年1月14日

微信扫码咨询专知VIP会员