【MIT博士论文】保证性生成模型，155页pdf - 专知VIP

会员服务 ·

19

差分隐私 · 语言模型 · 深度生成模型 · 麻省理工学院 (MIT) · 博士论文 ·

2023 年 8 月 8 日

【MIT博士论文】保证性生成模型，155页pdf

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

语言模型已在自然语言处理中无处不在，它们利用大量未标记的数据并为下游任务进行微调。但人们对这些模型生成的文本的准确性和可信度提出了担忧。

与此同时，差分隐私已成为一种框架，用于保护敏感信息，同时允许机器学习算法从中学习。然而，统计保证与实用性之间的权衡对许多应用都带来了挑战**。因此，这篇论文旨在开发平衡保证和实用性的技术，重点是提高生成模型的可靠性，同时保持其灵活性**。

首先，我们提出了一个框架，可以有条件地使用硬约束生成文本，允许用户事先指定某些元素，而留下其他元素供模型预测。通过促进交互式编辑和重写，此框架为用户提供了对生成文本的精确控制。接下来，我们引入了在软约束下生成预测的共形预测方法，以确保统计的正确性。这些方法在保持高经验精度的同时，为文本生成产生有效的置信集。

最后，我们通过放宽差分隐私的保证概念到基于猜测的定义，探索数据发布中隐私与实用性之间的平衡。我们提出了一种基于学习的去识别化方法，解决了隐私保护的挑战，同时仍能有效地利用数据。我们提出的方法的有效性通过一系列任务得到了证明，包括文本填充、放射学报告生成和X光分类。这些任务展示了我们的技术在各种实际场景中的实用性。

成为VIP会员查看完整内容

31

相关内容

差分隐私

【ETH博士论文】基于离散优化的学习，193页pdf

【ETH博士论文】基于离散优化的学习，193页pdf

专知会员服务

44+阅读 · 2023年9月17日

【剑桥大学博士论文】机器学习中的分布外泛化，214页pdf

【剑桥大学博士论文】机器学习中的分布外泛化，214页pdf

专知会员服务

86+阅读 · 2023年9月13日

【斯坦福大学博士论文】面向现实应用的深度生成模型，222页pdf

【斯坦福大学博士论文】面向现实应用的深度生成模型，222页pdf

专知会员服务

45+阅读 · 2023年9月7日

【斯坦福博士论文】使用结构化状态空间对序列建模，330页pdf

【斯坦福博士论文】使用结构化状态空间对序列建模，330页pdf

专知会员服务

52+阅读 · 2023年7月13日

【CMU博士论文】基于机器学习的预测: 准确性、可解释性和效率，161页pdf

【CMU博士论文】基于机器学习的预测: 准确性、可解释性和效率，161页pdf

专知会员服务

71+阅读 · 2023年6月8日

【CMU博士论文】可解释机器学习方法与应用，127页pdf

【CMU博士论文】可解释机器学习方法与应用，127页pdf

专知会员服务

77+阅读 · 2023年6月6日

【MIT博士论文】序列决策中的算法公平性，134页pdf

【MIT博士论文】序列决策中的算法公平性，134页pdf

专知会员服务

25+阅读 · 2023年5月20日

【CMU博士论文】不同形式的不完全和间接监督的机器学习，220页pdf

【CMU博士论文】不同形式的不完全和间接监督的机器学习，220页pdf

专知会员服务

30+阅读 · 2023年3月8日

【Anton博士论文】图结构相似性与表示，210页pdf

专知会员服务

50+阅读 · 2021年6月16日

【Aalto博士论文】深度生成神经网络模型: 捕获视觉数据中复杂模式，92页pdf

【Aalto博士论文】深度生成神经网络模型: 捕获视觉数据中复杂模式，92页pdf

专知会员服务

26+阅读 · 2021年1月18日

机器学习可解释如何客观评估？CMU-Yeh博士论文《可解释机器学习的客观标准》，148页pdf

机器学习可解释如何客观评估？CMU-Yeh博士论文《可解释机器学习的客观标准》，148页pdf

专知

5+阅读 · 2022年11月23日

【MIT博士论文】机器学习中的稀疏性:理论与应用，122页pdf

【MIT博士论文】机器学习中的稀疏性:理论与应用，122页pdf

专知

6+阅读 · 2022年11月21日

【UFPE大学博士论文】基于熵损失的鲁棒深度学习，179页pdf

【UFPE大学博士论文】基于熵损失的鲁棒深度学习，179页pdf

专知

6+阅读 · 2022年11月11日

【剑桥大学博士论文】计算机系统中的端到端深度强化学习，188页pdf

【剑桥大学博士论文】计算机系统中的端到端深度强化学习，188页pdf

专知

6+阅读 · 2022年10月31日

【牛津大学博士论文】学习和解释来自多模态数据的深度表示，267页pdf

【牛津大学博士论文】学习和解释来自多模态数据的深度表示，267页pdf

专知

9+阅读 · 2022年10月30日

【伯克利博士论文】学习在动态环境中泛化，103页pdf

【伯克利博士论文】学习在动态环境中泛化，103页pdf

专知

6+阅读 · 2022年10月12日

【迪肯大学博士论文】深度神经网络视觉推理，221页pdf

【迪肯大学博士论文】深度神经网络视觉推理，221页pdf

专知

5+阅读 · 2022年10月3日

【MIT博士论文】实用机器学习的高效鲁棒算法，142页pdf

【MIT博士论文】实用机器学习的高效鲁棒算法，142页pdf

专知

5+阅读 · 2022年9月7日

【MIT博士论文】自监督学习语音处理，148页pdf

【MIT博士论文】自监督学习语音处理，148页pdf

专知

8+阅读 · 2022年8月31日

【MIT博士论文】概率机器学习模型在半导体制造中的应用，160页pdf

【MIT博士论文】概率机器学习模型在半导体制造中的应用，160页pdf

专知

0+阅读 · 2022年8月6日

满足差分隐私的频繁模式挖掘研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于对称识别方法的贝叶斯probit模型稳健性研究

国家自然科学基金

3+阅读 · 2015年12月31日

高维回归模型的预测稳定性研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于云计算平台的下一代测序数据错误修正算法研究与实现

国家自然科学基金

2+阅读 · 2015年12月31日

SDN数据平面中大规模流表的高性能查找方法研究

国家自然科学基金

4+阅读 · 2015年12月31日

基于支撑函数的不规则形态扩展目标建模和估计研究

国家自然科学基金

0+阅读 · 2015年12月31日

网状meta分析实效性评价方法及其广义线性混合效应模型的构建与应用研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于异构信息网络的分类算法推荐方法研究

国家自然科学基金

7+阅读 · 2015年12月31日

大数据环境下基于GMDH的客户分类半监督集成模型研究

国家自然科学基金

1+阅读 · 2014年12月31日

变换结构方程模型的非参数贝叶斯分析

国家自然科学基金

3+阅读 · 2014年12月31日

Machine-assisted mixed methods: augmenting humanities and social sciences with artificial intelligence

Arxiv

0+阅读 · 2023年9月24日

Enumeration of max-pooling responses with generalized permutohedra

Arxiv

0+阅读 · 2023年9月23日

Methods for generating and evaluating synthetic longitudinal patient data: a systematic review

Arxiv

0+阅读 · 2023年9月21日

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

171+阅读 · 2023年4月20日

A Comprehensive Survey on Deep Graph Representation Learning

Arxiv

103+阅读 · 2023年4月11日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

216+阅读 · 2023年4月7日

A Survey on Graph Diffusion Models: Generative AI in Science for Molecule, Protein and Material

Arxiv

81+阅读 · 2023年4月4日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

476+阅读 · 2023年3月31日

Knowledge Graphs: Opportunities and Challenges

Arxiv

173+阅读 · 2023年3月24日

A survey and taxonomy of loss functions in machine learning

Arxiv

26+阅读 · 2023年1月13日

VIP会员

相关主题

深度生成模型

麻省理工学院 (MIT)

相关VIP内容

【ETH博士论文】基于离散优化的学习，193页pdf

【ETH博士论文】基于离散优化的学习，193页pdf

专知会员服务

44+阅读 · 2023年9月17日

【剑桥大学博士论文】机器学习中的分布外泛化，214页pdf

【剑桥大学博士论文】机器学习中的分布外泛化，214页pdf

专知会员服务

86+阅读 · 2023年9月13日

【斯坦福大学博士论文】面向现实应用的深度生成模型，222页pdf

【斯坦福大学博士论文】面向现实应用的深度生成模型，222页pdf

专知会员服务

45+阅读 · 2023年9月7日

【斯坦福博士论文】使用结构化状态空间对序列建模，330页pdf

【斯坦福博士论文】使用结构化状态空间对序列建模，330页pdf

专知会员服务

52+阅读 · 2023年7月13日

【CMU博士论文】基于机器学习的预测: 准确性、可解释性和效率，161页pdf

【CMU博士论文】基于机器学习的预测: 准确性、可解释性和效率，161页pdf

专知会员服务

71+阅读 · 2023年6月8日

【CMU博士论文】可解释机器学习方法与应用，127页pdf

【CMU博士论文】可解释机器学习方法与应用，127页pdf

专知会员服务

77+阅读 · 2023年6月6日

【MIT博士论文】序列决策中的算法公平性，134页pdf

【MIT博士论文】序列决策中的算法公平性，134页pdf

专知会员服务

25+阅读 · 2023年5月20日

【CMU博士论文】不同形式的不完全和间接监督的机器学习，220页pdf

【CMU博士论文】不同形式的不完全和间接监督的机器学习，220页pdf

专知会员服务

30+阅读 · 2023年3月8日

【Anton博士论文】图结构相似性与表示，210页pdf

专知会员服务

50+阅读 · 2021年6月16日

【Aalto博士论文】深度生成神经网络模型: 捕获视觉数据中复杂模式，92页pdf

【Aalto博士论文】深度生成神经网络模型: 捕获视觉数据中复杂模式，92页pdf

专知会员服务

26+阅读 · 2021年1月18日

热门VIP内容

开通专知VIP会员享更多权益服务

《小型无人机系统侦测追踪技术：声学、计算机视觉与深度学习融合方案》最新98页

《"牧羊人网格"拦截策略：实现无人机集群可靠拦截的新范式》

光纤无人机：反无人机系统的重大挑战

《作战建模与仿真实证研究》

相关资讯

机器学习可解释如何客观评估？CMU-Yeh博士论文《可解释机器学习的客观标准》，148页pdf

机器学习可解释如何客观评估？CMU-Yeh博士论文《可解释机器学习的客观标准》，148页pdf

专知

5+阅读 · 2022年11月23日

【MIT博士论文】机器学习中的稀疏性:理论与应用，122页pdf

【MIT博士论文】机器学习中的稀疏性:理论与应用，122页pdf

专知

6+阅读 · 2022年11月21日

【UFPE大学博士论文】基于熵损失的鲁棒深度学习，179页pdf

【UFPE大学博士论文】基于熵损失的鲁棒深度学习，179页pdf

专知

6+阅读 · 2022年11月11日

【剑桥大学博士论文】计算机系统中的端到端深度强化学习，188页pdf

【剑桥大学博士论文】计算机系统中的端到端深度强化学习，188页pdf

专知

6+阅读 · 2022年10月31日

【牛津大学博士论文】学习和解释来自多模态数据的深度表示，267页pdf

【牛津大学博士论文】学习和解释来自多模态数据的深度表示，267页pdf

专知

9+阅读 · 2022年10月30日

【伯克利博士论文】学习在动态环境中泛化，103页pdf

【伯克利博士论文】学习在动态环境中泛化，103页pdf

专知

6+阅读 · 2022年10月12日

【迪肯大学博士论文】深度神经网络视觉推理，221页pdf

【迪肯大学博士论文】深度神经网络视觉推理，221页pdf

专知

5+阅读 · 2022年10月3日

【MIT博士论文】实用机器学习的高效鲁棒算法，142页pdf

【MIT博士论文】实用机器学习的高效鲁棒算法，142页pdf

专知

5+阅读 · 2022年9月7日

【MIT博士论文】自监督学习语音处理，148页pdf

【MIT博士论文】自监督学习语音处理，148页pdf

专知

8+阅读 · 2022年8月31日

【MIT博士论文】概率机器学习模型在半导体制造中的应用，160页pdf

【MIT博士论文】概率机器学习模型在半导体制造中的应用，160页pdf

专知

0+阅读 · 2022年8月6日

相关基金

满足差分隐私的频繁模式挖掘研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于对称识别方法的贝叶斯probit模型稳健性研究

国家自然科学基金

3+阅读 · 2015年12月31日

高维回归模型的预测稳定性研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于云计算平台的下一代测序数据错误修正算法研究与实现

国家自然科学基金

2+阅读 · 2015年12月31日

SDN数据平面中大规模流表的高性能查找方法研究

国家自然科学基金

4+阅读 · 2015年12月31日

基于支撑函数的不规则形态扩展目标建模和估计研究

国家自然科学基金

0+阅读 · 2015年12月31日

网状meta分析实效性评价方法及其广义线性混合效应模型的构建与应用研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于异构信息网络的分类算法推荐方法研究

国家自然科学基金

7+阅读 · 2015年12月31日

大数据环境下基于GMDH的客户分类半监督集成模型研究

国家自然科学基金

1+阅读 · 2014年12月31日

变换结构方程模型的非参数贝叶斯分析

国家自然科学基金

3+阅读 · 2014年12月31日

相关论文

Machine-assisted mixed methods: augmenting humanities and social sciences with artificial intelligence

Arxiv

0+阅读 · 2023年9月24日

Enumeration of max-pooling responses with generalized permutohedra

Arxiv

0+阅读 · 2023年9月23日

Methods for generating and evaluating synthetic longitudinal patient data: a systematic review

Arxiv

0+阅读 · 2023年9月21日

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

171+阅读 · 2023年4月20日

A Comprehensive Survey on Deep Graph Representation Learning

Arxiv

103+阅读 · 2023年4月11日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

216+阅读 · 2023年4月7日

A Survey on Graph Diffusion Models: Generative AI in Science for Molecule, Protein and Material

Arxiv

81+阅读 · 2023年4月4日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

476+阅读 · 2023年3月31日

Knowledge Graphs: Opportunities and Challenges

Arxiv

173+阅读 · 2023年3月24日

A survey and taxonomy of loss functions in machine learning

Arxiv

26+阅读 · 2023年1月13日

微信扫码咨询专知VIP会员