【CMU博士论文】鲁棒机器学习：在分布变化下的检测、评估和适应 - 专知VIP

会员服务 ·

12

鲁棒机器学习 · CMU ·

【CMU博士论文】鲁棒机器学习：在分布变化下的检测、评估和适应

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

尽管深度学习有着广泛的应用，但在实际应用中仍面临稳健性挑战，尤其是在训练和测试分布不一致的情况下。训练和测试分布之间的差异原因包括人类行为的逐渐变化或服务使用环境的人口统计学差异。虽然获取预期分布变化的标注数据可能非常困难，但未标注样本相对便宜且数量充足。

我的研究利用目标领域的未标注数据，识别目标领域和源领域之间的结构关系，然后利用这些关系来适应和评估模型。本论文讨论的工作涉及理论和实证上理解深度模型的行为，并利用这些见解开发稳健的方法。特别是，本论文调查了我在以下三个问题上的工作：

Q1：如何在分布变化的情况下适应模型？如果没有对分布变化性质的假设，这项任务是不可能完成的。我的研究重点是制定在实际环境中出现的分布变化场景的假设，并通过利用未标注数据来改进和适应深度模型。论文的第一部分和第二部分详细探讨了这一研究。

Q2：在没有标注数据的情况下，如何评估模型的性能？深度学习模型会无声地失败，即它们无法标记不确定的决策。为了构建可靠的机器学习系统，获得准确性的证明与增强系统的稳健性同样重要。第三部分讨论了我在这方面的研究，并提出了利用未标注数据预测模型准确性的技术。

Q3：如何利用基础模型来解决分布变化带来的挑战？基础模型（如视觉语言模型）在广泛的任务中表现出色。然而，这些模型也由于虚假关联、图像与文本对齐差等原因缺乏稳健性。此外，随着互联网数据的演变，这些模型也会变得过时，提出了保持它们更新的新的挑战。第四部分讨论了我对基础模型行为的理解以及在分布变化下提高其稳健性的技术。

总体而言，本论文通过开发利用未标注数据在分布变化下适应和评估模型的技术，拓展了稳健机器学习的前沿。这里展示的工作是朝着在分布变化面前开发稳健机器学习全面工具包迈出的一步。

成为VIP会员查看完整内容

16

相关内容

鲁棒机器学习

鲁棒机器学习

【ETHZ博士论文】有限数据中的元学习先验：从理论到实践

【ETHZ博士论文】有限数据中的元学习先验：从理论到实践

专知会员服务

28+阅读 · 6月4日

【牛津大学博士论文】有效的离线训练与高效的在线适应

【牛津大学博士论文】有效的离线训练与高效的在线适应

专知会员服务

27+阅读 · 4月25日

【CMU博士论文】高效的深度神经网络终身学习：架构、训练和数据的优化

【CMU博士论文】高效的深度神经网络终身学习：架构、训练和数据的优化

专知会员服务

35+阅读 · 4月24日

【UIUC博士论文】生成式深度学习：走向更好的视觉表征和多模态

【UIUC博士论文】生成式深度学习：走向更好的视觉表征和多模态

专知会员服务

36+阅读 · 2月2日

【斯坦福博士论文】合作博弈论在可解释机器学习中的应用

【斯坦福博士论文】合作博弈论在可解释机器学习中的应用

专知会员服务

35+阅读 · 2023年9月19日

【CMU博士论文】从强化学习到机器人学习：利用先前数据和共享评估，

【CMU博士论文】从强化学习到机器人学习：利用先前数据和共享评估，

专知会员服务

39+阅读 · 2023年8月19日

【CMU博士论文】概率强化学习：使用数据定义期望的结果并推断如何达到

【CMU博士论文】概率强化学习：使用数据定义期望的结果并推断如何达到

专知会员服务

36+阅读 · 2023年7月31日

【伯克利Guanhua Wang博士论文】分布式机器学习系统的颠覆性研究

【伯克利Guanhua Wang博士论文】分布式机器学习系统的颠覆性研究

专知会员服务

41+阅读 · 2022年5月17日

【斯坦福】基于模型的深度学习:论深度学习与优化的交集

【斯坦福】基于模型的深度学习:论深度学习与优化的交集

专知会员服务

39+阅读 · 2022年5月10日

【IJCAI2020-华为诺亚】面向深度强化学习的策略迁移框架

【IJCAI2020-华为诺亚】面向深度强化学习的策略迁移框架

专知会员服务

26+阅读 · 2020年5月25日

图上如何建模因果性？PSU等最新《图反事实学习》综述，50页pdf全面综述图公平性、可解释性等方法

图上如何建模因果性？PSU等最新《图反事实学习》综述，50页pdf全面综述图公平性、可解释性等方法

专知

34+阅读 · 2023年4月13日

联邦学习如何处理异质性？港科大最新《异质联邦学习》综述，46页pdf全面阐述异质联邦学习的数据空间、统计、系统和模型异质性

联邦学习如何处理异质性？港科大最新《异质联邦学习》综述，46页pdf全面阐述异质联邦学习的数据空间、统计、系统和模型异质性

专知

10+阅读 · 2022年12月1日

NLP如何用元学习？李宏毅老师NAACL2022最新《元学习自然语言处理》综述论文阐述最新研究进展

NLP如何用元学习？李宏毅老师NAACL2022最新《元学习自然语言处理》综述论文阐述最新研究进展

专知

23+阅读 · 2022年5月4日

【博士论文】多任务学习视觉场景理解，140页pdf

【博士论文】多任务学习视觉场景理解，140页pdf

专知

26+阅读 · 2022年4月5日

图神经网络如何时序化？看Twitter最新《动态图深度学习:时序图网络TGN》研究，附论文与PPT下载

图神经网络如何时序化？看Twitter最新《动态图深度学习:时序图网络TGN》研究，附论文与PPT下载

专知

15+阅读 · 2021年1月24日

【NeurIPS 2020 Tutorial】离线强化学习:从算法到挑战，80页ppt

【NeurIPS 2020 Tutorial】离线强化学习:从算法到挑战，80页ppt

专知

15+阅读 · 2020年12月9日

【KDD2020】图神经网络生成式预训练

【KDD2020】图神经网络生成式预训练

专知

22+阅读 · 2020年7月3日

【伯克利PNAS最新论文】可解释机器学习的定义、方法和应用

【伯克利PNAS最新论文】可解释机器学习的定义、方法和应用

专知

72+阅读 · 2019年10月20日

【学界】CVPR 2019 | 基于级联语义引导下的多通道注意力选择图像翻译

【学界】CVPR 2019 | 基于级联语义引导下的多通道注意力选择图像翻译

GAN生成式对抗网络

10+阅读 · 2019年8月17日

【VALSE 前沿技术选介17-09期】自监督学习近期进展

【VALSE 前沿技术选介17-09期】自监督学习近期进展

VALSE

13+阅读 · 2017年10月20日

间接优化的高效Monte Carlo声传播研究

国家自然科学基金

0+阅读 · 2017年12月31日

基于学习的智能化漏洞挖掘关键技术研究

国家自然科学基金

4+阅读 · 2017年12月31日

基于对称识别方法的贝叶斯probit模型稳健性研究

国家自然科学基金

1+阅读 · 2015年12月31日

高维回归模型的预测稳定性研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于云计算平台的下一代测序数据错误修正算法研究与实现

国家自然科学基金

2+阅读 · 2015年12月31日

云计算下的加密域多媒体水印与模式匹配

国家自然科学基金

1+阅读 · 2015年12月31日

网状meta分析实效性评价方法及其广义线性混合效应模型的构建与应用研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向大数据的安全迁移学习方法

国家自然科学基金

22+阅读 · 2015年12月31日

基于异构信息网络的分类算法推荐方法研究

国家自然科学基金

6+阅读 · 2015年12月31日

大数据环境下基于GMDH的客户分类半监督集成模型研究

国家自然科学基金

1+阅读 · 2014年12月31日

A flexible and interpretable spatial covariance model for data on graphs

Arxiv

0+阅读 · 7月2日

On the consistency of hyper-parameter selection in value-based deep reinforcement learning

Arxiv

0+阅读 · 7月2日

Multifidelity linear regression for scientific machine learning from scarce data

Arxiv

0+阅读 · 7月1日

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

144+阅读 · 2023年4月20日

A Comprehensive Survey on Deep Graph Representation Learning

Arxiv

79+阅读 · 2023年4月11日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

152+阅读 · 2023年4月7日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

353+阅读 · 2023年3月31日

Revolutionizing Modern Networks: Advances in AI, Machine Learning, and Blockchain for Quantum Satellites and UAV-based Communication

Arxiv

31+阅读 · 2023年3月21日

Data-centric Artificial Intelligence: A Survey

Arxiv

18+阅读 · 2023年3月17日

Interpretable machine learning: definitions, methods, and applications

Interpretable machine learning: definitions, methods, and applications

Arxiv

18+阅读 · 2019年1月14日

VIP会员

相关主题

鲁棒机器学习

相关VIP内容

【ETHZ博士论文】有限数据中的元学习先验：从理论到实践

【ETHZ博士论文】有限数据中的元学习先验：从理论到实践

专知会员服务

28+阅读 · 6月4日

【牛津大学博士论文】有效的离线训练与高效的在线适应

【牛津大学博士论文】有效的离线训练与高效的在线适应

专知会员服务

27+阅读 · 4月25日

【CMU博士论文】高效的深度神经网络终身学习：架构、训练和数据的优化

【CMU博士论文】高效的深度神经网络终身学习：架构、训练和数据的优化

专知会员服务

35+阅读 · 4月24日

【UIUC博士论文】生成式深度学习：走向更好的视觉表征和多模态

【UIUC博士论文】生成式深度学习：走向更好的视觉表征和多模态

专知会员服务

36+阅读 · 2月2日

【斯坦福博士论文】合作博弈论在可解释机器学习中的应用

【斯坦福博士论文】合作博弈论在可解释机器学习中的应用

专知会员服务

35+阅读 · 2023年9月19日

【CMU博士论文】从强化学习到机器人学习：利用先前数据和共享评估，

【CMU博士论文】从强化学习到机器人学习：利用先前数据和共享评估，

专知会员服务

39+阅读 · 2023年8月19日

【CMU博士论文】概率强化学习：使用数据定义期望的结果并推断如何达到

【CMU博士论文】概率强化学习：使用数据定义期望的结果并推断如何达到

专知会员服务

36+阅读 · 2023年7月31日

【伯克利Guanhua Wang博士论文】分布式机器学习系统的颠覆性研究

【伯克利Guanhua Wang博士论文】分布式机器学习系统的颠覆性研究

专知会员服务

41+阅读 · 2022年5月17日

【斯坦福】基于模型的深度学习:论深度学习与优化的交集

【斯坦福】基于模型的深度学习:论深度学习与优化的交集

专知会员服务

39+阅读 · 2022年5月10日

【IJCAI2020-华为诺亚】面向深度强化学习的策略迁移框架

【IJCAI2020-华为诺亚】面向深度强化学习的策略迁移框架

专知会员服务

26+阅读 · 2020年5月25日

热门VIP内容

相关资讯

图上如何建模因果性？PSU等最新《图反事实学习》综述，50页pdf全面综述图公平性、可解释性等方法

图上如何建模因果性？PSU等最新《图反事实学习》综述，50页pdf全面综述图公平性、可解释性等方法

专知

34+阅读 · 2023年4月13日

联邦学习如何处理异质性？港科大最新《异质联邦学习》综述，46页pdf全面阐述异质联邦学习的数据空间、统计、系统和模型异质性

联邦学习如何处理异质性？港科大最新《异质联邦学习》综述，46页pdf全面阐述异质联邦学习的数据空间、统计、系统和模型异质性

专知

10+阅读 · 2022年12月1日

NLP如何用元学习？李宏毅老师NAACL2022最新《元学习自然语言处理》综述论文阐述最新研究进展

NLP如何用元学习？李宏毅老师NAACL2022最新《元学习自然语言处理》综述论文阐述最新研究进展

专知

23+阅读 · 2022年5月4日

【博士论文】多任务学习视觉场景理解，140页pdf

【博士论文】多任务学习视觉场景理解，140页pdf

专知

26+阅读 · 2022年4月5日

图神经网络如何时序化？看Twitter最新《动态图深度学习:时序图网络TGN》研究，附论文与PPT下载

图神经网络如何时序化？看Twitter最新《动态图深度学习:时序图网络TGN》研究，附论文与PPT下载

专知

15+阅读 · 2021年1月24日

【NeurIPS 2020 Tutorial】离线强化学习:从算法到挑战，80页ppt

【NeurIPS 2020 Tutorial】离线强化学习:从算法到挑战，80页ppt

专知

15+阅读 · 2020年12月9日

【KDD2020】图神经网络生成式预训练

【KDD2020】图神经网络生成式预训练

专知

22+阅读 · 2020年7月3日

【伯克利PNAS最新论文】可解释机器学习的定义、方法和应用

【伯克利PNAS最新论文】可解释机器学习的定义、方法和应用

专知

72+阅读 · 2019年10月20日

【学界】CVPR 2019 | 基于级联语义引导下的多通道注意力选择图像翻译

【学界】CVPR 2019 | 基于级联语义引导下的多通道注意力选择图像翻译

GAN生成式对抗网络

10+阅读 · 2019年8月17日

【VALSE 前沿技术选介17-09期】自监督学习近期进展

【VALSE 前沿技术选介17-09期】自监督学习近期进展

VALSE

13+阅读 · 2017年10月20日

相关基金

间接优化的高效Monte Carlo声传播研究

国家自然科学基金

0+阅读 · 2017年12月31日

基于学习的智能化漏洞挖掘关键技术研究

国家自然科学基金

4+阅读 · 2017年12月31日

基于对称识别方法的贝叶斯probit模型稳健性研究

国家自然科学基金

1+阅读 · 2015年12月31日

高维回归模型的预测稳定性研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于云计算平台的下一代测序数据错误修正算法研究与实现

国家自然科学基金

2+阅读 · 2015年12月31日

云计算下的加密域多媒体水印与模式匹配

国家自然科学基金

1+阅读 · 2015年12月31日

网状meta分析实效性评价方法及其广义线性混合效应模型的构建与应用研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向大数据的安全迁移学习方法

国家自然科学基金

22+阅读 · 2015年12月31日

基于异构信息网络的分类算法推荐方法研究

国家自然科学基金

6+阅读 · 2015年12月31日

大数据环境下基于GMDH的客户分类半监督集成模型研究

国家自然科学基金

1+阅读 · 2014年12月31日

相关论文

A flexible and interpretable spatial covariance model for data on graphs

Arxiv

0+阅读 · 7月2日

On the consistency of hyper-parameter selection in value-based deep reinforcement learning

Arxiv

0+阅读 · 7月2日

Multifidelity linear regression for scientific machine learning from scarce data

Arxiv

0+阅读 · 7月1日

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

144+阅读 · 2023年4月20日

A Comprehensive Survey on Deep Graph Representation Learning

Arxiv

79+阅读 · 2023年4月11日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

152+阅读 · 2023年4月7日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

353+阅读 · 2023年3月31日

Revolutionizing Modern Networks: Advances in AI, Machine Learning, and Blockchain for Quantum Satellites and UAV-based Communication

Arxiv

31+阅读 · 2023年3月21日

Data-centric Artificial Intelligence: A Survey

Arxiv

18+阅读 · 2023年3月17日

Interpretable machine learning: definitions, methods, and applications

Interpretable machine learning: definitions, methods, and applications

Arxiv

18+阅读 · 2019年1月14日

微信扫码咨询专知VIP会员