《实现稳健和弹性机器学习》243页CMU博士论文

在构建机器学习管道时，一些常见的假设是：(1）训练数据足够 "干净"，表现良好，因此很少或没有离群值，或者数据的分布没有长尾，（2）测试数据遵循与训练数据相同的分布，以及（3）数据产生于或接近于一个已知的模型类，如线性模型或神经网络。

然而，随着计算机、互联网和各种基于传感器的技术更容易获得，科学和工程的各个分支中出现的现代数据集不再是精心策划的，往往是以分散的、分布式的方式收集。因此，它们受到异质性、对抗性操作和异常值等复杂因素的困扰。随着我们进入这个脏的数据时代，上述的机器学习管道的假设越来越站不住脚。

对于机器学习的广泛采用，我们认为任何模型都必须具备以下三个基本要素：

稳健性。该模型即使在有噪音和损坏的数据下也能被训练。
可信赖。在训练结束后，当在现实世界中部署时，该模型在分布的良性变化下不应该崩溃。
有弹性。建模程序应该在模型错误指定的情况下工作，也就是说，即使建模假设崩溃，模型也应该找到可能的最佳解决方案。

在这篇论文中，我们的目标是修改最先进的ML技术并设计新的算法，使其即使在没有上述假设的情况下也能工作，并且是稳健、可信和有弹性的。我们的贡献如下。

在第二章中，我们提供了一类新的统计最优估计器，这些估计器对各种环境是稳健的，如任意污染和重尾数据等。

在第三章中，我们用一类新的计算效率高的稳健风险最小化估计器来补充我们的统计最优估计器。这些结果为一般的统计模型，如线性回归、逻辑回归等，提供了一些最早的可计算的、可证明的稳健估计器。

在第四章中，我们研究了在基础分布中的一些样本可能被任意破坏的情况下学习Ising模型的问题。

最后，在第五章，我们讨论了我们的结果对现代机器学习的影响。

成为VIP会员查看完整内容

知识荟萃

精品入门和进阶教程、论文和代码整理等

查看相关VIP内容、论文、资讯等

【CMU博士论文】通过记忆的元强化学习，118页pdf

专知会员服务

48+阅读 · 2022年6月23日

《用于工业设计异常检测和参数余量预测的无监督概率和核回归方法》234页博士论文

专知会员服务

20+阅读 · 2022年5月12日

【2022新书】用回归来解决比较、估计、预测和因果推断的实际问题，546页pdf

专知会员服务

145+阅读 · 2022年2月2日

深度学习为何泛化好？CMU博士论文《解释深度学习中的泛化性》探究深度学习泛化性的理论基础进展

专知会员服务

84+阅读 · 2021年10月22日

【哥本哈根博士论文】因果性与泛化:可识别性与学习方法

专知会员服务

65+阅读 · 2021年10月18日

【干货书】贝叶斯推理和机器学习，610页pdf

专知会员服务

258+阅读 · 2021年10月8日

【CMU博士论文】面向分布偏移的自然语言处理学习神经模型，148页pdf

专知会员服务

37+阅读 · 2021年9月7日

【CMU博士论文】公平机器学习的黑盒方法，101页pdf

专知会员服务

48+阅读 · 2021年9月5日

【CMU博士论文】开放世界目标检测与跟踪，168页pdf

专知会员服务

60+阅读 · 2021年6月14日

【CVPR2020-CMU】无数据模型选择，一种深度框架潜力

专知会员服务

23+阅读 · 2020年4月12日

CMU联手Adobe：GAN模型迎来预训练时代，仅需1%的训练样本｜CVPR 2022

GenomicAI

0+阅读 · 2022年5月30日

【AI+生物医学】耶鲁大学最新博士论文《图先验、最优传输和深度学习在生物医学发现中的应用》231页pdf

专知

11+阅读 · 2022年4月29日

【CMU博士论文】缓解负迁移提高迁移学习的泛化和效率，201页pdf

专知

3+阅读 · 2022年4月19日

谷歌NIPS'21 | 如何让图神经网络更稳健？

图与推荐

1+阅读 · 2022年3月22日

让图网络更稳健！谷歌提出SR-GNN，无惧数据标记偏差和领域转移

新智元

1+阅读 · 2022年3月18日

噪声数据如何建模？香港浸会大学最新《标签噪声表示学习》综述论文，全面阐述LNRL的数据、目标函数与优化策略

专知

1+阅读 · 2022年2月15日

专知

26+阅读 · 2022年2月2日

IBM研究员Varshney新书《可信赖机器学习》，294页pdf讲述可信赖ML系统性知识

专知

1+阅读 · 2021年12月31日

近期必读的七篇 ICLR 2021【因果推理】相关投稿论文

专知

54+阅读 · 2020年10月6日

【伯克利博士论文】统计与优化—统计学习算法的计算保障（附143页PDF全文下载）

专知

30+阅读 · 2019年1月2日

稳健随机均值模型在时空数据分析中的应用

国家自然科学基金

1+阅读 · 2014年12月31日

复杂空间和时空数据的统计模型研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于模型检测的非确定性概率模型学习

国家自然科学基金

2+阅读 · 2013年12月31日

关于多目标函数的稀疏优化模型研究

国家自然科学基金

1+阅读 · 2013年12月31日

高维纵向数据的若干稳健变量选择方法研究

国家自然科学基金

1+阅读 · 2013年12月31日

时间序列模型中稳健且有效估计及稳健变量选择问题的研究

国家自然科学基金

2+阅读 · 2013年12月31日

非参数变换模型的统计推断

国家自然科学基金

0+阅读 · 2012年12月31日

区间删失数据的半参数回归模型的有效估计方法

国家自然科学基金

0+阅读 · 2012年12月31日

稳健且有效的回归和变量选择方法研究

国家自然科学基金

1+阅读 · 2012年12月31日

用于交互式视频检索的教练式主动学习模型

国家自然科学基金

0+阅读 · 2012年12月31日

Implicit copula variational inference

Arxiv

0+阅读 · 2022年6月28日

Should Type Theory replace Set Theory as the Foundation of Mathematics

Arxiv

0+阅读 · 2022年6月28日

Persistent homology-based descriptor for machine-learning potential

Arxiv

0+阅读 · 2022年6月28日

Visual Adversarial Imitation Learning using Variational Models

Arxiv

0+阅读 · 2022年6月27日

Recent Advances in Reinforcement Learning in Finance

Arxiv

11+阅读 · 2021年12月8日

Adaptive Consistency Regularization for Semi-Supervised Transfer Learning

Arxiv

23+阅读 · 2021年3月3日

A Mathematical Introduction to Generative Adversarial Nets (GAN)

Arxiv

27+阅读 · 2020年9月1日

A Modern Introduction to Online Learning

Arxiv

21+阅读 · 2019年12月31日

MeLU: Meta-Learned User Preference Estimator for Cold-Start Recommendation

Arxiv

39+阅读 · 2019年7月31日

Generative Adversarial Networks and Probabilistic Graph Models for Hyperspectral Image Classification

Arxiv

11+阅读 · 2018年2月10日

VIP会员

相关内容

知识荟萃

更多