In this paper, we introduce adversarially robust streaming algorithms for central machine learning and algorithmic tasks, such as regression and clustering, as well as their more general counterparts, subspace embedding, low-rank approximation, and coreset construction. For regression and other numerical linear algebra related tasks, we consider the row arrival streaming model. Our results are based on a simple, but powerful, observation that many importance sampling-based algorithms give rise to adversarial robustness which is in contrast to sketching based algorithms, which are very prevalent in the streaming literature but suffer from adversarial attacks. In addition, we show that the well-known merge and reduce paradigm in streaming is adversarially robust. Since the merge and reduce paradigm allows coreset constructions in the streaming setting, we thus obtain robust algorithms for $k$-means, $k$-median, $k$-center, Bregman clustering, projective clustering, principal component analysis (PCA) and non-negative matrix factorization. To the best of our knowledge, these are the first adversarially robust results for these problems yet require no new algorithmic implementations. Finally, we empirically confirm the robustness of our algorithms on various adversarial attacks and demonstrate that by contrast, some common existing algorithms are not robust. (Abstract shortened to meet arXiv limits)


翻译:在本文中,我们为中央机器学习和算法任务引入了对抗性强的流算法,如回归和集群,以及更一般的对应方、子空间嵌入、低级近似和核心元件构建。对于回归和其他数字线性代数相关任务,我们考虑行进量流模式。我们的结果基于一个简单但有力的观察,即许多重要的基于抽样的算法都产生了对抗性强势,这与草图为基础的算法形成对照,这些算法在流文献中非常普遍,但受到对抗性攻击的影响。此外,我们表明,流化中众所周知的合并和减少模式的范式具有对抗性强势。由于合并和减少模式允许在流化环境中进行核心元件构建,因此我们因此为美元-平均值、美元-中间值、美元-中间值、美元-中间值、布雷格曼组合、投影集、主要组成部分分析(PCA)和非反向反向矩阵化因素化。我们最了解的是,这些是这些问题的首个敌对性合并和递减模式。由于合并和缩略性结果,我们最后不需要通过新的演算法来证实一些稳健的典型的反比。

0
下载
关闭预览

相关内容

专知会员服务
27+阅读 · 2021年7月11日
专知会员服务
90+阅读 · 2021年6月29日
专知会员服务
16+阅读 · 2021年5月21日
专知会员服务
26+阅读 · 2021年4月2日
强化学习三篇论文 避免遗忘等
CreateAMind
20+阅读 · 2019年5月24日
Hierarchically Structured Meta-learning
CreateAMind
26+阅读 · 2019年5月22日
深度自进化聚类:Deep Self-Evolution Clustering
我爱读PAMI
15+阅读 · 2019年4月13日
disentangled-representation-papers
CreateAMind
26+阅读 · 2018年9月12日
人工智能 | 国际会议截稿信息9条
Call4Papers
4+阅读 · 2018年3月13日
Adversarial Variational Bayes: Unifying VAE and GAN 代码
CreateAMind
7+阅读 · 2017年10月4日
【论文】图上的表示学习综述
机器学习研究会
14+阅读 · 2017年9月24日
Auto-Encoding GAN
CreateAMind
7+阅读 · 2017年8月4日
大数据的分布式算法
待字闺中
3+阅读 · 2017年6月13日
Arxiv
8+阅读 · 2019年2月15日
Arxiv
3+阅读 · 2018年12月21日
Arxiv
5+阅读 · 2018年5月21日
Arxiv
11+阅读 · 2018年3月23日
Arxiv
5+阅读 · 2018年1月30日
Arxiv
4+阅读 · 2015年3月20日
VIP会员
相关资讯
强化学习三篇论文 避免遗忘等
CreateAMind
20+阅读 · 2019年5月24日
Hierarchically Structured Meta-learning
CreateAMind
26+阅读 · 2019年5月22日
深度自进化聚类:Deep Self-Evolution Clustering
我爱读PAMI
15+阅读 · 2019年4月13日
disentangled-representation-papers
CreateAMind
26+阅读 · 2018年9月12日
人工智能 | 国际会议截稿信息9条
Call4Papers
4+阅读 · 2018年3月13日
Adversarial Variational Bayes: Unifying VAE and GAN 代码
CreateAMind
7+阅读 · 2017年10月4日
【论文】图上的表示学习综述
机器学习研究会
14+阅读 · 2017年9月24日
Auto-Encoding GAN
CreateAMind
7+阅读 · 2017年8月4日
大数据的分布式算法
待字闺中
3+阅读 · 2017年6月13日
Top
微信扫码咨询专知VIP会员