【ICML2021】随机森林机器遗忘 - 专知VIP

会员服务 ·

0

随机森林 · ICML 2021 ·

2021 年 8 月 9 日

【ICML2021】随机森林机器遗忘

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

考虑到用户数据删除请求、删除噪声的示例或删除损坏的训练数据，这只是希望从机器学习(ML)模型中删除实例的几个原因。然而，从ML模型中有效地删除这些数据通常是困难的。在本文中，我们引入了数据移除(DaRE)森林，这是随机森林的一种变体，可以在最少的再训练的情况下删除训练数据。森林中每棵DaRE树的模型更新都是精确的，这意味着从DaRE模型中删除实例产生的模型与对更新后的数据进行从头再训练完全相同。

DaRE树利用随机性和缓存来高效删除数据。DaRE树的上层使用随机节点，它均匀随机地选择分割属性和阈值。这些节点很少需要更新，因为它们对数据的依赖性很小。在较低的层次上，选择分割是为了贪婪地优化分割标准，如基尼指数或互信息。DaRE树在每个节点上缓存统计信息，在每个叶子上缓存训练数据，这样当数据被删除时，只更新必要的子树。对于数值属性，贪婪节点在阈值的随机子集上进行优化，以便在逼近最优阈值的同时保持统计量。通过调整贪婪节点的阈值数量和随机节点的数量，DaRE树可以在更准确的预测和更有效的更新之间进行权衡。

在13个真实数据集和一个合成数据集上的实验中，我们发现DaRE森林删除数据的速度比从头开始训练的速度快几个数量级，同时几乎不牺牲预测能力。

https://icml.cc/Conferences/2021/Schedule?showEvent=10523

成为VIP会员查看完整内容

21

相关内容

随机森林

随机森林指的是利用多棵树对样本进行训练并预测的一种分类器。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等

【NeurIPS2021】模型可解释性的符号语言基础

专知会员服务

22+阅读 · 2021年10月8日

[ICML2021]记忆高效在线元学习

专知会员服务

25+阅读 · 2021年9月25日

【ICML2021】反事实生成模型的语言

专知会员服务

18+阅读 · 2021年9月17日

【ICML2021】Dash:带有动态阈值的半监督学习

专知会员服务

19+阅读 · 2021年9月4日

【ICML2021】自提升策略规划真实且可执行的分子逆合成路线

专知会员服务

8+阅读 · 2021年7月29日

【ICML2021】具有性能保证的弱监督下的对抗性多类学习

专知会员服务

17+阅读 · 2021年7月13日

一文概览 CVPR2021 最新18篇 Oral 论文

专知会员服务

26+阅读 · 2021年3月7日

【NeurIPS 2020】学习神经网络中的不变性

专知会员服务

29+阅读 · 2020年10月24日

【EMNLP2020】自然语言分类任务的自监督元学习

专知会员服务

30+阅读 · 2020年9月18日

【CVPR2020-Oral】用于深度网络的任务感知超参数

【CVPR2020-Oral】用于深度网络的任务感知超参数

专知会员服务

28+阅读 · 2020年5月25日

今日面试题分享：如何理解模型的过拟合与欠拟合，以及如何解决？

今日面试题分享：如何理解模型的过拟合与欠拟合，以及如何解决？

七月在线实验室

6+阅读 · 2019年3月21日

教程▍Python机器学习实践：随机森林算法训练及调参（附代码）

教程▍Python机器学习实践：随机森林算法训练及调参（附代码）

36大数据

8+阅读 · 2019年2月27日

已删除

将门创投

6+阅读 · 2019年1月11日

如何训练你的ResNet（三）：正则化

如何训练你的ResNet（三）：正则化

论智

5+阅读 · 2018年11月13日

从零开始深度学习：dropout与正则化

从零开始深度学习：dropout与正则化

数萃大数据

7+阅读 · 2018年7月22日

教程 | 从检查过拟合到数据增强，一文简述提升神经网络性能方法

教程 | 从检查过拟合到数据增强，一文简述提升神经网络性能方法

机器之心

3+阅读 · 2018年5月28日

如何改进梯度下降算法

如何改进梯度下降算法

论智

9+阅读 · 2018年4月19日

从零开始用Python实现k近邻算法（附代码、数据集）

从零开始用Python实现k近邻算法（附代码、数据集）

数据派THU

8+阅读 · 2018年4月17日

哪个才是解决回归问题的最佳算法？线性回归、神经网络还是随机森林？

哪个才是解决回归问题的最佳算法？线性回归、神经网络还是随机森林？

AI100

7+阅读 · 2018年3月8日

教程 | 如何判断LSTM模型中的过拟合与欠拟合

教程 | 如何判断LSTM模型中的过拟合与欠拟合

机器之心

6+阅读 · 2017年10月2日

Sparse MoEs meet Efficient Ensembles

Arxiv

0+阅读 · 2021年10月7日

The Impact of Blocking Cars on Pathloss Within a Platoon: Measurements for 26 GHz Band

The Impact of Blocking Cars on Pathloss Within a Platoon: Measurements for 26 GHz Band

Arxiv

0+阅读 · 2021年10月6日

T-SNE Is Not Optimized to Reveal Clusters in Data

Arxiv

0+阅读 · 2021年10月6日

Linear Policies are Sufficient to Realize Robust Bipedal Walking on Challenging Terrains

Arxiv

0+阅读 · 2021年10月5日

Group testing with nested pools

Arxiv

0+阅读 · 2021年10月5日

Recurrent circuits as multi-path ensembles for modeling responses of early visual cortical neurons

Arxiv

0+阅读 · 2021年10月2日

Multi-Feasibility Variable Selection

Arxiv

0+阅读 · 2021年10月2日

Designing Quality Requirements, Metrics and Indicators for Core Ontologies: Results of a Comparative Study for Process Core Ontologies

Designing Quality Requirements, Metrics and Indicators for Core Ontologies: Results of a Comparative Study for Process Core Ontologies

Arxiv

0+阅读 · 2021年10月1日

An Under-Actuated Whippletree Mechanism Gripper based on Multi-Objective Design Optimization with Auto-Tuned Weights

Arxiv

0+阅读 · 2021年9月30日

Hierarchical Human Parsing with Typed Part-Relation Reasoning

Hierarchical Human Parsing with Typed Part-Relation Reasoning

Arxiv

6+阅读 · 2020年3月10日

VIP会员

相关主题

相关VIP内容

【NeurIPS2021】模型可解释性的符号语言基础

专知会员服务

22+阅读 · 2021年10月8日

[ICML2021]记忆高效在线元学习

专知会员服务

25+阅读 · 2021年9月25日

【ICML2021】反事实生成模型的语言

专知会员服务

18+阅读 · 2021年9月17日

【ICML2021】Dash:带有动态阈值的半监督学习

专知会员服务

19+阅读 · 2021年9月4日

【ICML2021】自提升策略规划真实且可执行的分子逆合成路线

专知会员服务

8+阅读 · 2021年7月29日

【ICML2021】具有性能保证的弱监督下的对抗性多类学习

专知会员服务

17+阅读 · 2021年7月13日

一文概览 CVPR2021 最新18篇 Oral 论文

专知会员服务

26+阅读 · 2021年3月7日

【NeurIPS 2020】学习神经网络中的不变性

专知会员服务

29+阅读 · 2020年10月24日

【EMNLP2020】自然语言分类任务的自监督元学习

专知会员服务

30+阅读 · 2020年9月18日

【CVPR2020-Oral】用于深度网络的任务感知超参数

【CVPR2020-Oral】用于深度网络的任务感知超参数

专知会员服务

28+阅读 · 2020年5月25日

热门VIP内容

开通专知VIP会员享更多权益服务

《生成式人工智能与大/小语言模型在供应链管理决策优化与可持续性提升中的作用评估》最新51页

白宫发布《赢得AI竞赛：美国人工智能行动计划》最新28页

地下战：地下空间的战略博弈

《美地下作战条令手册》228页

相关资讯

今日面试题分享：如何理解模型的过拟合与欠拟合，以及如何解决？

今日面试题分享：如何理解模型的过拟合与欠拟合，以及如何解决？

七月在线实验室

6+阅读 · 2019年3月21日

教程▍Python机器学习实践：随机森林算法训练及调参（附代码）

教程▍Python机器学习实践：随机森林算法训练及调参（附代码）

36大数据

8+阅读 · 2019年2月27日

已删除

将门创投

6+阅读 · 2019年1月11日

如何训练你的ResNet（三）：正则化

如何训练你的ResNet（三）：正则化

论智

5+阅读 · 2018年11月13日

从零开始深度学习：dropout与正则化

从零开始深度学习：dropout与正则化

数萃大数据

7+阅读 · 2018年7月22日

教程 | 从检查过拟合到数据增强，一文简述提升神经网络性能方法

教程 | 从检查过拟合到数据增强，一文简述提升神经网络性能方法

机器之心

3+阅读 · 2018年5月28日

如何改进梯度下降算法

如何改进梯度下降算法

论智

9+阅读 · 2018年4月19日

从零开始用Python实现k近邻算法（附代码、数据集）

从零开始用Python实现k近邻算法（附代码、数据集）

数据派THU

8+阅读 · 2018年4月17日

哪个才是解决回归问题的最佳算法？线性回归、神经网络还是随机森林？

哪个才是解决回归问题的最佳算法？线性回归、神经网络还是随机森林？

AI100

7+阅读 · 2018年3月8日

教程 | 如何判断LSTM模型中的过拟合与欠拟合

教程 | 如何判断LSTM模型中的过拟合与欠拟合

机器之心

6+阅读 · 2017年10月2日

相关论文

Sparse MoEs meet Efficient Ensembles

Arxiv

0+阅读 · 2021年10月7日

The Impact of Blocking Cars on Pathloss Within a Platoon: Measurements for 26 GHz Band

The Impact of Blocking Cars on Pathloss Within a Platoon: Measurements for 26 GHz Band

Arxiv

0+阅读 · 2021年10月6日

T-SNE Is Not Optimized to Reveal Clusters in Data

Arxiv

0+阅读 · 2021年10月6日

Linear Policies are Sufficient to Realize Robust Bipedal Walking on Challenging Terrains

Arxiv

0+阅读 · 2021年10月5日

Group testing with nested pools

Arxiv

0+阅读 · 2021年10月5日

Recurrent circuits as multi-path ensembles for modeling responses of early visual cortical neurons

Arxiv

0+阅读 · 2021年10月2日

Multi-Feasibility Variable Selection

Arxiv

0+阅读 · 2021年10月2日

Designing Quality Requirements, Metrics and Indicators for Core Ontologies: Results of a Comparative Study for Process Core Ontologies

Designing Quality Requirements, Metrics and Indicators for Core Ontologies: Results of a Comparative Study for Process Core Ontologies

Arxiv

0+阅读 · 2021年10月1日

An Under-Actuated Whippletree Mechanism Gripper based on Multi-Objective Design Optimization with Auto-Tuned Weights

Arxiv

0+阅读 · 2021年9月30日

Hierarchical Human Parsing with Typed Part-Relation Reasoning

Hierarchical Human Parsing with Typed Part-Relation Reasoning

Arxiv

6+阅读 · 2020年3月10日

微信扫码咨询专知VIP会员