南大周志华团队开源深度森林软件包DF21：训练效率高、超参数少，普通设备就能跑 - 专知

会员服务 ·

0

南大周志华团队开源深度森林软件包DF21：训练效率高、超参数少，普通设备就能跑

2021 年 2 月 2 日 专知

深度森林，是探索神经网络以外 AI 领域重要的研究方向之一，在表格数据建模任务中已初现锋芒。但是，由于基于决策树的集成模型在具体实现当中，经常会遇到内存不足，硬件效率不如神经网络等问题，是推动其大规模应用的主要瓶颈之一。

2021年2月1日，南大教授周志华微博宣布，他们团队新的深度森林软件包DF21在 GitHub与开源中国同时开源了。该软件包尝试解决了这一方向在上述实际应用过程中所遇到的关键问题，未来在各类在数据建模过程中，大家啊也可以便捷地使用深度森林了。据介绍，该项目目前主要由南大徐轶轩进行开发和维护，在正式发布之前它已经在南大机器学习与数据挖掘研究所（LAMDA）内部经过测试和使用。

项目地址：http://www.lamda.nju.edu.cn/deep-forest/
Gitee 地址：https://gitee.com/lamda-nju/deep-forest
Github 地址：https://github.com/LAMDA-NJU/Deep-Forest

深度森林参与者之一冯霁博士提到，深度森林在表格数据建模上，相对传统算法效果显著，但是之前开源的代码主要用于算法验证，以及辅助其他科研工作者进行深度森林算法相关的研究，代码本身对内存和服务器性能要求较高。徐同学开源的这一版更为简单易用，做了很好的封装，同时进行了高性能优化，大幅降低了内存依赖，对于科研和实际落地应用都是很好的工具。

徐轶轩提到，这个模型的全名是：DF21: A Practical Deep Forest for Tabular Datasets，内存消耗是DF21主要解决的问题。此前的gcForest在处理百万级别的表格型数据集上，占用的内存可能会达到上百 GB。但在新版本中，在千万级别的表格型数据集上进行训练，占用的内存约为原来的十分之一左右。

专知便捷查看

便捷下载，请关注专知公众号（点击上方蓝色专知关注）

后台回复“DF21” 可以获取《南大周志华团队开源深度森林软件包DF21：训练效率高、超参数少，普通设备就能跑》专知下载链接索引

专知，专业可信的人工智能知识分发，让认知协作更快更好！欢迎注册登录专知www.zhuanzhi.ai，获取5000+AI主题干货知识资料！

欢迎微信扫一扫加入专知人工智能知识星球群，获取最新AI专业干货知识教程资料和与专家交流咨询！

点击“ 阅读原文 ”，了解使用专知 ，查看获取5000+AI主题知识资源

登录查看更多

0

相关内容

深度森林

分布式深度学习训练网络综述

专知会员服务

48+阅读 · 2021年2月2日

小米在预训练模型的探索与优化

小米在预训练模型的探索与优化

专知会员服务

20+阅读 · 2020年12月31日

机器学习的安全问题及隐私保护

专知会员服务

40+阅读 · 2020年12月20日

【NeurIPS 2020】广义神经网络中的知识蒸馏: 风险约束、数据效率和不完善的教师

【NeurIPS 2020】广义神经网络中的知识蒸馏: 风险约束、数据效率和不完善的教师

专知会员服务

18+阅读 · 2020年11月11日

联邦学习安全与隐私保护研究综述

专知会员服务

127+阅读 · 2020年8月7日

【Hinton新论文】SimCLRv2来了！提出蒸馏新思路，可迁移至小模型，性能精度超越有监督

【Hinton新论文】SimCLRv2来了！提出蒸馏新思路，可迁移至小模型，性能精度超越有监督

专知会员服务

41+阅读 · 2020年7月21日

【ICML2020-南大周志华老师组】针对未见类未标记数据的安全深度半监督学习

【ICML2020-南大周志华老师组】针对未见类未标记数据的安全深度半监督学习

专知会员服务

42+阅读 · 2020年7月5日

【CVPR 2020-商汤】8比特数值也能训练卷积神经网络模型

【CVPR 2020-商汤】8比特数值也能训练卷积神经网络模型

专知会员服务

26+阅读 · 2020年5月7日

【微众银行】联邦学习白皮书_v2.0，48页pdf，

【微众银行】联邦学习白皮书_v2.0，48页pdf，

专知会员服务

170+阅读 · 2020年4月26日

【2020新书】如何构建数据团队？:设计集成的技能、需求和解决方案，257页pdf

【2020新书】如何构建数据团队？:设计集成的技能、需求和解决方案，257页pdf

专知会员服务

115+阅读 · 2020年3月11日

联邦学习安全与隐私保护研究综述

联邦学习安全与隐私保护研究综述

专知

12+阅读 · 2020年8月7日

【ICML2020-南大周志华老师组】针对未见类未标记数据的安全深度半监督学习

【ICML2020-南大周志华老师组】针对未见类未标记数据的安全深度半监督学习

专知

46+阅读 · 2020年7月5日

如何训练和部署FP16/Int8等低精度机器学习模型?

如何训练和部署FP16/Int8等低精度机器学习模型?

专知

7+阅读 · 2019年10月3日

重磅开源！ ICCV 2019，华为诺亚提出无需数据网络压缩技术

重磅开源！ ICCV 2019，华为诺亚提出无需数据网络压缩技术

新智元

5+阅读 · 2019年9月7日

【最新综述】模型压缩与加速（附论文全文下载）

【最新综述】模型压缩与加速（附论文全文下载）

专知

28+阅读 · 2019年2月14日

周志华与「深度森林」

周志华与「深度森林」

网易智能菌

7+阅读 · 2018年8月2日

陈天奇团队推出开源AI芯片栈VTA，降低芯片设计门槛

陈天奇团队推出开源AI芯片栈VTA，降低芯片设计门槛

AI前线

15+阅读 · 2018年7月13日

Spark团队开源新作：全流程机器学习平台MLflow

Spark团队开源新作：全流程机器学习平台MLflow

AI前线

10+阅读 · 2018年6月6日

开源项目VNect使用普通手机摄像头进行动作捕捉，媲美深度摄像头

开源项目VNect使用普通手机摄像头进行动作捕捉，媲美深度摄像头

AR酱

9+阅读 · 2018年5月12日

IBM全新机器学习库SnapML：训练提速46倍，40亿样本仅需91.5秒

IBM全新机器学习库SnapML：训练提速46倍，40亿样本仅需91.5秒

AI前线

3+阅读 · 2018年3月23日

Open Domain Generalization with Domain-Augmented Meta-Learning

Arxiv

21+阅读 · 2021年4月8日

FocalMix: Semi-Supervised Learning for 3D Medical Image Detection

FocalMix: Semi-Supervised Learning for 3D Medical Image Detection

Arxiv

10+阅读 · 2020年3月20日

Few-shot Adaptive Faster R-CNN

Few-shot Adaptive Faster R-CNN

Arxiv

3+阅读 · 2019年3月22日

Span Based Open Information Extraction

Arxiv

3+阅读 · 2019年3月1日

Stereo R-CNN based 3D Object Detection for Autonomous Driving

Stereo R-CNN based 3D Object Detection for Autonomous Driving

Arxiv

5+阅读 · 2019年2月26日

Learning a Deep ConvNet for Multi-label Classification with Partial Labels

Learning a Deep ConvNet for Multi-label Classification with Partial Labels

Arxiv

6+阅读 · 2019年2月26日

MLtuner: System Support for Automatic Machine Learning Tuning

Arxiv

3+阅读 · 2018年3月20日

Arxiv

7+阅读 · 2018年1月24日

EnKCF: Ensemble of Kernelized Correlation Filters for High-Speed Object Tracking

Arxiv

6+阅读 · 2018年1月20日

SSD: Single Shot MultiBox Detector

Arxiv

5+阅读 · 2016年12月29日

VIP会员

相关主题

相关VIP内容

分布式深度学习训练网络综述

专知会员服务

48+阅读 · 2021年2月2日

小米在预训练模型的探索与优化

小米在预训练模型的探索与优化

专知会员服务

20+阅读 · 2020年12月31日

机器学习的安全问题及隐私保护

专知会员服务

40+阅读 · 2020年12月20日

【NeurIPS 2020】广义神经网络中的知识蒸馏: 风险约束、数据效率和不完善的教师

【NeurIPS 2020】广义神经网络中的知识蒸馏: 风险约束、数据效率和不完善的教师

专知会员服务

18+阅读 · 2020年11月11日

联邦学习安全与隐私保护研究综述

专知会员服务

127+阅读 · 2020年8月7日

【Hinton新论文】SimCLRv2来了！提出蒸馏新思路，可迁移至小模型，性能精度超越有监督

【Hinton新论文】SimCLRv2来了！提出蒸馏新思路，可迁移至小模型，性能精度超越有监督

专知会员服务

41+阅读 · 2020年7月21日

【ICML2020-南大周志华老师组】针对未见类未标记数据的安全深度半监督学习

【ICML2020-南大周志华老师组】针对未见类未标记数据的安全深度半监督学习

专知会员服务

42+阅读 · 2020年7月5日

【CVPR 2020-商汤】8比特数值也能训练卷积神经网络模型

【CVPR 2020-商汤】8比特数值也能训练卷积神经网络模型

专知会员服务

26+阅读 · 2020年5月7日

【微众银行】联邦学习白皮书_v2.0，48页pdf，

【微众银行】联邦学习白皮书_v2.0，48页pdf，

专知会员服务

170+阅读 · 2020年4月26日

【2020新书】如何构建数据团队？:设计集成的技能、需求和解决方案，257页pdf

【2020新书】如何构建数据团队？:设计集成的技能、需求和解决方案，257页pdf

专知会员服务

115+阅读 · 2020年3月11日

热门VIP内容

开通专知VIP会员享更多权益服务

《俄乌战争中的无人系统：新的战争方式与新兴趋势——来自前线的印象》报告

《海上自主水面船舶远程操作中心：安全可持续运行的多维度分析》

多模态大语言模型下游调优中“保持自我”的重要性

隐身自主无人水下航行器技术如何变革水下作战并重塑海军竞争

相关资讯

联邦学习安全与隐私保护研究综述

联邦学习安全与隐私保护研究综述

专知

12+阅读 · 2020年8月7日

【ICML2020-南大周志华老师组】针对未见类未标记数据的安全深度半监督学习

【ICML2020-南大周志华老师组】针对未见类未标记数据的安全深度半监督学习

专知

46+阅读 · 2020年7月5日

如何训练和部署FP16/Int8等低精度机器学习模型?

如何训练和部署FP16/Int8等低精度机器学习模型?

专知

7+阅读 · 2019年10月3日

重磅开源！ ICCV 2019，华为诺亚提出无需数据网络压缩技术

重磅开源！ ICCV 2019，华为诺亚提出无需数据网络压缩技术

新智元

5+阅读 · 2019年9月7日

【最新综述】模型压缩与加速（附论文全文下载）

【最新综述】模型压缩与加速（附论文全文下载）

专知

28+阅读 · 2019年2月14日

周志华与「深度森林」

周志华与「深度森林」

网易智能菌

7+阅读 · 2018年8月2日

陈天奇团队推出开源AI芯片栈VTA，降低芯片设计门槛

陈天奇团队推出开源AI芯片栈VTA，降低芯片设计门槛

AI前线

15+阅读 · 2018年7月13日

Spark团队开源新作：全流程机器学习平台MLflow

Spark团队开源新作：全流程机器学习平台MLflow

AI前线

10+阅读 · 2018年6月6日

开源项目VNect使用普通手机摄像头进行动作捕捉，媲美深度摄像头

开源项目VNect使用普通手机摄像头进行动作捕捉，媲美深度摄像头

AR酱

9+阅读 · 2018年5月12日

IBM全新机器学习库SnapML：训练提速46倍，40亿样本仅需91.5秒

IBM全新机器学习库SnapML：训练提速46倍，40亿样本仅需91.5秒

AI前线

3+阅读 · 2018年3月23日

相关论文

Open Domain Generalization with Domain-Augmented Meta-Learning

Arxiv

21+阅读 · 2021年4月8日

FocalMix: Semi-Supervised Learning for 3D Medical Image Detection

FocalMix: Semi-Supervised Learning for 3D Medical Image Detection

Arxiv

10+阅读 · 2020年3月20日

Few-shot Adaptive Faster R-CNN

Few-shot Adaptive Faster R-CNN

Arxiv

3+阅读 · 2019年3月22日

Span Based Open Information Extraction

Arxiv

3+阅读 · 2019年3月1日

Stereo R-CNN based 3D Object Detection for Autonomous Driving

Stereo R-CNN based 3D Object Detection for Autonomous Driving

Arxiv

5+阅读 · 2019年2月26日

Learning a Deep ConvNet for Multi-label Classification with Partial Labels

Learning a Deep ConvNet for Multi-label Classification with Partial Labels

Arxiv

6+阅读 · 2019年2月26日

MLtuner: System Support for Automatic Machine Learning Tuning

Arxiv

3+阅读 · 2018年3月20日

Arxiv

7+阅读 · 2018年1月24日

EnKCF: Ensemble of Kernelized Correlation Filters for High-Speed Object Tracking

Arxiv

6+阅读 · 2018年1月20日

SSD: Single Shot MultiBox Detector

Arxiv

5+阅读 · 2016年12月29日

大家都在搜

朱克爱德华兹家族

大型语言模型

冷启动，0预算，如何借助分销裂变引爆私域用户增长？

微信扫码咨询专知VIP会员