【五分钟学AI】模型融合model ensemble - 专知

会员服务 ·

0

【五分钟学AI】模型融合model ensemble

2017 年 10 月 26 日 七月在线实验室

简单讲是通过对一组独立的单模型(基模型)以某种方式进行组合，以提升整体性能（如稳定性，准确度等指标）的方法。不必过分迷信模型融合，因为在影响结果的因素中，数据≥特征≥模型≥模型（优化，tricks，融合等）。

如果使用一组同质的模型，（如tree base model），称为base learner模型融合；如果使用一组异质的模型，则称为component learner模型融合

01

模型融合有什么用？

通常在数据科学竞争中（如某智慧交通大赛），能取得好名次的小伙伴们，他们通常不仅仅采用一个模型，而是使用模型融合帮助其成绩逼近上限，模型融合还能提升结果的整体稳定性（避免过拟合，提升泛化能力，趋向于通用模型，）。

02

为什么模型整合比单个模型效果好？

统计上看：不同模型的h的均值更接近真实假设f

计算上看：从多个局部最优解的均值更接近全局最优解

表现上看：真实假设f可能不在已知的假设空间中，更可能多个h外的均值附近

03

常用的模型融合：

Xgboost：

DMLC提供的大杀器，性能优越，表现稳定，几乎垄断了Kaggle比赛的Top榜单。

lightGBM：

微软开源提供，性能略快于Xgboost，可以直接处理字符型的类别变量列，不需要额外变换。

04

模型整合的三种方式：

bagging：(集体智慧)

将训练集自动抽样，产生出构建子模型所需要的子训练集，再进行综合打分得到的结果。典型应用是随机森林。

stacking：（站在巨人的肩膀上，层叠式递进)

有点类似于公司信息汇报，底层提交报告给中层，中层再提交报告，Stacking先用第一层生成决策结果，以多层模型对模式进行识别，在下一层做汇总再提交给下一层进行处理，并最终得出结果。典型应用：神经网络（多层对图像进行挖掘和汇总）。

boosting：（一万小时定律）

一个弱的分类器，通过不断去学习，直到能够通过一系列的基模型去优成一个强大的模型。典型应用为XGBOOST。

免费领课程

即日起至10.29日，打开【python数据分析集训营】链接： http://www.julyedu.com/weekend/python （点击文末“阅读原文”），点击右上角，分享到朋友圈（屏蔽分组无效）并集齐7个赞，即可找微信客服：julyedukefu01，免费领取【python数据分析升级版】课程！

转发形式如下(需要出现课程名)：

课程咨询｜微信：julyedukefu01

七月热线：010-82712840

登录查看更多

4

相关内容

模型融合

【牛津大学&DeepMind】自监督学习教程，141页ppt

【牛津大学&DeepMind】自监督学习教程，141页ppt

专知会员服务

181+阅读 · 2020年5月29日

知识图谱嵌入模型的概率标定,Probability Calibration for Knowledge Graph Embedding Models

专知会员服务

36+阅读 · 2020年5月11日

【Google】利用AUTOML实现加速感知神经网络设计

【Google】利用AUTOML实现加速感知神经网络设计

专知会员服务

30+阅读 · 2020年3月5日

【跨语言BERT模型大集合】Transfer learning is increasingly going multilingual with language-specific BERT models

专知会员服务

54+阅读 · 2020年1月30日

【微软研究院】IMAGEBERT: CROSS-MODAL PRE-TRAINING WITH LARGE-SCALE WEAK-SUPERVISED IMAGE-TEXT DATA

【微软研究院】IMAGEBERT: CROSS-MODAL PRE-TRAINING WITH LARGE-SCALE WEAK-SUPERVISED IMAGE-TEXT DATA

专知会员服务

43+阅读 · 2020年1月28日

【Python最佳实践、技巧与提示30则】《30 Python Best Practices, Tips, And Tricks》by Erik-Jan van Baaren

【Python最佳实践、技巧与提示30则】《30 Python Best Practices, Tips, And Tricks》by Erik-Jan van Baaren

专知会员服务

35+阅读 · 2020年1月6日

【强化学习】深度强化学习初学者指南

【强化学习】深度强化学习初学者指南

专知会员服务

182+阅读 · 2019年12月14日

【ICCV 2019 Workshop】Adaptive Confidence Smoothing for Generalized Zero-Shot Learning，巴伊兰大学 Yuval Atzmon

【ICCV 2019 Workshop】Adaptive Confidence Smoothing for Generalized Zero-Shot Learning，巴伊兰大学 Yuval Atzmon

专知会员服务

13+阅读 · 2019年10月31日

【用十亿级半监督学习实现最先进图像与视频分类】《Billion-scale semi-supervised learning for state-of-the-art image and video classification | Facebook》

【用十亿级半监督学习实现最先进图像与视频分类】《Billion-scale semi-supervised learning for state-of-the-art image and video classification | Facebook》

专知会员服务

16+阅读 · 2019年10月21日

ExBert — 可视化分析Transformer学到的表示

ExBert — 可视化分析Transformer学到的表示

专知会员服务

32+阅读 · 2019年10月16日

基于知识蒸馏的BERT模型压缩

基于知识蒸馏的BERT模型压缩

大数据文摘

18+阅读 · 2019年10月14日

常用的模型集成方法介绍：bagging、boosting 、stacking

常用的模型集成方法介绍：bagging、boosting 、stacking

机器之心

14+阅读 · 2019年5月15日

【泡泡一分钟】机器人顶级会议精华提炼（20190311-20190317）

【泡泡一分钟】机器人顶级会议精华提炼（20190311-20190317）

泡泡机器人SLAM

6+阅读 · 2019年3月17日

推荐 | 掌握这12条经验，对理解机器学习至关重要！（可下载PDF）

推荐 | 掌握这12条经验，对理解机器学习至关重要！（可下载PDF）

机器学习算法与Python学习

11+阅读 · 2018年6月29日

推荐｜一份不错的机器学习笔记！

推荐｜一份不错的机器学习笔记！

全球人工智能

22+阅读 · 2017年11月20日

公开课 | 解读Alphago Zero背后的算法

公开课 | 解读Alphago Zero背后的算法

七月在线实验室

4+阅读 · 2017年10月27日

三大特征选择策略，有效提升你的机器学习水准

三大特征选择策略，有效提升你的机器学习水准

深度学习世界

8+阅读 · 2017年10月24日

机器学习(17)之集成学习原理总结

机器学习(17)之集成学习原理总结

机器学习算法与Python学习

19+阅读 · 2017年9月16日

从Boosting到Stacking，概览集成学习的方法与性能

从Boosting到Stacking，概览集成学习的方法与性能

MOOC

5+阅读 · 2017年9月4日

深度 | 从Boosting到Stacking，概览集成学习的方法与性能

深度 | 从Boosting到Stacking，概览集成学习的方法与性能

深度学习世界

3+阅读 · 2017年8月28日

Evaluating Multimodal Representations on Visual Semantic Textual Similarity

Evaluating Multimodal Representations on Visual Semantic Textual Similarity

Arxiv

6+阅读 · 2020年4月4日

K-BERT: Enabling Language Representation with Knowledge Graph

K-BERT: Enabling Language Representation with Knowledge Graph

Arxiv

19+阅读 · 2019年9月17日

Investigating Meta-Learning Algorithms for Low-Resource Natural Language Understanding Tasks

Arxiv

5+阅读 · 2019年8月27日

dynnode2vec: Scalable Dynamic Network Embedding

dynnode2vec: Scalable Dynamic Network Embedding

Arxiv

14+阅读 · 2018年12月6日

Approaches for Enriching and Improving Textual Knowledge Bases

Arxiv

15+阅读 · 2018年4月20日

Fooling Vision and Language Models Despite Localization and Attention Mechanism

Arxiv

7+阅读 · 2018年4月6日

Scalable Generalized Dynamic Topic Models

Arxiv

7+阅读 · 2018年3月21日

An overview of embedding models of entities and relationships for knowledge base completion

Arxiv

5+阅读 · 2018年2月3日

Fast Linear Model for Knowledge Graph Embeddings

Arxiv

4+阅读 · 2017年10月30日

LA-LDA: A Limited Attention Topic Model for Social Recommendation

Arxiv

3+阅读 · 2013年1月26日

VIP会员

相关主题

组件学习器

相关VIP内容

【牛津大学&DeepMind】自监督学习教程，141页ppt

【牛津大学&DeepMind】自监督学习教程，141页ppt

专知会员服务

181+阅读 · 2020年5月29日

知识图谱嵌入模型的概率标定,Probability Calibration for Knowledge Graph Embedding Models

专知会员服务

36+阅读 · 2020年5月11日

【Google】利用AUTOML实现加速感知神经网络设计

【Google】利用AUTOML实现加速感知神经网络设计

专知会员服务

30+阅读 · 2020年3月5日

【跨语言BERT模型大集合】Transfer learning is increasingly going multilingual with language-specific BERT models

专知会员服务

54+阅读 · 2020年1月30日

【微软研究院】IMAGEBERT: CROSS-MODAL PRE-TRAINING WITH LARGE-SCALE WEAK-SUPERVISED IMAGE-TEXT DATA

【微软研究院】IMAGEBERT: CROSS-MODAL PRE-TRAINING WITH LARGE-SCALE WEAK-SUPERVISED IMAGE-TEXT DATA

专知会员服务

43+阅读 · 2020年1月28日

【Python最佳实践、技巧与提示30则】《30 Python Best Practices, Tips, And Tricks》by Erik-Jan van Baaren

【Python最佳实践、技巧与提示30则】《30 Python Best Practices, Tips, And Tricks》by Erik-Jan van Baaren

专知会员服务

35+阅读 · 2020年1月6日

【强化学习】深度强化学习初学者指南

【强化学习】深度强化学习初学者指南

专知会员服务

182+阅读 · 2019年12月14日

【ICCV 2019 Workshop】Adaptive Confidence Smoothing for Generalized Zero-Shot Learning，巴伊兰大学 Yuval Atzmon

【ICCV 2019 Workshop】Adaptive Confidence Smoothing for Generalized Zero-Shot Learning，巴伊兰大学 Yuval Atzmon

专知会员服务

13+阅读 · 2019年10月31日

【用十亿级半监督学习实现最先进图像与视频分类】《Billion-scale semi-supervised learning for state-of-the-art image and video classification | Facebook》

【用十亿级半监督学习实现最先进图像与视频分类】《Billion-scale semi-supervised learning for state-of-the-art image and video classification | Facebook》

专知会员服务

16+阅读 · 2019年10月21日

ExBert — 可视化分析Transformer学到的表示

ExBert — 可视化分析Transformer学到的表示

专知会员服务

32+阅读 · 2019年10月16日

热门VIP内容

开通专知VIP会员享更多权益服务

从社会学实验到行为仿真：理解基于Agent的观点动力学建模思维

中英文版《GPT-5 System Card速览》报告

ACL 2025 | 大模型结构化知识提示的泛化能力研究

【普林斯顿博士论文】大型模型的高效推理

相关资讯

基于知识蒸馏的BERT模型压缩

基于知识蒸馏的BERT模型压缩

大数据文摘

18+阅读 · 2019年10月14日

常用的模型集成方法介绍：bagging、boosting 、stacking

常用的模型集成方法介绍：bagging、boosting 、stacking

机器之心

14+阅读 · 2019年5月15日

【泡泡一分钟】机器人顶级会议精华提炼（20190311-20190317）

【泡泡一分钟】机器人顶级会议精华提炼（20190311-20190317）

泡泡机器人SLAM

6+阅读 · 2019年3月17日

推荐 | 掌握这12条经验，对理解机器学习至关重要！（可下载PDF）

推荐 | 掌握这12条经验，对理解机器学习至关重要！（可下载PDF）

机器学习算法与Python学习

11+阅读 · 2018年6月29日

推荐｜一份不错的机器学习笔记！

推荐｜一份不错的机器学习笔记！

全球人工智能

22+阅读 · 2017年11月20日

公开课 | 解读Alphago Zero背后的算法

公开课 | 解读Alphago Zero背后的算法

七月在线实验室

4+阅读 · 2017年10月27日

三大特征选择策略，有效提升你的机器学习水准

三大特征选择策略，有效提升你的机器学习水准

深度学习世界

8+阅读 · 2017年10月24日

机器学习(17)之集成学习原理总结

机器学习(17)之集成学习原理总结

机器学习算法与Python学习

19+阅读 · 2017年9月16日

从Boosting到Stacking，概览集成学习的方法与性能

从Boosting到Stacking，概览集成学习的方法与性能

MOOC

5+阅读 · 2017年9月4日

深度 | 从Boosting到Stacking，概览集成学习的方法与性能

深度 | 从Boosting到Stacking，概览集成学习的方法与性能

深度学习世界

3+阅读 · 2017年8月28日

相关论文

Evaluating Multimodal Representations on Visual Semantic Textual Similarity

Evaluating Multimodal Representations on Visual Semantic Textual Similarity

Arxiv

6+阅读 · 2020年4月4日

K-BERT: Enabling Language Representation with Knowledge Graph

K-BERT: Enabling Language Representation with Knowledge Graph

Arxiv

19+阅读 · 2019年9月17日

Investigating Meta-Learning Algorithms for Low-Resource Natural Language Understanding Tasks

Arxiv

5+阅读 · 2019年8月27日

dynnode2vec: Scalable Dynamic Network Embedding

dynnode2vec: Scalable Dynamic Network Embedding

Arxiv

14+阅读 · 2018年12月6日

Approaches for Enriching and Improving Textual Knowledge Bases

Arxiv

15+阅读 · 2018年4月20日

Fooling Vision and Language Models Despite Localization and Attention Mechanism

Arxiv

7+阅读 · 2018年4月6日

Scalable Generalized Dynamic Topic Models

Arxiv

7+阅读 · 2018年3月21日

An overview of embedding models of entities and relationships for knowledge base completion

Arxiv

5+阅读 · 2018年2月3日

Fast Linear Model for Knowledge Graph Embeddings

Arxiv

4+阅读 · 2017年10月30日

LA-LDA: A Limited Attention Topic Model for Social Recommendation

Arxiv

3+阅读 · 2013年1月26日

大家都在搜

大型语言模型

软件无线电

久别重逢话双塔

OpenKG开源系列 | 海洋鱼类百科知识图谱（浙江大学）

微信扫码咨询专知VIP会员