Hyperparameter optimization (HPO) is a fundamental problem in automatic machine learning (AutoML). However, due to the expensive evaluation cost of models (e.g., training deep learning models or training models on large datasets), vanilla Bayesian optimization (BO) is typically computationally infeasible. To alleviate this issue, Hyperband (HB) utilizes the early stopping mechanism to speed up configuration evaluations by terminating those badly-performing configurations in advance. This leads to two kinds of quality measurements: (1) many low-fidelity measurements for configurations that get early-stopped, and (2) few high-fidelity measurements for configurations that are evaluated without being early stopped. The state-of-the-art HB-style method, BOHB, aims to combine the benefits of both BO and HB. Instead of sampling configurations randomly in HB, BOHB samples configurations based on a BO surrogate model, which is constructed with the high-fidelity measurements only. However, the scarcity of high-fidelity measurements greatly hampers the efficiency of BO to guide the configuration search. In this paper, we present MFES-HB, an efficient Hyperband method that is capable of utilizing both the high-fidelity and low-fidelity measurements to accelerate the convergence of HPO tasks. Designing MFES-HB is not trivial as the low-fidelity measurements can be biased yet informative to guide the configuration search. Thus we propose to build a Multi- Fidelity Ensemble Surrogate (MFES) based on the generalized Product of Experts framework, which can integrate useful information from multi-fidelity measurements effectively. The empirical studies on the real-world AutoML tasks demonstrate that MFES-HB can achieve 3.3-8.9x speedups over the state-of-the-art approach - BOHB.


翻译:超光速优化(HPO)是自动机器学习(Automal)的一个根本问题。然而,由于模型评估成本昂贵(例如,在大型数据集上培训深学习模型或培训模型),香草巴耶斯优化(BO)通常是计算不可行的。为了缓解这一问题,超频(HB)利用早期停止机制加快配置评价速度,提前终止这些不良的配置。这导致两种质量测量:(1)对早期停止的配置进行许多低度直径测量,以及(2)对未经早期停止评估的配置进行很少高度度测量(例如,在大型数据集上培训深度学习模型或培训模型),香草巴耶斯优化(BOB)通常是在计算价格时,先是利用早于高度配置的配置配置配置,然后是快速度测量。我们目前快速的硬度测量(HFIFO-FM-FM-FD-FD-S-FD-FI-FD-S-FI-S-S-IFI-I-IF-IF-IFIFT-IFIL)的快速测试,这是目前高频-SMFIFIFIFIFI-I-IL-S-I-IF-IL-IL-IFD-IL-IL-IF-S-IFD-IFT-S-S-S-I-ID-IFT-S-I-I-IF-IFT-S-S-IFT-S-IFT-IFT-IFT-IFT-IT-IFT-IFT-IT-IFT-IT-IT-IT-IT-IT-IT-IT-IT-IT-IT-T-IT-I-IT-IT-IT-T-T-T-T-IFT-IFT-T-I-I-I-I-I-I-I-I-I-I-I-I-I-I-I-IT-IT-IT-I-IT-IFT-IFT-IFT-I-I-I-I-I-I

0
下载
关闭预览

相关内容

《计算机信息》杂志发表高质量的论文,扩大了运筹学和计算的范围,寻求有关理论、方法、实验、系统和应用方面的原创研究论文、新颖的调查和教程论文,以及描述新的和有用的软件工具的论文。官网链接:https://pubsonline.informs.org/journal/ijoc
专知会员服务
21+阅读 · 2021年9月23日
专知会员服务
42+阅读 · 2021年7月1日
专知会员服务
14+阅读 · 2021年5月21日
【AAAI2021】“可瘦身”的生成式对抗网络
专知会员服务
12+阅读 · 2020年12月12日
Hierarchically Structured Meta-learning
CreateAMind
26+阅读 · 2019年5月22日
Transferring Knowledge across Learning Processes
CreateAMind
27+阅读 · 2019年5月18日
RL 真经
CreateAMind
5+阅读 · 2018年12月28日
【学习】Hierarchical Softmax
机器学习研究会
4+阅读 · 2017年8月6日
Auto-Encoding GAN
CreateAMind
7+阅读 · 2017年8月4日
已删除
将门创投
6+阅读 · 2017年7月6日
The Measure of Intelligence
Arxiv
6+阅读 · 2019年11月5日
VIP会员
相关资讯
Hierarchically Structured Meta-learning
CreateAMind
26+阅读 · 2019年5月22日
Transferring Knowledge across Learning Processes
CreateAMind
27+阅读 · 2019年5月18日
RL 真经
CreateAMind
5+阅读 · 2018年12月28日
【学习】Hierarchical Softmax
机器学习研究会
4+阅读 · 2017年8月6日
Auto-Encoding GAN
CreateAMind
7+阅读 · 2017年8月4日
已删除
将门创投
6+阅读 · 2017年7月6日
Top
微信扫码咨询专知VIP会员