软件分析仪的简单超参数优化:为什么、如何、何时? (Simpler Hyperparameter Optimization forSoftware Analytics: Why, How, When?) - 专知论文

会员服务 ·

0

超参数 · 优化器 · SimPLe · 情景 · WISE ·

2021 年 4 月 16 日

Simpler Hyperparameter Optimization forSoftware Analytics: Why, How, When?

翻译：软件分析仪的简单超参数优化:为什么、如何、何时?

Amritanshu Agrawal,Xueqi Yang,Rishabh Agrawal,Rahul Yedida,Xipeng Shen,Tim Menzies

from arxiv, 15 Pages, In Submission to TSE 2021

How can we make software analytics simpler and faster? One method is to match the complexity of analysis to the intrinsic complexity of the data being explored. For example, hyperparameter optimizers find the control settings for data miners that improve the predictions generated via software analytics. Sometimes, very fast hyperparameter optimization can be achieved by "DODGE-ing"; i.e. simply steering way from settings that lead to similar conclusions. But when is it wise to use that simple approach and when must we use more complex (and much slower) optimizers?} To answer this, we applied hyperparameter optimization to 120 SE data sets that explored bad smell detection, predicting Github issue close time, bug report analysis, defect prediction, and dozens of other non-SE problems. We find that the simple DODGE works best for data sets with low "intrinsic dimensionality" (u ~ 3) and very poorly for higher-dimensional data (u > 8). Nearly all the SE data seen here was intrinsically low-dimensional, indicating that DODGE is applicable for many SE analytics tasks.

翻译：如何使软件分析更简单、更快? 一种方法是将分析的复杂性与正在探索的数据的内在复杂性相匹配。例如,超参数优化器为数据矿工找到控制设置,从而改进通过软件分析产生的预测。有时,非常快速的超参数优化可以通过“DODGE-ing”实现; 也就是简单地从导致类似结论的设置中引向方向。但是,当使用这一简单方法明智时,当我们必须使用更复杂(和慢得多)的优化器时? }我们用超参数优化法对120个SE数据集进行了调查,这些数据集探索了坏气味检测,预测了Github的近距离、错误报告分析、缺陷预测以及数十个其他非SE问题。我们发现,简单的DDGE对低“内在维度”(u~ 3)和高维数据(u > 8)的数据集最有效。这里看到的所有SEEGE数据都是内在的低度,表明DGE适用于许多SE分析任务。

0

相关内容

超参数

在贝叶斯统计中，超参数是先验分布的参数；该术语用于将它们与所分析的基础系统的模型参数区分开。

2020数据工程师成长路线图

专知会员服务

19+阅读 · 2020年9月6日

Fariz Darari简明《博弈论Game Theory》介绍，35页ppt

Fariz Darari简明《博弈论Game Theory》介绍，35页ppt

专知会员服务

112+阅读 · 2020年5月15日

Python分布式计算，171页pdf，Distributed Computing with Python

Python分布式计算，171页pdf，Distributed Computing with Python

专知会员服务

108+阅读 · 2020年5月3日

【经典书】机器学习高斯过程，266页pdf

【经典书】机器学习高斯过程，266页pdf

专知会员服务

235+阅读 · 2020年5月2日

【2020新书】自然语言处理Python与spaCy实践，216页pdf，NLP with Python

【2020新书】自然语言处理Python与spaCy实践，216页pdf，NLP with Python

专知会员服务

108+阅读 · 2020年5月1日

图像分类技巧集，17页ppt《Bag of Tricks for Image Classification》

图像分类技巧集，17页ppt《Bag of Tricks for Image Classification》

专知会员服务

96+阅读 · 2020年3月12日

深度强化学习策略梯度教程，53页ppt

深度强化学习策略梯度教程，53页ppt

专知会员服务

184+阅读 · 2020年2月1日

Keras François Chollet 《Deep Learning with Python 》, 386页pdf

Keras François Chollet 《Deep Learning with Python 》, 386页pdf

专知会员服务

163+阅读 · 2019年10月12日

强化学习最新教程，17页pdf

强化学习最新教程，17页pdf

专知会员服务

182+阅读 · 2019年10月11日

机器学习入门的经验与建议

机器学习入门的经验与建议

专知会员服务

94+阅读 · 2019年10月10日

Unsupervised Learning via Meta-Learning

Unsupervised Learning via Meta-Learning

CreateAMind

43+阅读 · 2019年1月3日

meta learning 17年：MAML SNAIL

meta learning 17年：MAML SNAIL

CreateAMind

11+阅读 · 2019年1月2日

A Technical Overview of AI & ML in 2018 & Trends for 2019

A Technical Overview of AI & ML in 2018 & Trends for 2019

待字闺中

18+阅读 · 2018年12月24日

spinningup.openai 强化学习资源完整

spinningup.openai 强化学习资源完整

CreateAMind

6+阅读 · 2018年12月17日

分布式TensorFlow入门指南

分布式TensorFlow入门指南

机器学习研究会

4+阅读 · 2017年11月28日

【推荐】YOLO实时目标检测(6fps)

【推荐】YOLO实时目标检测(6fps)

机器学习研究会

20+阅读 · 2017年11月5日

【学习】(Python)SVM数据分类

【学习】(Python)SVM数据分类

机器学习研究会

6+阅读 · 2017年10月15日

【推荐】SVM实例教程

【推荐】SVM实例教程

机器学习研究会

17+阅读 · 2017年8月26日

【推荐】Python机器学习生态圈(Scikit-Learn相关项目)

【推荐】Python机器学习生态圈(Scikit-Learn相关项目)

机器学习研究会

6+阅读 · 2017年8月23日

【学习】Hierarchical Softmax

【学习】Hierarchical Softmax

机器学习研究会

4+阅读 · 2017年8月6日

Federated Hyperparameter Tuning: Challenges, Baselines, and Connections to Weight-Sharing

Federated Hyperparameter Tuning: Challenges, Baselines, and Connections to Weight-Sharing

Arxiv

0+阅读 · 2021年6月8日

Launchpad: A Programming Model for Distributed Machine Learning Research

Arxiv

0+阅读 · 2021年6月7日

Quantifying and Improving Transferability in Domain Generalization

Quantifying and Improving Transferability in Domain Generalization

Arxiv

0+阅读 · 2021年6月7日

Mirror Descent Policy Optimization

Arxiv

0+阅读 · 2021年6月7日

Generalized Parametric Path Problems

Arxiv

0+阅读 · 2021年6月7日

On the Theory of Reinforcement Learning with Once-per-Episode Feedback

Arxiv

0+阅读 · 2021年6月7日

What if we Increase the Number of Objectives? Theoretical and Empirical Implications for Many-objective Optimization

Arxiv

0+阅读 · 2021年6月6日

Hyperparameter Optimization Is Deceiving Us, and How to Stop It

Arxiv

0+阅读 · 2021年6月3日

Hyperparameter Selection for Imitation Learning

Arxiv

7+阅读 · 2021年5月25日

Meta-Learning with Implicit Gradients

Meta-Learning with Implicit Gradients

Arxiv

13+阅读 · 2019年9月10日

VIP会员

文章信息

相关主题

相关VIP内容

2020数据工程师成长路线图

专知会员服务

19+阅读 · 2020年9月6日

Fariz Darari简明《博弈论Game Theory》介绍，35页ppt

Fariz Darari简明《博弈论Game Theory》介绍，35页ppt

专知会员服务

112+阅读 · 2020年5月15日

Python分布式计算，171页pdf，Distributed Computing with Python

Python分布式计算，171页pdf，Distributed Computing with Python

专知会员服务

108+阅读 · 2020年5月3日

【经典书】机器学习高斯过程，266页pdf

【经典书】机器学习高斯过程，266页pdf

专知会员服务

235+阅读 · 2020年5月2日

【2020新书】自然语言处理Python与spaCy实践，216页pdf，NLP with Python

【2020新书】自然语言处理Python与spaCy实践，216页pdf，NLP with Python

专知会员服务

108+阅读 · 2020年5月1日

图像分类技巧集，17页ppt《Bag of Tricks for Image Classification》

图像分类技巧集，17页ppt《Bag of Tricks for Image Classification》

专知会员服务

96+阅读 · 2020年3月12日

深度强化学习策略梯度教程，53页ppt

深度强化学习策略梯度教程，53页ppt

专知会员服务

184+阅读 · 2020年2月1日

Keras François Chollet 《Deep Learning with Python 》, 386页pdf

Keras François Chollet 《Deep Learning with Python 》, 386页pdf

专知会员服务

163+阅读 · 2019年10月12日

强化学习最新教程，17页pdf

强化学习最新教程，17页pdf

专知会员服务

182+阅读 · 2019年10月11日

机器学习入门的经验与建议

机器学习入门的经验与建议

专知会员服务

94+阅读 · 2019年10月10日

热门VIP内容

开通专知VIP会员享更多权益服务

【博士论文】多目标奖励与偏好优化：理论与算法

《无形的防御者？将定向能武器集成到反无人机框架的机遇与挑战》报告

自主化海军：海上无人系统与未来海战

迈向智能体系统规模化的科学

相关资讯

Unsupervised Learning via Meta-Learning

Unsupervised Learning via Meta-Learning

CreateAMind

43+阅读 · 2019年1月3日

meta learning 17年：MAML SNAIL

meta learning 17年：MAML SNAIL

CreateAMind

11+阅读 · 2019年1月2日

A Technical Overview of AI & ML in 2018 & Trends for 2019

A Technical Overview of AI & ML in 2018 & Trends for 2019

待字闺中

18+阅读 · 2018年12月24日

spinningup.openai 强化学习资源完整

spinningup.openai 强化学习资源完整

CreateAMind

6+阅读 · 2018年12月17日

分布式TensorFlow入门指南

分布式TensorFlow入门指南

机器学习研究会

4+阅读 · 2017年11月28日

【推荐】YOLO实时目标检测(6fps)

【推荐】YOLO实时目标检测(6fps)

机器学习研究会

20+阅读 · 2017年11月5日

【学习】(Python)SVM数据分类

【学习】(Python)SVM数据分类

机器学习研究会

6+阅读 · 2017年10月15日

【推荐】SVM实例教程

【推荐】SVM实例教程

机器学习研究会

17+阅读 · 2017年8月26日

【推荐】Python机器学习生态圈(Scikit-Learn相关项目)

【推荐】Python机器学习生态圈(Scikit-Learn相关项目)

机器学习研究会

6+阅读 · 2017年8月23日

【学习】Hierarchical Softmax

【学习】Hierarchical Softmax

机器学习研究会

4+阅读 · 2017年8月6日

相关论文

Federated Hyperparameter Tuning: Challenges, Baselines, and Connections to Weight-Sharing

Federated Hyperparameter Tuning: Challenges, Baselines, and Connections to Weight-Sharing

Arxiv

0+阅读 · 2021年6月8日

Launchpad: A Programming Model for Distributed Machine Learning Research

Arxiv

0+阅读 · 2021年6月7日

Quantifying and Improving Transferability in Domain Generalization

Quantifying and Improving Transferability in Domain Generalization

Arxiv

0+阅读 · 2021年6月7日

Mirror Descent Policy Optimization

Arxiv

0+阅读 · 2021年6月7日

Generalized Parametric Path Problems

Arxiv

0+阅读 · 2021年6月7日

On the Theory of Reinforcement Learning with Once-per-Episode Feedback

Arxiv

0+阅读 · 2021年6月7日

What if we Increase the Number of Objectives? Theoretical and Empirical Implications for Many-objective Optimization

Arxiv

0+阅读 · 2021年6月6日

Hyperparameter Optimization Is Deceiving Us, and How to Stop It

Arxiv

0+阅读 · 2021年6月3日

Hyperparameter Selection for Imitation Learning

Arxiv

7+阅读 · 2021年5月25日

Meta-Learning with Implicit Gradients

Meta-Learning with Implicit Gradients

Arxiv

13+阅读 · 2019年9月10日

微信扫码咨询专知VIP会员