成为VIP会员查看完整内容
VIP会员码认证
首页
主题
发现
会员
服务
注册
·
登录
0
召唤新一代超参调优开源新神器,集十大主流模块于一身
2020 年 1 月 24 日
CSDN
整理 | 凯隐
编辑 | Jane
来源 | AI科技大本营(ID:rgznai100)
Optuna是一款为机器学习任务设计的自动超参数优化软件框架,是一款按运行定义(define-by-run) 原则设计的优化软件,允许用户动态地调整搜索空间,在同类软件中尤属首创,是下一代超参调优框架的代表。接下来,带大家了解 Optuna——新一代超参调优框架。
超参调优简介
在训练神经网络时,模型结构尺度,例如深度,宽度,每层分辨率等,都会影响到模型的最终性能,从这些参数组合中找到最适合当前任务的参数,就是常说的超参调优。
传统的超参调优方法是经验性的手动调整参数,并记录实验结果,然后通过人工分析对比确定下一步的参数调整方向,这种方法吃力且效率低,还容易出错。Optuna的出现大大降低了超参调优的难度,下面让我们来看看Pptuna是如何工作的吧!
Optuna工作方式和特点
1、按运行定义
首先通过 pip 命令安装 Optuna:
以层数搜索为例,我们需要优化的是一个用于分类的多层感知器的层数以及每一层的神经元个数:
将运行代码(5-11行)重新嵌入到试验(trial)函数中,试验函数通过单次执行代码来得到一组参数组合下的结果:
然后添加一个关于层数的 for 循环:
以及每层中神经元个数的 for 循环:
最后定义一个 study 对象,将trial训练结果作为优化目标,便可以通过多次实验找出最优超参数组合,这里设置的实验次数(n_trials=100)是 100 次:
完成以上步骤,便可以运行程序,让optuna来自动完成搜索过程,因此 Optuan 是一个专门为自动化设计的框架。此外我们可以看到代码编写是非常简单的,且非常灵活,可以随时调整搜索空间和次数上限,这也体现了Optuna按运行定义的特点。
2、并行分布式计算
上面的例子中我们使用的只是一个很简单的示例网络,但大部分情况下网络和数据集都要比示例大得多,此时 Optuna 的另一个特点就体现出来了:
在上述代码中,我们将搜索过程做了并行化处理,这样实际运行时效果就如同下图:
并行化处理能大幅减低调优所需时间,从而加速优化过程。此外 Optuna 还具有剪枝优化功能,即提前结束并行化实验中的低质量参数实验,从而提高效率。
3、支持多类型任务和框架
Optuna 不仅可以用于实验调参,也可以轻松地部署到生产作业以及数据分析任务中:
Optuna 的环境依赖非常简单,并且能独立地完成任务:
此外,Optuna 还支持许多其他深度学习框架和模块,例如 Tensorflow,Keras,PyTorch,MXNet等。
使用 Optuna
Optuna可以通过 pip 或 conda 指令进行安装,目前支持 python3.5 以上的版本,更多相关资料详见官网,官方文档,以及 Github 主页。
相关阅读:
https://optuna.org/
https://optuna.readthedocs.io/en/stable/
https://github.com/optuna/optuna
你点的每个“在看”,我都认真当成了喜欢
登录查看更多
点赞并收藏
0
暂时没有读者
2
权益说明
本文档仅做收录索引使用,若发现您的权益受到侵害,请立即联系客服(微信: zhuanzhi02,邮箱:bd@zhuanzhi.ai),我们会尽快为您处理
相关内容
自动超参数优化
关注
1
【干货书】高级应用深度学习,294页pdf
专知会员服务
153+阅读 · 2020年6月20日
【2020新书】现代数据挖掘算法C++和CUDA,233页pdf,数据科学的特征提取和选择算法的最新发展
专知会员服务
73+阅读 · 2020年6月11日
紧凑的神经网络模型设计研究综述
专知会员服务
73+阅读 · 2020年5月21日
YOLOv4 重磅来袭!俄罗斯小哥带来新一代快速高效检测器
专知会员服务
31+阅读 · 2020年4月24日
【CVPR 2020 Oral-北大华为】只用加法的神经网络,重磅开源
专知会员服务
30+阅读 · 2020年4月6日
【2020新书】如何认真写好的代码和软件,318页pdf
专知会员服务
63+阅读 · 2020年3月26日
【电子书推荐】《深度学习之TensorFlow工程化项目实战》电子书以及配套代码及数据集资源,附787页pdf
专知会员服务
209+阅读 · 2019年12月15日
【电子书】C++ Primer Plus 第6版,附PDF
专知会员服务
87+阅读 · 2019年11月25日
【Google AI新论文EfficientDet】规模化高效化的物体检测,EfficientDet: Scalable and Efficient Object Detection(附pdf)
专知会员服务
26+阅读 · 2019年11月24日
自动机器学习:最新进展综述
专知会员服务
119+阅读 · 2019年10月13日
【CPS】CPS应用案例集
产业智能官
84+阅读 · 2019年8月9日
大家都收藏了的最新开源项目Top12!CV、NLP、机器学习一应俱全
AI100
7+阅读 · 2018年10月14日
干货 | 让算法解放算法工程师——NAS 综述
AI科技评论
4+阅读 · 2018年9月12日
干货——图像分类(下)
计算机视觉战队
14+阅读 · 2018年8月28日
开发、调试计算机视觉代码有哪些技巧?
AI研习社
3+阅读 · 2018年7月9日
深度学习开发必备开源框架
九章算法
12+阅读 · 2018年5月30日
【干货】使用Pytorch实现卷积神经网络
专知
13+阅读 · 2018年5月12日
Java 工程师转型 AI 的秘密法宝——深度学习框架 Deeplearning4j | 回顾
AI研习社
11+阅读 · 2017年12月16日
Gluon —— 微软和亚马逊联合推出深度学习库
开源中国
7+阅读 · 2017年10月24日
手把手教TensorFlow(附代码)
深度学习世界
15+阅读 · 2017年10月17日
Panoptic Feature Pyramid Networks
Arxiv
3+阅读 · 2019年1月8日
GAN Dissection: Visualizing and Understanding Generative Adversarial Networks
Arxiv
11+阅读 · 2018年12月8日
Rethinking ImageNet Pre-training
Arxiv
8+阅读 · 2018年11月21日
Interpretable Convolutional Neural Networks via Feedforward Design
Arxiv
4+阅读 · 2018年10月5日
Are Generative Classifiers More Robust to Adversarial Attacks?
Arxiv
4+阅读 · 2018年7月9日
Sequential Attacks on Agents for Long-Term Adversarial Goals
Arxiv
5+阅读 · 2018年7月5日
XNMT: The eXtensible Neural Machine Translation Toolkit
Arxiv
3+阅读 · 2018年3月1日
Generating Adversarial Examples with Adversarial Networks
Arxiv
10+阅读 · 2018年1月15日
Audio Adversarial Examples: Targeted Attacks on Speech-to-Text
Arxiv
18+阅读 · 2018年1月5日
Distance-based Self-Attention Network for Natural Language Inference
Arxiv
10+阅读 · 2017年12月6日
VIP会员
自助开通(推荐)
客服开通
详情
相关主题
自动超参数优化
超参数优化
超参数
软件
搜索
设计
相关VIP内容
【干货书】高级应用深度学习,294页pdf
专知会员服务
153+阅读 · 2020年6月20日
【2020新书】现代数据挖掘算法C++和CUDA,233页pdf,数据科学的特征提取和选择算法的最新发展
专知会员服务
73+阅读 · 2020年6月11日
紧凑的神经网络模型设计研究综述
专知会员服务
73+阅读 · 2020年5月21日
YOLOv4 重磅来袭!俄罗斯小哥带来新一代快速高效检测器
专知会员服务
31+阅读 · 2020年4月24日
【CVPR 2020 Oral-北大华为】只用加法的神经网络,重磅开源
专知会员服务
30+阅读 · 2020年4月6日
【2020新书】如何认真写好的代码和软件,318页pdf
专知会员服务
63+阅读 · 2020年3月26日
【电子书推荐】《深度学习之TensorFlow工程化项目实战》电子书以及配套代码及数据集资源,附787页pdf
专知会员服务
209+阅读 · 2019年12月15日
【电子书】C++ Primer Plus 第6版,附PDF
专知会员服务
87+阅读 · 2019年11月25日
【Google AI新论文EfficientDet】规模化高效化的物体检测,EfficientDet: Scalable and Efficient Object Detection(附pdf)
专知会员服务
26+阅读 · 2019年11月24日
自动机器学习:最新进展综述
专知会员服务
119+阅读 · 2019年10月13日
热门VIP内容
开通专知VIP会员 享更多权益服务
OpenAI十二天总结与Agent新范式
【伯克利博士论文】高效深度学习推理的全栈方法
【AAAI2025】多层次最优传输用于语言模型中的通用跨标记器知识蒸馏
大规模语言模型增强推荐系统:分类、趋势、应用与未来
相关资讯
【CPS】CPS应用案例集
产业智能官
84+阅读 · 2019年8月9日
大家都收藏了的最新开源项目Top12!CV、NLP、机器学习一应俱全
AI100
7+阅读 · 2018年10月14日
干货 | 让算法解放算法工程师——NAS 综述
AI科技评论
4+阅读 · 2018年9月12日
干货——图像分类(下)
计算机视觉战队
14+阅读 · 2018年8月28日
开发、调试计算机视觉代码有哪些技巧?
AI研习社
3+阅读 · 2018年7月9日
深度学习开发必备开源框架
九章算法
12+阅读 · 2018年5月30日
【干货】使用Pytorch实现卷积神经网络
专知
13+阅读 · 2018年5月12日
Java 工程师转型 AI 的秘密法宝——深度学习框架 Deeplearning4j | 回顾
AI研习社
11+阅读 · 2017年12月16日
Gluon —— 微软和亚马逊联合推出深度学习库
开源中国
7+阅读 · 2017年10月24日
手把手教TensorFlow(附代码)
深度学习世界
15+阅读 · 2017年10月17日
相关论文
Panoptic Feature Pyramid Networks
Arxiv
3+阅读 · 2019年1月8日
GAN Dissection: Visualizing and Understanding Generative Adversarial Networks
Arxiv
11+阅读 · 2018年12月8日
Rethinking ImageNet Pre-training
Arxiv
8+阅读 · 2018年11月21日
Interpretable Convolutional Neural Networks via Feedforward Design
Arxiv
4+阅读 · 2018年10月5日
Are Generative Classifiers More Robust to Adversarial Attacks?
Arxiv
4+阅读 · 2018年7月9日
Sequential Attacks on Agents for Long-Term Adversarial Goals
Arxiv
5+阅读 · 2018年7月5日
XNMT: The eXtensible Neural Machine Translation Toolkit
Arxiv
3+阅读 · 2018年3月1日
Generating Adversarial Examples with Adversarial Networks
Arxiv
10+阅读 · 2018年1月15日
Audio Adversarial Examples: Targeted Attacks on Speech-to-Text
Arxiv
18+阅读 · 2018年1月5日
Distance-based Self-Attention Network for Natural Language Inference
Arxiv
10+阅读 · 2017年12月6日
大家都在搜
自主可控
无人艇
大规模语言模型
CMU博士论文
俄乌战争
洛克菲勒
palantir
情感计算
笛卡尔
GANLab 将GA
Top
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top