以知识蒸馏为手段的多信仰神经结构搜索 (Multi-fidelity Neural Architecture Search with Knowledge Distillation) - 专知论文

会员服务 ·

0

蒸馏 · 轮 · 损失函数（机器学习） · Networking · 对率损失 ·

2021 年 5 月 19 日

Multi-fidelity Neural Architecture Search with Knowledge Distillation

翻译：以知识蒸馏为手段的多信仰神经结构搜索

Ilya Trofimov,Nikita Klyuchnikov,Mikhail Salnikov,Alexander Filippov,Evgeny Burnaev

Neural architecture search (NAS) targets at finding the optimal architecture of a neural network for a problem or a family of problems. Evaluations of neural architectures are very time-consuming. One of the possible ways to mitigate this issue is to use low-fidelity evaluations, namely training on a part of a dataset, fewer epochs, with fewer channels, etc. In this paper, we propose a bayesian multi-fidelity method for neural architecture search: MF-KD. The method relies on a new approach to low-fidelity evaluations of neural architectures by training for a few epochs using a knowledge distillation. Knowledge distillation adds to a loss function a term forcing a network to mimic some teacher network. We carry out experiments on CIFAR-10, CIFAR-100, and ImageNet-16-120. We show that training for a few epochs with such a modified loss function leads to a better selection of neural architectures than training for a few epochs with a logistic loss. The proposed method outperforms several state-of-the-art baselines.

翻译：神经结构搜索(NAS)的目标是找到神经网络针对问题或问题家庭的最佳结构。神经结构评估非常耗时。缓解这一问题的一个可能的方法是使用低信仰评估,即对数据集进行部分培训,较少的时代,较少的渠道等等。在本文中,我们建议对神经结构搜索采用海湾多信仰方法:MF-KD。该方法依靠一种新的方法,对神经结构进行低信仰评估,通过培训,利用知识蒸馏来培训几个时代的神经结构。知识蒸馏增加了一个“损失”功能,迫使一个网络模拟某些教师网络。我们在CIFAR-10、CIFAR-100和图像网络-16-120上进行了实验。我们表明,对几个具有这种修改的损失功能的教会的培训比对几个有物流损失的时代的培训更能选择神经结构。拟议的方法超越了几个州级基准。

0

相关内容

最新《图神经网络知识图谱补全综述论文》A Survey on Graph Neural Networks for Knowledge Graph Completion

最新《图神经网络知识图谱补全综述论文》A Survey on Graph Neural Networks for Knowledge Graph Completion

专知会员服务

137+阅读 · 2020年7月29日

神经网络序列数据建模，229页ppt，Modeling Sequential Data with Neural Nets

神经网络序列数据建模，229页ppt，Modeling Sequential Data with Neural Nets

专知会员服务

67+阅读 · 2020年7月25日

【知识图谱@ACL2020】Knowledge Graphs in Natural Language Processing

【知识图谱@ACL2020】Knowledge Graphs in Natural Language Processing

专知会员服务

66+阅读 · 2020年7月12日

【清华大学】图随机神经网络，Graph Random Neural Networks

【清华大学】图随机神经网络，Graph Random Neural Networks

专知会员服务

156+阅读 · 2020年5月26日

【知识图谱嵌入补全综述论文】embedding models for knowledge base completion

【知识图谱嵌入补全综述论文】embedding models for knowledge base completion

专知会员服务

102+阅读 · 2020年4月25日

50+篇《神经架构搜索NAS》2020论文合集

专知会员服务

61+阅读 · 2020年3月19日

图像分类技巧集，17页ppt《Bag of Tricks for Image Classification》

图像分类技巧集，17页ppt《Bag of Tricks for Image Classification》

专知会员服务

95+阅读 · 2020年3月12日

【论文|知识图谱】小样本知识图谱补全，Few-Shot Knowledge Graph Completion

【论文|知识图谱】小样本知识图谱补全，Few-Shot Knowledge Graph Completion

专知会员服务

121+阅读 · 2019年11月30日

【Google】神经架构搜索（Neural Architecture Search and Beyond），Barret Zoph

【Google】神经架构搜索（Neural Architecture Search and Beyond），Barret Zoph

专知会员服务

31+阅读 · 2019年11月25日

Auto-Sizing the Transformer Network: Improving Speed, Efficiency, and Performance for Low-Resource Machine Translation

Auto-Sizing the Transformer Network: Improving Speed, Efficiency, and Performance for Low-Resource Machine Translation

专知会员服务

49+阅读 · 2019年10月17日

Transferring Knowledge across Learning Processes

Transferring Knowledge across Learning Processes

CreateAMind

29+阅读 · 2019年5月18日

已删除

将门创投

10+阅读 · 2018年5月2日

Mutually-aware Sub-Graphs Differentiable Architecture Search

Mutually-aware Sub-Graphs Differentiable Architecture Search

Arxiv

0+阅读 · 2021年7月9日

Bag of Tricks for Neural Architecture Search

Arxiv

0+阅读 · 2021年7月8日

AdaXpert: Adapting Neural Architecture for Growing Data

Arxiv

4+阅读 · 2021年7月1日

Contrastive Neural Architecture Search with Neural Architecture Comparators

Arxiv

4+阅读 · 2021年4月6日

Neural Architecture Search with Random Labels

Arxiv

8+阅读 · 2021年1月28日

Neural Architecture Generator Optimization

Arxiv

6+阅读 · 2020年10月8日

Kernel Based Progressive Distillation for Adder Neural Networks

Arxiv

5+阅读 · 2020年9月29日

Few-shot Neural Architecture Search

Arxiv

8+阅读 · 2020年6月15日

Neural Architecture Optimization

Neural Architecture Optimization

Arxiv

8+阅读 · 2018年9月5日

MnasNet: Platform-Aware Neural Architecture Search for Mobile

Arxiv

4+阅读 · 2018年7月31日

VIP会员

文章信息

相关主题

损失函数（机器学习）

相关VIP内容

最新《图神经网络知识图谱补全综述论文》A Survey on Graph Neural Networks for Knowledge Graph Completion

最新《图神经网络知识图谱补全综述论文》A Survey on Graph Neural Networks for Knowledge Graph Completion

专知会员服务

137+阅读 · 2020年7月29日

神经网络序列数据建模，229页ppt，Modeling Sequential Data with Neural Nets

神经网络序列数据建模，229页ppt，Modeling Sequential Data with Neural Nets

专知会员服务

67+阅读 · 2020年7月25日

【知识图谱@ACL2020】Knowledge Graphs in Natural Language Processing

【知识图谱@ACL2020】Knowledge Graphs in Natural Language Processing

专知会员服务

66+阅读 · 2020年7月12日

【清华大学】图随机神经网络，Graph Random Neural Networks

【清华大学】图随机神经网络，Graph Random Neural Networks

专知会员服务

156+阅读 · 2020年5月26日

【知识图谱嵌入补全综述论文】embedding models for knowledge base completion

【知识图谱嵌入补全综述论文】embedding models for knowledge base completion

专知会员服务

102+阅读 · 2020年4月25日

50+篇《神经架构搜索NAS》2020论文合集

专知会员服务

61+阅读 · 2020年3月19日

图像分类技巧集，17页ppt《Bag of Tricks for Image Classification》

图像分类技巧集，17页ppt《Bag of Tricks for Image Classification》

专知会员服务

95+阅读 · 2020年3月12日

【论文|知识图谱】小样本知识图谱补全，Few-Shot Knowledge Graph Completion

【论文|知识图谱】小样本知识图谱补全，Few-Shot Knowledge Graph Completion

专知会员服务

121+阅读 · 2019年11月30日

【Google】神经架构搜索（Neural Architecture Search and Beyond），Barret Zoph

【Google】神经架构搜索（Neural Architecture Search and Beyond），Barret Zoph

专知会员服务

31+阅读 · 2019年11月25日

Auto-Sizing the Transformer Network: Improving Speed, Efficiency, and Performance for Low-Resource Machine Translation

Auto-Sizing the Transformer Network: Improving Speed, Efficiency, and Performance for Low-Resource Machine Translation

专知会员服务

49+阅读 · 2019年10月17日

热门VIP内容

开通专知VIP会员享更多权益服务

《动态作战支援演习框架构建》80页

《大规模作战行动中自动化战场创伤系统的概念验证》

《自适应训练辅助系统概念导论及其在空战指挥官加速培训中的应用》125页

《美陆军近战整合企业现代化计划（2025—2026）》最新报告

相关资讯

Transferring Knowledge across Learning Processes

Transferring Knowledge across Learning Processes

CreateAMind

29+阅读 · 2019年5月18日

已删除

将门创投

10+阅读 · 2018年5月2日

相关论文

Mutually-aware Sub-Graphs Differentiable Architecture Search

Mutually-aware Sub-Graphs Differentiable Architecture Search

Arxiv

0+阅读 · 2021年7月9日

Bag of Tricks for Neural Architecture Search

Arxiv

0+阅读 · 2021年7月8日

AdaXpert: Adapting Neural Architecture for Growing Data

Arxiv

4+阅读 · 2021年7月1日

Contrastive Neural Architecture Search with Neural Architecture Comparators

Arxiv

4+阅读 · 2021年4月6日

Neural Architecture Search with Random Labels

Arxiv

8+阅读 · 2021年1月28日

Neural Architecture Generator Optimization

Arxiv

6+阅读 · 2020年10月8日

Kernel Based Progressive Distillation for Adder Neural Networks

Arxiv

5+阅读 · 2020年9月29日

Few-shot Neural Architecture Search

Arxiv

8+阅读 · 2020年6月15日

Neural Architecture Optimization

Neural Architecture Optimization

Arxiv

8+阅读 · 2018年9月5日

MnasNet: Platform-Aware Neural Architecture Search for Mobile

Arxiv

4+阅读 · 2018年7月31日

微信扫码咨询专知VIP会员