极市导读
近年来有关NAS的优秀的工作层出不穷,分别从不同的角度来提升NAS算法。为了让初学者更好的进行NAS相关的研究,本文从其产生的背景到未来的发展方向,全面而系统的综述了NAS的挑战和解决方案。>>加入极市CV技术交流群,走在计算机视觉的最前沿
NAS是什么?由什么组成?常用算法是什么?
Add操作要比concate操作更加有效。
宽而浅的单元(采用channel个数多,但层数不多)在训练过程中更容易收敛,但是缺点是泛化性能很差。
能根据网络前几个epoch的表现就确定这个网络是否能够取得更高性能的预测器(性能预测)。
根据候选网络结构的表示就可以预测这个模型未来的表现(性能预测)。
分类的backbone和其他任务比如检测是存在一定gap的,最好的方式并不一定是微调,而可能是改变网络架构。
“ 注记:跳转连接往往可以采用多种方式进行特征融合,常见的有add, concate等。作者在文中提到了实验证明,add操作要比concate操作更加有效(原文:the sum operation is better than the merge operation)所以在NAS中,通常采用Add的方法进行特征融合操作。
“ 注记:通过研究这些搜索得到的单元模块,可以得到以下他们的共性:由于现存的连接模式, 宽而浅的单元(采用channel个数多,但层数不多)在训练过程中更容易 收敛,并且更容易搜索,但是缺点是 泛化性能很差。
“ps: 分类backbone和其他任务是有一定gap的,FNA认为通过微调神经网络带来的收益不如调整网络结构带来的收益)
推荐阅读