步长的选择:你走的距离长短,越短当然不会错过,但是耗时间。步长的选择比较麻烦。步长越小,越容易得到局部最优化(到了比较大的山谷,就出不去了),而大了会全局最优
重要性:学习率>正则值>dropout
学习率:0.001,0.01,0.1,1,10 …….以10为阶数尝试
小数据集上合适的参数大数据集上一般不会差,可以先减少训练类别。
转自:大数据挖掘DT数据分析
完整内容请点击“阅读原文”