A multilayer perceptron (MLP) is typically made of multiple fully connected layers with nonlinear activation functions. There have been several approaches to make them better (e.g. faster convergence, better convergence limit, etc.). But the researches lack in more structured ways to test them. We test different MLP architectures by carrying out the experiments on the age and gender datasets. We empirically show that by whitening inputs before every linear layer and adding skip connections, our proposed MLP architecture can result in better performance. Since the whitening process includes dropouts, it can also be used to approximate Bayesian inference. We have open sourced our code released models and docker images at https://github.com/tae898/age-gender/.


翻译:多层透视器(MLP)通常由与非线性激活功能完全相连的多个层组成,有几种方法可以使其更好(例如更快的趋同、更好的趋同限制等),但研究缺乏更有条理的测试方法。我们通过在年龄和性别数据集上进行实验来测试不同的多层透视器结构。我们从经验上表明,通过在每个线性层之前进行输入白化和增加跳过连接,我们提议的MLP结构可以产生更好的性能。由于白化过程包括了辍学者,它也可以用来接近Bayesian的推断。我们已经在 https://github.com/tae898/age-gender/ 上打开了我们的代码发布模型和 docker 图像的来源。

0
下载
关闭预览

相关内容

专知会员服务
42+阅读 · 2021年4月2日
自然语言处理现代方法,176页pdf
专知会员服务
268+阅读 · 2021年2月22日
Python图像处理,366页pdf,Image Operators Image Processing in Python
【伯克利】再思考 Transformer中的Batch Normalization
专知会员服务
41+阅读 · 2020年3月21日
专知会员服务
61+阅读 · 2020年3月19日
【SIGGRAPH2019】TensorFlow 2.0深度学习计算机图形学应用
专知会员服务
41+阅读 · 2019年10月9日
使用 Keras Tuner 调节超参数
TensorFlow
15+阅读 · 2020年2月6日
深度卷积神经网络中的降采样
极市平台
12+阅读 · 2019年5月24日
Conditional Batch Normalization 详解
极市平台
4+阅读 · 2019年4月12日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
17+阅读 · 2018年12月24日
disentangled-representation-papers
CreateAMind
26+阅读 · 2018年9月12日
条件GAN重大改进!cGANs with Projection Discriminator
CreateAMind
8+阅读 · 2018年2月7日
Adversarial Variational Bayes: Unifying VAE and GAN 代码
CreateAMind
7+阅读 · 2017年10月4日
【学习】Hierarchical Softmax
机器学习研究会
4+阅读 · 2017年8月6日
Arxiv
13+阅读 · 2021年6月14日
Arxiv
6+阅读 · 2020年10月8日
Arxiv
3+阅读 · 2018年10月25日
Arxiv
5+阅读 · 2017年9月8日
VIP会员
相关VIP内容
相关资讯
使用 Keras Tuner 调节超参数
TensorFlow
15+阅读 · 2020年2月6日
深度卷积神经网络中的降采样
极市平台
12+阅读 · 2019年5月24日
Conditional Batch Normalization 详解
极市平台
4+阅读 · 2019年4月12日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
17+阅读 · 2018年12月24日
disentangled-representation-papers
CreateAMind
26+阅读 · 2018年9月12日
条件GAN重大改进!cGANs with Projection Discriminator
CreateAMind
8+阅读 · 2018年2月7日
Adversarial Variational Bayes: Unifying VAE and GAN 代码
CreateAMind
7+阅读 · 2017年10月4日
【学习】Hierarchical Softmax
机器学习研究会
4+阅读 · 2017年8月6日
相关论文
Top
微信扫码咨询专知VIP会员