模型优化漫谈:BERT的初始标准差为什么是0.02?
PaperWeekly
0+阅读 · 2021年11月26日
11种主要神经网络结构图解
极市平台
6+阅读 · 2020年6月30日
【深度学习】神经网络为何非激活函数不可?
深度学习自然语言处理
0+阅读 · 2020年2月7日
从ReLU到GELU,一文概览神经网络的激活函数
PaperWeekly
0+阅读 · 2019年12月21日
从ReLU到GELU,一文概览神经网络的激活函数
机器之心
1+阅读 · 2019年12月20日
深度学习到底怎么学?
深度学习与NLP
0+阅读 · 2019年1月30日
一文简述ResNet及其多种变体
炼数成金订阅号
3+阅读 · 2018年4月24日
一文简述ResNet及其多种变体
机器之心
23+阅读 · 2018年4月22日
深度学习DenseNet算法详解
数据挖掘入门与实战
7+阅读 · 2018年4月17日
参考链接
微信扫码咨询专知VIP会员