当BERT-whitening引入超参数:总有一款适合你
PaperWeekly
0+阅读 · 2022年5月22日
矩阵视角下的Transformer详解(附代码)
PaperWeekly
3+阅读 · 2022年1月4日
【硬核书】矩阵代数基础,248页pdf
专知
13+阅读 · 2021年12月9日
我从未见过如此全面的Transformer剖析
极市平台
0+阅读 · 2021年10月15日
使用上下文信息优化CTR预估中的特征嵌入
机器学习与推荐算法
0+阅读 · 2021年8月20日
一文详解神经网络与激活函数的基本原理
PaperWeekly
1+阅读 · 2020年12月28日
PinSAGE 召回模型及源码分析(1): PinSAGE 简介
AINLP
2+阅读 · 2020年11月30日
使用Batch Normalization折叠来加速模型推理
深度学习自然语言处理
0+阅读 · 2020年11月16日
打通语言理论和统计NLP,Transformers/GNNs架构能做到吗?
深度学习自然语言处理
0+阅读 · 2020年10月9日
基于关系图的实体关系联合抽取
深度学习自然语言处理
1+阅读 · 2020年7月19日
参考链接
微信扫码咨询专知VIP会员