成为VIP会员查看完整内容
VIP会员码认证
首页
主题
发现
会员
服务
注册
·
登录
稀疏激活
关注
1
综合
百科
VIP
热门
动态
论文
精华
Memory Layers at Scale
Arxiv
1+阅读 · 2024年12月20日
Memory Layers at Scale
Arxiv
1+阅读 · 2024年12月12日
Exploring the Benefit of Activation Sparsity in Pre-training
Arxiv
0+阅读 · 2024年10月4日
STUN: Structured-Then-Unstructured Pruning for Scalable MoE Pruning
Arxiv
0+阅读 · 2024年9月10日
Depth on Demand: Streaming Dense Depth from a Low Frame Rate Active Sensor
Arxiv
0+阅读 · 2024年9月12日
Cheems: Wonderful Matrices More Efficient and More Effective Architecture
Arxiv
0+阅读 · 2024年7月24日
Cheems: Wonderful Matrices More Efficient and More Effective Architecture
Arxiv
0+阅读 · 2024年7月25日
Accurate Mapping of RNNs on Neuromorphic Hardware with Adaptive Spiking Neurons
Arxiv
0+阅读 · 2024年7月18日
Spiking Convolutional Neural Networks for Text Classification
Arxiv
0+阅读 · 2024年6月27日
A Closer Look into Mixture-of-Experts in Large Language Models
Arxiv
0+阅读 · 2024年6月26日
Learning Neural Networks with Sparse Activations
Arxiv
0+阅读 · 2024年6月26日
MoE Jetpack: From Dense Checkpoints to Adaptive Mixture of Experts for Vision Tasks
Arxiv
0+阅读 · 2024年6月7日
Flood and Echo Net: Algorithmically Aligned GNNs that Generalize
Arxiv
0+阅读 · 2024年6月3日
InterpretCC: Intrinsic User-Centric Interpretability through Global Mixture of Experts
Arxiv
0+阅读 · 2024年5月29日
InterpretCC: Intrinsic User-Centric Interpretability through Global Mixture of Experts
Arxiv
0+阅读 · 2024年5月28日
参考链接
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top