成为VIP会员查看完整内容
VIP会员码认证
首页
主题
发现
会员
服务
注册
·
登录
GPUs
关注
0
综合
百科
VIP
热门
动态
论文
精华
FastCHGNet: Training one Universal Interatomic Potential to 1.5 Hours with 32 GPUs
Arxiv
0+阅读 · 2024年12月30日
Efficiently Training 7B LLM with 1 Million Sequence Length on 8 GPUs
Arxiv
0+阅读 · 1月11日
Linear Attention Sequence Parallelism
Arxiv
0+阅读 · 1月12日
Code Generation for Cryptographic Kernels using Multi-word Modular Arithmetic on GPU
Arxiv
0+阅读 · 1月13日
Debunking the CUDA Myth Towards GPU-based AI Systems
Arxiv
0+阅读 · 2024年12月31日
Mell: Memory-Efficient Large Language Model Serving via Multi-GPU KV Cache Management
Arxiv
0+阅读 · 1月12日
Boosting Performance of Iterative Applications on GPUs: Kernel Batching with CUDA Graphs
Arxiv
0+阅读 · 1月16日
Portability of Fortran's `do concurrent' on GPUs
Arxiv
0+阅读 · 2024年12月23日
Track reconstruction as a service for collider physics
Arxiv
0+阅读 · 1月9日
Popcorn: Accelerating Kernel K-means on GPUs through Sparse Linear Algebra
Arxiv
0+阅读 · 1月9日
GreenLLM: Disaggregating Large Language Model Serving on Heterogeneous GPUs for Lower Carbon Emissions
Arxiv
0+阅读 · 2024年12月29日
Performant Automatic BLAS Offloading on Unified Memory Architecture with OpenMP First-Touch Style Data Movement
Arxiv
0+阅读 · 2024年12月31日
Pilot-Quantum: A Quantum-HPC Middleware for Resource, Workload and Task Management
Arxiv
0+阅读 · 2024年12月24日
Pilot-Quantum: A Quantum-HPC Middleware for Resource, Workload and Task Management
Arxiv
0+阅读 · 2024年12月27日
Dovetail: A CPU/GPU Heterogeneous Speculative Decoding for LLM inference
Arxiv
0+阅读 · 2024年12月25日
参考链接
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top