成为VIP会员查看完整内容
VIP会员码认证
首页
主题
会员
服务
注册
·
登录
GPU
关注
29
综合
百科
VIP
热门
动态
论文
精华
Reliable and Resilient Collective Communication Library for LLM Training and Serving
Arxiv
0+阅读 · 2025年12月31日
Fast, Differentiable, GPU-Accelerated Ray Tracing for Multiple Diffraction and Reflection Paths
Arxiv
0+阅读 · 2025年12月31日
Risk-Aware GPU-Assisted Cardinality Estimation for Cost-Based Query Optimizers
Arxiv
0+阅读 · 2025年12月31日
HERO-Sign: Hierarchical Tuning and Efficient Compiler-Time GPU Optimizations for SPHINCS+ Signature Generation
Arxiv
0+阅读 · 2025年12月30日
PackKV: Reducing KV Cache Memory Footprint through LLM-Aware Lossy Compression
Arxiv
0+阅读 · 2025年12月30日
MSched: GPU Multitasking via Proactive Memory Scheduling
Arxiv
0+阅读 · 2025年12月31日
BadBlocks: Lightweight and Stealthy Backdoor Threat in Text-to-Image Diffusion Models
Arxiv
0+阅读 · 2025年12月30日
Modality Inflation: Energy Characterization and Optimization Opportunities for MLLM Inference
Arxiv
0+阅读 · 2025年12月27日
GPU Kernel Optimization Beyond Full Builds: An LLM Framework with Minimal Executable Programs
Arxiv
0+阅读 · 2025年12月15日
Role-Based Fault Tolerance System for LLM RL Post-Training
Arxiv
0+阅读 · 2025年12月27日
Efficient Multi-Model Orchestration for Self-Hosted Large Language Models
Arxiv
0+阅读 · 2025年12月26日
GeoWarp: An automatically differentiable and GPU-accelerated implicit MPM framework for geomechanics based on NVIDIA Warp
Arxiv
0+阅读 · 2025年12月27日
SPUMA: a minimally invasive approach to the GPU porting of OPENFOAM
Arxiv
0+阅读 · 2025年12月22日
Mirage Persistent Kernel: A Compiler and Runtime for Mega-Kernelizing Tensor Programs
Arxiv
0+阅读 · 2025年12月22日
Leveraging ASIC AI Chips for Homomorphic Encryption
Arxiv
0+阅读 · 2025年12月25日
参考链接
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top