GPU论文 - 专知

会员服务 ·

GPU

Reliable and Resilient Collective Communication Library for LLM Training and Serving

Reliable and Resilient Collective Communication Library for LLM Training and Serving

Arxiv

0+阅读 · 2025年12月31日

Fast, Differentiable, GPU-Accelerated Ray Tracing for Multiple Diffraction and Reflection Paths

Arxiv

0+阅读 · 2025年12月31日

Risk-Aware GPU-Assisted Cardinality Estimation for Cost-Based Query Optimizers

Arxiv

0+阅读 · 2025年12月31日

HERO-Sign: Hierarchical Tuning and Efficient Compiler-Time GPU Optimizations for SPHINCS+ Signature Generation

Arxiv

0+阅读 · 2025年12月30日

PackKV: Reducing KV Cache Memory Footprint through LLM-Aware Lossy Compression

Arxiv

0+阅读 · 2025年12月30日

MSched: GPU Multitasking via Proactive Memory Scheduling

Arxiv

0+阅读 · 2025年12月31日

BadBlocks: Lightweight and Stealthy Backdoor Threat in Text-to-Image Diffusion Models

Arxiv

0+阅读 · 2025年12月30日

Modality Inflation: Energy Characterization and Optimization Opportunities for MLLM Inference

Arxiv

0+阅读 · 2025年12月27日

GPU Kernel Optimization Beyond Full Builds: An LLM Framework with Minimal Executable Programs

Arxiv

0+阅读 · 2025年12月15日

Role-Based Fault Tolerance System for LLM RL Post-Training

Arxiv

0+阅读 · 2025年12月27日

Efficient Multi-Model Orchestration for Self-Hosted Large Language Models

Arxiv

0+阅读 · 2025年12月26日

GeoWarp: An automatically differentiable and GPU-accelerated implicit MPM framework for geomechanics based on NVIDIA Warp

Arxiv

0+阅读 · 2025年12月27日

SPUMA: a minimally invasive approach to the GPU porting of OPENFOAM

Arxiv

0+阅读 · 2025年12月22日

Mirage Persistent Kernel: A Compiler and Runtime for Mega-Kernelizing Tensor Programs

Arxiv

0+阅读 · 2025年12月22日

Leveraging ASIC AI Chips for Homomorphic Encryption

Arxiv

0+阅读 · 2025年12月25日

参考链接

微信扫码咨询专知VIP会员