Performance in modern GPU-centric systems depends increasingly on resource management policies, such as memory placement, scheduling, and observability. However, a one-size-fits-all policy performs poorly across diverse workloads. Existing approaches present a tradeoff: user-space runtimes offer programmability but lack cross-tenant visibility and fine-grained hardware control, while OS kernel modification introduce complexity and safety risks. To address this, we argue that the GPU driver and device layer must serve as an extensible OS policy interface. The emerging eBPF offers a possibility, but naively transplanting host-side eBPF is insufficient: it cannot observe critical device-side events, and directly injecting policy code into GPU kernels affects safety and efficiency. We present gpu_ext, an eBPF-based policy runtime that treats the GPU driver and device as a programmable OS subsystem. gpu_ext extends GPU drivers to expose safe hooks and introduces a device-side eBPF runtime that executes verified policy logic within GPU kernels, enabling coherent, application-transparent policies. Evaluation on realistic workloads, including inference, training, and vector search, shows that gpu_ext improves throughput by up to 4.8x and reduces tail latency by up to 2x with low overhead, without modifying applications or restarting drivers.


翻译:现代以GPU为中心的系统性能日益依赖于资源管理策略,例如内存放置、调度和可观测性。然而,一刀切的策略在不同工作负载下表现不佳。现有方法存在权衡:用户空间运行时提供可编程性但缺乏跨租户可见性和细粒度硬件控制,而操作系统内核修改则引入复杂性和安全风险。为解决此问题,我们认为GPU驱动和设备层必须作为可扩展的操作系统策略接口。新兴的eBPF提供了一种可能性,但简单移植主机端eBPF是不够的:它无法观测关键的设备端事件,且直接将策略代码注入GPU内核会影响安全性和效率。我们提出了gpu_ext,一种基于eBPF的策略运行时,将GPU驱动和设备视为可编程的操作系统子系统。gpu_ext扩展GPU驱动以暴露安全钩子,并引入设备端eBPF运行时,在GPU内核内执行已验证的策略逻辑,从而实现一致、对应用透明的策略。在包括推理、训练和向量搜索在内的实际工作负载上的评估表明,gpu_ext可将吞吐量提升高达4.8倍,尾部延迟降低高达2倍,且开销较低,无需修改应用或重启驱动。

0
下载
关闭预览

相关内容

Python图像处理,366页pdf,Image Operators Image Processing in Python
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
VIP会员
相关基金
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员