This paper introduces LLMServingSim2.0, a system simulator designed for exploring heterogeneous hardware in large-scale LLM serving systems. LLMServingSim2.0 addresses two key limitations of its predecessor: (1) integrating hardware models into system-level simulators is non-trivial due to the lack of a clear abstraction, and (2) existing simulators support only a narrow subset of serving techniques, leaving no infrastructure that captures the breadth of approaches in modern LLM serving. To overcome these issues, LLMServingSim2.0 adopts trace-driven performance modeling, accompanied by an operator-level latency profiler, enabling the integration of new accelerators with a single command. It further embeds up-to-date serving techniques while exposing flexible interfaces for request routing, cache management, and scheduling policies. In a TPU case study, our profiler requires 18.5x fewer LoC and outperforms the predecessor's hardware-simulator integration, demonstrating LLMServingSim2.0's low-effort hardware extensibility. Our experiments further show that LLMServingSim2.0 reproduces GPU-based LLM serving with 1.9% error, while maintaining practical simulation time, making it a comprehensive platform for both hardware developers and LLM service providers.


翻译:本文介绍了LLMServingSim2.0,这是一个专为探索大规模LLM服务系统中异构硬件而设计的系统模拟器。LLMServingSim2.0解决了其前代版本的两个关键局限:(1)由于缺乏清晰的抽象层次,将硬件模型集成到系统级模拟器中并非易事;(2)现有模拟器仅支持有限的服务技术子集,缺乏能够涵盖现代LLM服务中广泛方法的基础设施。为克服这些问题,LLMServingSim2.0采用基于轨迹的性能建模方法,并配备算子级延迟分析器,使得通过单一命令即可集成新型加速器。该系统进一步嵌入了最新的服务技术,同时为请求路由、缓存管理和调度策略提供了灵活接口。在TPU案例研究中,我们的分析器所需代码行数减少了18.5倍,且性能优于前代硬件-模拟器集成方案,证明了LLMServingSim2.0具备低成本的硬件扩展能力。实验进一步表明,LLMServingSim2.0在保持实用模拟时长的同时,能够以1.9%的误差复现基于GPU的LLM服务,这使其成为硬件开发者和LLM服务提供商均可使用的综合平台。

0
下载
关闭预览

相关内容

[IEEE TPAMI 2024] 将CLIP模型转换为端到端文本识别器
专知会员服务
22+阅读 · 2024年4月12日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
17+阅读 · 2008年12月31日
VIP会员
相关基金
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
17+阅读 · 2008年12月31日
Top
微信扫码咨询专知VIP会员