This paper presents LMStream, which ensures bounded latency while maximizing the throughput on the GPU-enabled micro-batch streaming systems. The main ideas behind LMStream's design can be summarized as two novel mechanisms: (1) dynamic batching and (2) dynamic operation-level query planning. By controlling the micro-batch size, LMStream significantly reduces the latency of individual dataset because it does not perform unconditional buffering only for improving GPU utilization. LMStream bounds the latency to an optimal value according to the characteristics of the window operation used in the streaming application. Dynamic mapping between a query to an execution device based on the data size and dynamic device preference improves both the throughput and latency as much as possible. In addition, LMStream proposes a low-overhead online cost model parameter optimization method without interrupting the real-time stream processing. We implemented LMStream on Apache Spark, which supports micro-batch stream processing. Compared to the previous throughput-oriented method, LMStream showed an average latency improvement up to a maximum of 70.7%, while improving average throughput up to 1.74x.


翻译:本文介绍了LMStream, 它确保了连接的延缓度, 同时最大限度地将GPU驱动的微批流系统的吞吐量最大化。 LMStream设计中的主要想法可以归纳为两个新型机制:(1) 动态批发和(2) 动态操作级查询规划。通过控制微批量尺寸, LMStream 大大降低了个人数据集的延缓度, 因为它不只为改善GPU的利用率而执行无条件缓冲。 LMStream 将延缓度与根据流应用中所用窗口操作特性的最佳值捆绑在一起。 根据数据大小和动态设备偏好, 对执行装置的查询之间的动态绘图会尽可能改善吞吐量和延度。 此外, LMStream 提议在不中断实时流处理的情况下采用低端在线成本模型参数优化方法。 我们在阿帕奇 Spark上实施了LMStream, 用于支持微批量流处理。 与先前的吞吐法相比, LMStream 显示平均递增率提高至最高值。

0
下载
关闭预览

相关内容

《深度学习500问》一份超全深度学习资料,面试必备!
专知会员服务
163+阅读 · 2022年1月9日
专知会员服务
14+阅读 · 2021年3月26日
专知会员服务
15+阅读 · 2020年7月27日
Linux导论,Introduction to Linux,96页ppt
专知会员服务
77+阅读 · 2020年7月26日
【伯克利】再思考 Transformer中的Batch Normalization
专知会员服务
40+阅读 · 2020年3月21日
GPU 显存不足怎么办?
AINLP
13+阅读 · 2019年8月16日
Unsupervised Learning via Meta-Learning
CreateAMind
41+阅读 · 2019年1月3日
AI/ML/DNN硬件加速设计怎么入门?
StarryHeavensAbove
10+阅读 · 2018年12月4日
已删除
将门创投
5+阅读 · 2018年2月28日
Arxiv
0+阅读 · 2022年1月7日
Arxiv
3+阅读 · 2017年12月1日
VIP会员
相关资讯
GPU 显存不足怎么办?
AINLP
13+阅读 · 2019年8月16日
Unsupervised Learning via Meta-Learning
CreateAMind
41+阅读 · 2019年1月3日
AI/ML/DNN硬件加速设计怎么入门?
StarryHeavensAbove
10+阅读 · 2018年12月4日
已删除
将门创投
5+阅读 · 2018年2月28日
Top
微信扫码咨询专知VIP会员