In this paper, we propose CodedSketch, as a distributed straggler-resistant scheme to compute an approximation of the multiplication of two massive matrices. The objective is to reduce the recovery threshold, defined as the total number of worker nodes that we need to wait for to be able to recover the final result. To exploit the fact that only an approximated result is required, in reducing the recovery threshold, some sorts of pre-compression are required. However, compression inherently involves some randomness that would lose the structure of the matrices. On the other hand, considering the structure of the matrices is crucial to reduce the recovery threshold. In CodedSketch, we use count--sketch, as a hash-based compression scheme, on the rows of the first and columns of the second matrix, and a structured polynomial code on the columns of the first and rows of the second matrix. This arrangement allows us to exploit the gain of both in reducing the recovery threshold. To increase the accuracy of computation, multiple independent count--sketches are needed. This independency allows us to theoretically characterize the accuracy of the result and establish the recovery threshold achieved by the proposed scheme. To guarantee the independency of resulting count--sketches in the output, while keeping its cost on the recovery threshold minimum, we use another layer of structured codes.


翻译:在本文中,我们建议使用“编码”Sketch, 作为一种分布式的分层阻缩器, 用来计算两个大型矩阵的倍增近似值。 目标是降低回收阈值, 即我们需要等待才能恢复最终结果的工人节点总数。 为了利用在降低回收阈值方面只需要一个大概的结果这一事实, 需要某种压缩前的预感。 但是, 压缩本身就包含一些随机性, 这会失去矩阵的结构。 另一方面, 考虑矩阵结构对于降低回收阈值至关重要。 在代码Sketch中, 我们使用计数器作为基于散列的压缩计划, 在二号矩阵的第一行和列上, 以及第二个矩阵第一行和第二行的结构性混合代码。 这一安排使我们能够在降低回收阈值时利用两者的收益。 为了提高计算准确性, 多重独立的计数器对于降低回收阈值是十分关键的。 这使我们得以在理论上界定其结构值的回收率时, 确定我们所实现的最低限度的回收值。

0
下载
关闭预览

相关内容

【硬核书】Linux核心编程|Linux Kernel Programming,741页pdf
专知会员服务
78+阅读 · 2021年3月26日
专知会员服务
15+阅读 · 2020年7月27日
Python分布式计算,171页pdf,Distributed Computing with Python
专知会员服务
107+阅读 · 2020年5月3日
【2020新书】C++20 特性 第二版,A Problem-Solution Approach
专知会员服务
58+阅读 · 2020年4月26日
【新书】Python编程基础,669页pdf
专知会员服务
194+阅读 · 2019年10月10日
机器学习入门的经验与建议
专知会员服务
92+阅读 · 2019年10月10日
已删除
将门创投
4+阅读 · 2019年11月8日
VIP会员
相关资讯
已删除
将门创投
4+阅读 · 2019年11月8日
Top
微信扫码咨询专知VIP会员