Gradient coding allows a master node to derive the aggregate of the partial gradients, calculated by some worker nodes over the local data sets, with minimum communication cost, and in the presence of stragglers. In this paper, for gradient coding with linear encoding, we characterize the optimum communication cost for heterogeneous distributed systems with \emph{arbitrary} data placement, with $s \in \mathbb{N}$ stragglers and $a \in \mathbb{N}$ adversarial nodes. In particular, we show that the optimum communication cost, normalized by the size of the gradient vectors, is equal to $(r-s-2a)^{-1}$, where $r \in \mathbb{N}$ is the minimum number that a data partition is replicated. In other words, the communication cost is determined by the data partition with the minimum replication, irrespective of the structure of the placement. The proposed achievable scheme also allows us to target the computation of a polynomial function of the aggregated gradient matrix. It also allows us to borrow some ideas from approximation computing and propose an approximate gradient coding scheme for the cases when the repetition in data placement is smaller than what is needed to meet the restriction imposed on communication cost or when the number of stragglers appears to be more than the presumed value in the system design.
翻译:梯度编码允许一个主节点得出部分梯度的总和, 由某些工人节点对本地数据集计算, 并有最小通信成本, 且有累加器。 在本文中, 对于使用线性编码的梯度编码, 我们用 emph{ abriar} 数据定位来描述分布式系统的最佳通信成本。 换句话说, 通信成本由数据分区确定, 最小复制, 不论放置结构如何 。 拟议的可实现方案还允许我们选择计算汇总梯度矩阵的多位函数, 以梯度矢量的大小为标准, 最高通信成本为$( r- s-2a)\\\\\\\\\\\ { 1} 美元 。 当一个比预估的系统要更小的定位, 在比预估值更小的通信系统上, 将比预估测的系统更小的定位, 将比预估的系统要更小的更小的, 将比预估的更小的, 重新定位系统比预估的系统更精确的定位, 更能,, 将比预估的 更 更 的 更 更 更 的 更 更 更 更 更 更 更 更 更 更 更 的 的 更 更 更 更 更 更 更 更 的 更 的 的 的 更 的 的 的 的 更 更 更 更 更 更 更 的 的 更 的 的 的 的 的 的 的 的 的 更 的 的 更 的 更 更 更 的 的 的 的 的 更 的 的 的 的 的 的 的 的 的 的 的 更 更 更 更 的 更 更 更 的 的 的 更 的 的 更 更 更 更 更 的 的 的 的 的 的 的 的 的 更 更 更 更 更 更 更 的 的 的 的 的 更 更 更 更