Communication efficient distributed mean estimation is an important primitive that arises in many distributed learning and optimization scenarios such as federated learning. Without any probabilistic assumptions on the underlying data, we study the problem of distributed mean estimation where the server has access to side information. We propose \emph{Wyner-Ziv estimators}, which are communication and computationally efficient and near-optimal when an upper bound for the distance between the side information and the data is known. As a corollary, we also show that our algorithms provide efficient schemes for the classic Wyner-Ziv problem in information theory. In a different direction, when there is no knowledge assumed about the distance between side information and the data, we present an alternative Wyner-Ziv estimator that uses correlated sampling. This latter setting offers {\em universal recovery guarantees}, and perhaps will be of interest in practice when the number of users is large and keeping track of the distances between the data and the side information may not be possible. With this mean estimator at our disposal, we revisit basic problems in decentralized optimization and compression where our Wyner-Ziv estimator yields algorithms with almost optimal performance. First, we consider the problem of communication constrained distributed optimization and provide an algorithm which attains the optimal convergence rate by exploiting the fact that the gradient estimates are close to each other. Specifically, the gradient compression scheme in our algorithm first uses half of the parties to form side information and then uses our Wyner-Ziv estimator to compress the remaining half of the gradient estimates.
翻译:通信效率分布平均估计是一个重要的原始, 在许多分布式的学习和优化假设中, 比如联合学习, 这是一种重要的原始现象。 在基础数据上没有任何概率假设的情况下, 我们研究在服务器能够获取侧边信息的地方, 分布平均估计的问题。 我们提议了\ emph{ Wyner- Ziv 估计值, 它们是通信和计算效率和接近最佳的, 当了解侧信息与数据之间的距离时, 当用户数量大且跟踪数据与侧信息之间的距离时, 我们的算法为经典Wyner- Ziv 的信息理论问题提供了有效的计划。 在不同的方向上, 当对侧信息与数据之间的距离没有假设时, 我们研究分布式平均估算值时, 当对侧边信息与数据之间的距离没有认识时, 我们提出一个使用相关抽样的分布式平均估计值的问题。 后一种设置的Wyner- Z 估计值的替代方法, 当用户数量大且跟踪数据与侧信息之间的距离时, 可能会对实践感兴趣。 当我们继续使用这个平均估测算时, 我们的边边边框在信息理论中, 我们重新研究一些基本的问题, 在分散化和压缩的边端点上, 我们的边端平整和压缩中, 我们的平流的平流的平流的平整和压缩的平流的平流 利用了我们第一次的平流的平流的平流的平流的平流的平流的平流的平流的平流法 的平流法, 我们的平流法 的平流的平流法 利用了我们第一次的平流的平流法 的平流的平流的平流的平流 的平流的平流的平流 的平流的平流 的平流 的平流 的平流的平流的平流 的平流 的平流 的平流 的平流 的平流 的平流 的平流法 的平流 的平流的平流的平流法 的平流的平流 的平流的平流法 的平流法 的平流法 的平流 的平流的平流的平流的平流的平流的平流的平流的平流的平流法 的平流