Communication cost is one major bottleneck for the scalability for distributed learning. One approach to reduce the communication cost is to compress the gradient during communication. However, directly compressing the gradient decelerates the convergence speed, and the resulting algorithm may diverge for biased compression. Recent work addressed this problem for stochastic gradient descent by adding back the compression error from the previous step. This idea was further extended to one class of variance reduced algorithms, where the variance of the stochastic gradient is reduced by taking a moving average over all history gradients. However, our analysis shows that just adding the previous step's compression error, as done in existing work, does not fully compensate the compression error. So, we propose ErrorCompensatedX, which uses the compression error from the previous two steps. We show that ErrorCompensatedX can achieve the same asymptotic convergence rate with the training without compression. Moreover, we provide a unified theoretical analysis framework for this class of variance reduced algorithms, with or without error compensation.


翻译:通信成本是分布式学习可变性的一个主要瓶颈。 降低通信成本的一种方法是压缩通信过程中的梯度。 但是, 直接压缩梯度会减慢趋同速度, 由此产生的算法可能会有偏差压缩。 最近的工作通过将压缩错误与前一步相加, 解决了随机梯度下降的问题。 这个想法被进一步扩大到一个差异减慢算法类别, 通过在所有历史梯度中采用移动平均值来降低随机梯度的差异。 然而, 我们的分析表明, 仅仅按照现有工作的做法添加前一步的压缩错误并不能完全补偿压缩错误。 因此, 我们建议错误校正X, 因为它使用前两个步骤的压缩错误。 我们显示, 错误CompeneratedX 可以在不压缩的情况下实现与培训相同的测试同步率。 此外, 我们为这一差异减缩式算法提供了统一的理论分析框架, 不论有没有错误补偿 。

0
下载
关闭预览

相关内容

南京大学《高级机器学习》课程,李宇峰老师,附slides
专知会员服务
167+阅读 · 2021年8月24日
剑桥大学《数据科学: 原理与实践》课程,附PPT下载
专知会员服务
49+阅读 · 2021年1月20日
Linux导论,Introduction to Linux,96页ppt
专知会员服务
78+阅读 · 2020年7月26日
因果图,Causal Graphs,52页ppt
专知会员服务
246+阅读 · 2020年4月19日
【机器学习课程】Google机器学习速成课程
专知会员服务
164+阅读 · 2019年12月2日
已删除
将门创投
5+阅读 · 2018年2月28日
Arxiv
5+阅读 · 2017年12月14日
VIP会员
相关VIP内容
南京大学《高级机器学习》课程,李宇峰老师,附slides
专知会员服务
167+阅读 · 2021年8月24日
剑桥大学《数据科学: 原理与实践》课程,附PPT下载
专知会员服务
49+阅读 · 2021年1月20日
Linux导论,Introduction to Linux,96页ppt
专知会员服务
78+阅读 · 2020年7月26日
因果图,Causal Graphs,52页ppt
专知会员服务
246+阅读 · 2020年4月19日
【机器学习课程】Google机器学习速成课程
专知会员服务
164+阅读 · 2019年12月2日
相关资讯
已删除
将门创投
5+阅读 · 2018年2月28日
Top
微信扫码咨询专知VIP会员