深度学习模型的分散训练是实现网络上数据隐私和设备上学习的关键要素。在现实的学习场景中,不同客户端局部数据集之间存在异构,这对优化提出了挑战,并可能严重影响泛化性能。在本文中,我们研究并识别了几种分散优化算法在不同程度的数据异构下的局限性。我们提出了一种新的基于动量的方法来缓解这种分散训练的困难。我们通过对各种CV/NLP数据集(CIFAR-10、ImageNet和AG News)和几种网络拓扑(Ring和Social network)的大量经验实验表明,与其他现有方法相比,我们的方法对客户数据的异构性更稳健,测试性能显著提高(1% - 20%)。我们的代码是公开的。

https://www.zhuanzhi.ai/paper/f22917494a3416d21630f426b07e5622

成为VIP会员查看完整内容
15

相关内容

机器学习的一个分支,它基于试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的一系列算法。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
专知会员服务
32+阅读 · 2021年9月7日
专知会员服务
21+阅读 · 2021年8月23日
专知会员服务
14+阅读 · 2021年7月21日
专知会员服务
30+阅读 · 2021年7月19日
专知会员服务
22+阅读 · 2021年7月15日
专知会员服务
24+阅读 · 2021年7月8日
专知会员服务
37+阅读 · 2021年6月19日
专知会员服务
24+阅读 · 2021年6月17日
专知会员服务
21+阅读 · 2021年5月14日
专知会员服务
81+阅读 · 2021年5月10日
7个实用的深度学习技巧
机器学习算法与Python学习
16+阅读 · 2019年3月6日
【边缘智能】边缘计算驱动的深度学习加速技术
产业智能官
20+阅读 · 2019年2月8日
迁移学习在深度学习中的应用
专知
23+阅读 · 2017年12月24日
Arxiv
56+阅读 · 2021年5月3日
Arxiv
10+阅读 · 2021年3月30日
Arxiv
20+阅读 · 2019年11月23日
VIP会员
相关VIP内容
专知会员服务
32+阅读 · 2021年9月7日
专知会员服务
21+阅读 · 2021年8月23日
专知会员服务
14+阅读 · 2021年7月21日
专知会员服务
30+阅读 · 2021年7月19日
专知会员服务
22+阅读 · 2021年7月15日
专知会员服务
24+阅读 · 2021年7月8日
专知会员服务
37+阅读 · 2021年6月19日
专知会员服务
24+阅读 · 2021年6月17日
专知会员服务
21+阅读 · 2021年5月14日
专知会员服务
81+阅读 · 2021年5月10日
微信扫码咨询专知VIP会员