Federated Averaging (FedAvg, also known as Local-SGD) (McMahan et al., 2017) is a classical federated learning algorithm in which clients run multiple local SGD steps before communicating their update to an orchestrating server. We propose a new federated learning algorithm, FedPAGE, able to further reduce the communication complexity by utilizing the recent optimal PAGE method (Li et al., 2021) instead of plain SGD in FedAvg. We show that FedPAGE uses much fewer communication rounds than previous local methods for both federated convex and nonconvex optimization. Concretely, 1) in the convex setting, the number of communication rounds of FedPAGE is $O(\frac{N^{3/4}}{S\epsilon})$, improving the best-known result $O(\frac{N}{S\epsilon})$ of SCAFFOLD (Karimireddy et al.,2020) by a factor of $N^{1/4}$, where $N$ is the total number of clients (usually is very large in federated learning), $S$ is the sampled subset of clients in each communication round, and $\epsilon$ is the target error; 2) in the nonconvex setting, the number of communication rounds of FedPAGE is $O(\frac{\sqrt{N}+S}{S\epsilon^2})$, improving the best-known result $O(\frac{N^{2/3}}{S^{2/3}\epsilon^2})$ of SCAFFOLD (Karimireddy et al.,2020) by a factor of $N^{1/6}S^{1/3}$, if the sampled clients $S\leq \sqrt{N}$. Note that in both settings, the communication cost for each round is the same for both FedPAGE and SCAFFOLD. As a result, FedPAGE achieves new state-of-the-art results in terms of communication complexity for both federated convex and nonconvex optimization.
翻译:FedAvering (FedAvg, 也称为Lial-SGD) (McMahan等人, 2017年) 是一种经典的联盟式学习算法, 客户在向一个协同服务器传送最新消息之前先运行多个本地 SGD 步骤。 我们提出一个新的 FedAGE, FedPAGE, 能够通过使用最新的最佳 PAG 方法( Li et al., 2021) 而不是 FedAvg 的普通 SGD 来进一步降低通信的复杂性。 我们显示 FedPAGE 使用比以往的本地方法少得多的通信周期, 既使用Fed convex, 也使用非confexx 优化。 具体地, 1, FedPGAGE, 美元 美元 美元 美元 的基FFOLD, 美元 美元 的基FFFFFFOLD, 美元 美元 的基数( ====xx 美元 美元 美元 美元 美元 美元 美元, 美元 美元的基FFFFFFedal 美元 美元 的基 的计算结果 ===x 美元 美元 美元 美元 美元 美元 美元 美元 美元 美元 美元 =====x 美元 美元 美元 美元 美元 美元 美元 美元 美元 美元 美元 美元 ===== 美元 美元 美元 美元 美元 美元的基 ======================= 美元 美元 美元 美元 美元 美元 美元 美元 美元 美元 美元 美元 美元 美元 美元 美元 = 美元 美元 美元 美元 美元 美元 美元 美元 美元 美元 美元 美元 美元 美元 美元 美元 美元 美元 美元 美元 美元 美元 美元 美元 美元 美元 美元 美元 美元 美元 美元 美元 美元 美元 美元 美元 美元 美元 美元 美元 美元 美元 美元 美元 美元 美元 美元 美元 美元 美元 美元