The performance of large-scale computing systems often critically depends on high-performance communication networks. Dynamically reconfigurable topologies, e.g., based on optical circuit switches, are emerging as an innovative new technology to deal with the explosive growth of datacenter traffic. Specifically, periodic reconfigurable datacenter networks (RDCNs) such as RotorNet (SIGCOMM 2017), Opera (NSDI 2020) and Sirius (SIGCOMM 2020) have been shown to provide high throughput, by emulating a complete graph through fast periodic circuit switch scheduling. However, to achieve such a high throughput, existing reconfigurable network designs pay a high price: in terms of potentially high delays, but also, as we show as a first contribution in this paper, in terms of the high buffer requirements. In particular, we show that under buffer constraints, emulating the high-throughput complete-graph is infeasible at scale, and we uncover a spectrum of unvisited and attractive alternative RDCNs, which emulate regular graphs of lower node degree. We present Mars, a periodic reconfigurable topology which emulates a $d$-regular graph with near-optimal throughput. In particular, we systematically analyze how the degree $d$ can be optimized for throughput given the available buffer and delay tolerance of the datacenter.
翻译:大规模计算系统的性能往往严重依赖高性能通信网络。动态的可调整表层,如光电路开关,正在作为一种创新的新技术出现,以应对数据中心交通的爆炸性增长。具体地说,定期的可调整数据中心网络(RDCN),如RotorNet(SIGCOMM 2017年)、Opera(NSDI 2020年)和Sirius(SIGCOMM 2020年)等,显示通过快速定期电路开关列表模拟完整的图表,提供了高输送量。然而,要实现如此高的吞吐量,现有的可重新配置网络的设计将付出高昂的代价:就潜在的高延迟而言,但正如我们在本文中显示的首份贡献,即缓冲要求很高。特别是,我们表明,在缓冲限制下,模拟高通量完整成型成型的成型成型成型的成型成型成型成型成型成型的成型成型成型的成型成型成型的成型图无法受到注意和有吸引力的替代RDCN的替代图,这些成型的成型的成型的成型的成型的成型的成型的成型式的成型的成型的成型式的成型图,与正型的成型的成型的成型的成型的成型的成型的成型的成型式的成型的成型的成型的成型的成型式的成型式的成型,我们式的成型的成型式的成型式的成型式的成型式的成型式的成型式的成型式的成型式式的成型式的成型式的成型式的成型式的成型式式的成型式的成型式的成型式的成型式的成型式的成型式的成型式的成型式的成型式的成型式的成型式的成型式的成型式的成型式的成型式的成型式的成型式的成型式的成型式的成型式的成式的成型式的成型式的成型式的成型式的成型式的成型式的成型式的成式的成型式的成式的成型