选自arXiv
大规模视频识别分布式训练往往具有较高的计算、数据加载和通信成本,为了解决这些问题,MIT 的研究者提出了三项设计原则,并基于这些原则设计了一种时间位移模块(TSM)。这一设计成功将在 Summit 超级计算机上需要近 50 小时的训练时间压缩到了不到 15 分钟。
链接:https://arxiv.org/abs/1910.00932
TSM Github 链接: https://github.com/mit-han-lab/temporal-shift-module
项目地址: https://hanlab.mit.edu/projects/tsm/