题目: The Deep Learning Compiler: A Comprehensive Survey
摘要: 在不同的DL硬件上部署各种深度学习(deep learning,DL)模型的困难,推动了DL编译器在社区中的研究和开发。业界和学术界都提出了一些DL编译器,如Tensorflow XLA和TVM。类似地,DL编译器将不同DL框架中描述的DL模型作为输入,然后为不同的DL硬件生成优化代码作为输出。然而,现有的调查没有全面分析DL编译器的独特设计。在本文中,我们对现有DL编译器进行了全面的调查,通过对常用设计的详细剖析,着重介绍了面向DL的多级IRS,以及前端/后端优化。具体来说,我们提供了一个全面的比较现有的DL编译器从各个方面。此外,我们还详细分析了多级IR设计和编译器优化技术。最后,提出了DL编译器潜在的研究方向。这是第一篇针对DL编译器独特设计的综述性论文,希望能为以后的研究铺平道路。