基于搜索的技术已被证明能够有效地解决面向领域的机器学习编译器中出现的复杂优化问题。不幸的是,在生产编译器中部署这种技术受到了一些限制。在这次演讲中,我将介绍一个用于生产ML编译器的自动调优器,它可以在多个编译阶段同时调优图级和子图级优化。autotuner应用了一种灵活的搜索方法,通过精确建模不同编译器之间的交互来定义联合优化的搜索公式。自动调优器使用各种搜索策略在生产式ML编译器XLA中调整张量布局、算子融合决策、块大小和代码生成参数。我们演示了如何结合机器学习技术,如学习成本模型和各种基于学习的搜索策略,以减少自动调整时间。我们的学习成本模型具有很高的准确性,并优于一个高度优化的分析性能模型。在张量处理单元(TPU)上的150 ML训练和推理模型的评估中,自调优器提供了高达2.4倍的运行速度,比高度优化的XLA编译器平均提高了5%的运行速度。该自动调优器已部署在谷歌产品中,每天自动调整最常用的生产型号。

成为VIP会员查看完整内容
12

相关内容

编译器(Compiler),是一种计算机程序,它会将用某种编程语言写成的源代码(原始语言),转换成另一种编程语言(目标语言)。
【2022新书】分布式机器学习Python实战,284页pdf
专知会员服务
136+阅读 · 2022年6月11日
【伯克利Alvin Wan博士论文】高效设计深度神经网络
专知会员服务
59+阅读 · 2022年5月21日
专知会员服务
81+阅读 · 2021年7月31日
谷歌分布式机器学习优化实践
专知
2+阅读 · 2022年3月26日
TensorFlow 模型优化工具包:协作优化 API
TensorFlow
1+阅读 · 2021年11月29日
2021 Google 开发者大会丨构建高效机器学习生态
谷歌开发者
0+阅读 · 2021年11月18日
如何轻松部署设备端音频机器学习?
TensorFlow
0+阅读 · 2021年10月8日
社区分享 | 在物联网设备中运行 TensorFlow
TensorFlow
2+阅读 · 2021年8月13日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
2+阅读 · 2008年12月31日
国家自然科学基金
0+阅读 · 2008年12月31日
Arxiv
14+阅读 · 2020年9月1日
A survey on deep hashing for image retrieval
Arxiv
14+阅读 · 2020年6月10日
Arxiv
15+阅读 · 2020年2月6日
Arxiv
11+阅读 · 2018年4月25日
VIP会员
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
2+阅读 · 2008年12月31日
国家自然科学基金
0+阅读 · 2008年12月31日
微信扫码咨询专知VIP会员