性能全面超数据库专家,腾讯提基于机器学习的性能优化系统 | SIGMOD 2019

2019 年 6 月 18 日 AI100


腾讯与华中科技大学合作的最新研究成果入选了国际数据库顶级会议SIGMOD的收录论文,并将于6月30日在荷兰阿姆斯特丹召开SIGMOD 2019国际会议上公开发表。


入选论文的题目为“An End-to-End Automatic Cloud Database Tuning System Using Deep Reinforcement Learning”,此项研究突破性的实现了基于AI技术的数据库性能调优结果首次全面超越数据库专家经验判断的传统方法。该成果由华中科技大学武汉光电国家研究中心周可教授团队和腾讯技术工程事业群云架构平台部CDB数据库团队合作完成,博士生张霁为第一作者。

 

智能云存储技术联合研究中心由腾讯与华中科技大学于2018年成立,旨在通过强强联合,建设一流的智能云存储技术创新和人才培养平台。通过吸引汇聚顶尖专业人才,腾讯与华中科技大学在分布式存储技术、高性能存储引擎、业务负载预测等方面开展联合技术攻关,突破超大规模云存储服务系统的诸多技术难题,推动智能云存储技术的科技创新及技术应用落地。本次入选的论文,正是智能云存储技术联合研究中心的联合研究成果之一。

 

SIGMOD数据管理国际会议是数据库领域具有最高学术地位的国际性学术会议,位列数据库方向顶级会议之首。

 

随着云计算的迅速发展,中小型企业通过购买云数据库服务系统,来代替自建和维护数据库服务系统的情况越来越多,以便节约人力物力。然而,大多数用户在购买云数据库服务系统后仅仅停留在使用层面上,在使用过程中经常遇到数据库系统性能下降的情况。


由于缺少数据库管理系统性能优化的经验,用户很难发现导致数据库系统性能下降的原因并有效地解决,这就需要云服务提供商为用户及时地调整数据库系统参数,以保证数据库的性能维持在一个较优的状态。对于拥有数十万计用户实例的云服务提供商来说,完全依赖数据库专家进行数据库参数调优显然是不现实的,如何利用AI技术解决数据库系统性能问题已经变得越来越重要和紧迫。

 

该文首次提出了一种基于深度强化学习的端到端的云数据库自动性能优化系统CDBTune,如图1所示。该系统可以在缺少相关经验数据训练的情况下建立优化模型,为云数据库用户提供在线自动优化数据库性能的服务,性能调优结果首次全面超越数据库专家,这将大幅提高数据库运维效率。

       

图1  强化学习与数据库性能优化关系图

 

如图2所示,在多种不同负载和不同类型的数据库下进行的大量实验证明,CDBTune性能优化结果明显优于目前已有数据库调优工具和DBA专家。即使在弹性云环境下,用户购买数据库内存或磁盘大小发生变化,或负载发生变化(类型不变)的情况下,实验证明CDBTune依然保持了较好的适应能力。

     

图2  CDBTune性能测试结果

 

在实际系统中,如图3所示,当用户或者系统管理员有数据库性能优化需求时,可以通过相应的交互接口提出调参优化请求,此时云端的控制器通过给智能优化系统发出调参请求,并根据用户真实负载建立的深度强化学习模型推荐出的相应的参数配置,然后将该配置在数据库中进行设置。反复执行上述的执行过程,直到待调参的数据库性能满足用户或系统管理员的需求即停止调参。

 

       

图3  CDBTune系统交互图

 

对于该论文,SIGMOD评审委员的评价是:“本文是关于利用机器学习方法优化数据库的技术,这是一个令人振奋的新领域。 特别是它使用了强化学习的方法。这篇文章不仅仅是简单地抛出一个机器学习技术,而且非常好地解释了机器学习是如何与特定的问题进行完全的匹配,同时也阐述了与传统机器学习术语之间的类比问题。鉴于在数据库社区中并非每个人都能对这些技术了如指掌,这也是一种教学方式,因此我们非常赞赏这篇文章。”

 

每年SIGMOD会议都会吸引大量全球学术组织和工业界数据库研究人员参会和分享,也汇聚了学术界和工业界在数据库领域最前沿的技术研究动向。


(*本文为 AI科技大本营转载文章,转载请联系连作者)


精彩推荐



想跟NVIDIA专业讲师学习TensorRT吗?扫码进群,获取报名地址,群内优秀提问者可获得限量奖品(定制T恤或者技术图书,包邮哦~)


NVIDIA TensorRT是一种高性能深度学习推理优化器和运行时加速库,可以为深度学习推理应用程序提供低延时和高吞吐量。通过TensorRT,开发者可以优化神经网络模型,以高精度校对低精度,最后将模型部署到超大规模数据中心、嵌入式平台或者汽车产品平台中。


推荐阅读

你点的每个“在看”,我都认真当成了喜欢
登录查看更多
1

相关内容

ACM数据管理会议(SIGMOD)关注数据库管理系统和数据管理技术的原理、技术和应用。包括软件开发人员,学术和行业研究人员,从业人员,用户和学生。SIGMOD赞助了年度SIGMOD / PODS会议,这是该领域最重要、最有选择性的会议之一。 官网地址:http://dblp.uni-trier.de/db/conf/sigmod/
【硬核书】可扩展机器学习:并行分布式方法
专知会员服务
85+阅读 · 2020年5月23日
轻量级神经网络架构综述
专知会员服务
96+阅读 · 2020年4月29日
【中国人民大学】机器学习的隐私保护研究综述
专知会员服务
131+阅读 · 2020年3月25日
分布式智能计算系统前沿
中国计算机学会
19+阅读 · 2019年10月8日
CNCC技术论坛丨新型持久内存系统与安全
中国计算机学会
7+阅读 · 2019年9月15日
阿里技术大牛:一份架构师成神路线图!
51CTO博客
30+阅读 · 2019年7月6日
工行基于MySQL构建分布式架构的转型之路
炼数成金订阅号
15+阅读 · 2019年5月16日
刚刚,阿里开源首个深度学习框架 X-Deep Learning!
阿里技术
4+阅读 · 2018年12月21日
已删除
将门创投
9+阅读 · 2018年12月19日
干货 | 双11总峰值超8亿OPS 阿里分布式NoSQL如何岿然不动稳如山?
阿里巴巴数据库技术
10+阅读 · 2018年12月12日
一篇文章读懂阿里企业级数据库最佳实践
阿里巴巴数据库技术
5+阅读 · 2017年12月20日
如何系统地学习数据挖掘?
数据库开发
10+阅读 · 2017年10月22日
Arxiv
102+阅读 · 2020年3月4日
Arxiv
15+阅读 · 2020年2月6日
Arxiv
8+阅读 · 2018年5月15日
Arxiv
5+阅读 · 2018年5月1日
Arxiv
14+阅读 · 2018年4月18日
Arxiv
17+阅读 · 2018年4月2日
VIP会员
相关VIP内容
【硬核书】可扩展机器学习:并行分布式方法
专知会员服务
85+阅读 · 2020年5月23日
轻量级神经网络架构综述
专知会员服务
96+阅读 · 2020年4月29日
【中国人民大学】机器学习的隐私保护研究综述
专知会员服务
131+阅读 · 2020年3月25日
相关资讯
分布式智能计算系统前沿
中国计算机学会
19+阅读 · 2019年10月8日
CNCC技术论坛丨新型持久内存系统与安全
中国计算机学会
7+阅读 · 2019年9月15日
阿里技术大牛:一份架构师成神路线图!
51CTO博客
30+阅读 · 2019年7月6日
工行基于MySQL构建分布式架构的转型之路
炼数成金订阅号
15+阅读 · 2019年5月16日
刚刚,阿里开源首个深度学习框架 X-Deep Learning!
阿里技术
4+阅读 · 2018年12月21日
已删除
将门创投
9+阅读 · 2018年12月19日
干货 | 双11总峰值超8亿OPS 阿里分布式NoSQL如何岿然不动稳如山?
阿里巴巴数据库技术
10+阅读 · 2018年12月12日
一篇文章读懂阿里企业级数据库最佳实践
阿里巴巴数据库技术
5+阅读 · 2017年12月20日
如何系统地学习数据挖掘?
数据库开发
10+阅读 · 2017年10月22日
相关论文
Arxiv
102+阅读 · 2020年3月4日
Arxiv
15+阅读 · 2020年2月6日
Arxiv
8+阅读 · 2018年5月15日
Arxiv
5+阅读 · 2018年5月1日
Arxiv
14+阅读 · 2018年4月18日
Arxiv
17+阅读 · 2018年4月2日
Top
微信扫码咨询专知VIP会员