基于机器学习的数据库技术综述

2021 年 1 月 2 日 专知


大数据时代下,面对不断膨胀的数据信息、复杂多样的应用场景、异构的硬件架构和参差不齐的用户使用水平,传统数据库技术很难适应这些新的场景和变化. 机器学习技术因其较强的学习能力,逐渐在数据库领域展现出了潜力和应用前景. 论文首先给出一个高效、高可靠、高可用、自适应性强的数据库系统需要涵盖的方面,包括数据库运维、数据存储、查询优化等.其次,讨论机器学习算法与数据库技术结合过程中可能面临的挑战,包括训练数据少、训练时间长、泛化能力有限、适应性差四个方面.然后,综述数据库技术与机器学习结合的现状以及具体技术.其中,重点介绍数据库自动调参、查询基数估计、查询计划选择、索引和视图自动选择五个方向.自动调参技术包括启发式算法、传统机器学习、深度强化学习三类.启发式算法从离散的参数空间中通过抽样探索最优子空间,可以有效提高调参效率,但是难以保证在有效资源限制内找到合适配置;传统机器学习算法在经过降维的参数空间中学习系统状态到指定负载模板的映射关系,一定程度上提升模型的适应性;深度强化学习在高维参数空间中迭代的学习调优策略,并利用神经网络提升对高维数据的处理能力,有效降低训练数据的需求.查询基数估计包括面向查询和面向执行计划两类.面向查询方法利用卷积神经网络学习表数据、查询条件、连接条件之间的关系,然而在不同场景下需要大量训练而且泛化能力差;面向执行计划方法在物理算子层面做级联的代价估计,一定程度上提高对不同查询的适应能力.查询计划选择包括深度学习和强化学习两类.深度学习方法融合数据库估计器的代价值和数据特征,提高对每种计划代价估计的精度,但是结果严重依赖估计器的表现;强化学习基于最终目标迭代生成查询计划,降低方法对查询代价的依赖性.自动索引推荐包括分类器、强化学习、遗传算法三类.分类算法根据离散的表特征分析不同索引的创建开销和效率,通过结合遗传算法,提高对复合索引的推荐效率;强化学习进一步提供增量式索引推荐的效率,实现在线索引选择.自动视图选择包括启发式算法、概率统计、强化学习三类.启发式算法通过在视图构建的有向无环图上做贪心探索,提高选择效率,然而适应性差;基于概率统计的算法将视图选择形式化成一个0-1选择问题,有效降低图的探索开销;强化学习方法将视图的创建和删除统一成动态选择过程,基于强化学习的训练策略进一步提高选择效率.最后,从八个方面展望机器学习将给数据库带来的革命性突破。


https://kns.cnki.net/kcms/detail/detail.aspx?dbcode=CJFD&dbname=CJFDLAST2020&filename=JSJX202011001&v=0vtp9fKPMXEG0nC%25mmd2BaFw63lJIp6KfBlkczE9t3yzQGK2D4C67l66rFcjG0IS%25mmd2FLUWq


专知便捷查看

便捷下载,请关注专知公众号(点击上方蓝色专知关注)

  • 后台回复“MLDT” 可以获取《基于机器学习的数据库技术综述》专知下载链接索引

专知,专业可信的人工智能知识分发,让认知协作更快更好!欢迎注册登录专知www.zhuanzhi.ai,获取5000+AI主题干货知识资料!
欢迎微信扫一扫加入专知人工智能知识星球群,获取最新AI专业干货知识教程资料和与专家交流咨询
点击“ 阅读原文 ”,了解使用 专知 ,查看获取5000+AI主题知识资源
登录查看更多
0

相关内容

数据库技术是信息系统的一个核心技术。是一种计算机辅助管理数据的方法,它研究如何组织和存储数据,如何高效地获取和处理数据。
专知会员服务
138+阅读 · 2021年3月30日
机器学习在信道建模中的应用综述
专知会员服务
27+阅读 · 2021年3月16日
最新《计算机体系结构和系统的机器学习》综述论文
专知会员服务
54+阅读 · 2021年2月17日
专知会员服务
30+阅读 · 2021年1月9日
专知会员服务
230+阅读 · 2020年12月15日
基于深度学习的数据融合方法研究综述
专知会员服务
137+阅读 · 2020年12月10日
专知会员服务
119+阅读 · 2020年12月9日
专知会员服务
50+阅读 · 2020年11月20日
专知会员服务
45+阅读 · 2020年8月20日
最新《多任务学习》综述,39页pdf
专知
28+阅读 · 2020年7月10日
机器学习中的最优化算法总结
人工智能前沿讲习班
22+阅读 · 2019年3月22日
打包—综述—看干货
计算机研究与发展
5+阅读 · 2019年1月8日
孟小峰:机器学习与数据库技术融合
计算机研究与发展
14+阅读 · 2018年9月6日
推荐|机器学习中的模型评价、模型选择和算法选择!
全球人工智能
10+阅读 · 2018年2月5日
机器学习(26)之K-Means实战与调优详解
机器学习算法与Python学习
4+阅读 · 2017年11月19日
基于机器学习的KPI自动化异常检测系统
运维帮
13+阅读 · 2017年8月16日
干货|用机器学习检测异常点击流
全球人工智能
6+阅读 · 2017年7月30日
Arxiv
31+阅读 · 2021年3月29日
Arxiv
6+阅读 · 2019年12月30日
Few-shot Learning: A Survey
Arxiv
362+阅读 · 2019年4月10日
Meta-Transfer Learning for Few-Shot Learning
Arxiv
4+阅读 · 2019年4月9日
Arxiv
7+阅读 · 2019年4月8日
Arxiv
7+阅读 · 2018年12月5日
Arxiv
3+阅读 · 2018年11月19日
VIP会员
相关VIP内容
专知会员服务
138+阅读 · 2021年3月30日
机器学习在信道建模中的应用综述
专知会员服务
27+阅读 · 2021年3月16日
最新《计算机体系结构和系统的机器学习》综述论文
专知会员服务
54+阅读 · 2021年2月17日
专知会员服务
30+阅读 · 2021年1月9日
专知会员服务
230+阅读 · 2020年12月15日
基于深度学习的数据融合方法研究综述
专知会员服务
137+阅读 · 2020年12月10日
专知会员服务
119+阅读 · 2020年12月9日
专知会员服务
50+阅读 · 2020年11月20日
专知会员服务
45+阅读 · 2020年8月20日
相关资讯
最新《多任务学习》综述,39页pdf
专知
28+阅读 · 2020年7月10日
机器学习中的最优化算法总结
人工智能前沿讲习班
22+阅读 · 2019年3月22日
打包—综述—看干货
计算机研究与发展
5+阅读 · 2019年1月8日
孟小峰:机器学习与数据库技术融合
计算机研究与发展
14+阅读 · 2018年9月6日
推荐|机器学习中的模型评价、模型选择和算法选择!
全球人工智能
10+阅读 · 2018年2月5日
机器学习(26)之K-Means实战与调优详解
机器学习算法与Python学习
4+阅读 · 2017年11月19日
基于机器学习的KPI自动化异常检测系统
运维帮
13+阅读 · 2017年8月16日
干货|用机器学习检测异常点击流
全球人工智能
6+阅读 · 2017年7月30日
相关论文
Arxiv
31+阅读 · 2021年3月29日
Arxiv
6+阅读 · 2019年12月30日
Few-shot Learning: A Survey
Arxiv
362+阅读 · 2019年4月10日
Meta-Transfer Learning for Few-Shot Learning
Arxiv
4+阅读 · 2019年4月9日
Arxiv
7+阅读 · 2019年4月8日
Arxiv
7+阅读 · 2018年12月5日
Arxiv
3+阅读 · 2018年11月19日
Top
微信扫码咨询专知VIP会员