Data analysis often involves comparing subsets of data across many dimensions for finding unusual trends and patterns. While the comparison between subsets of data can be expressed using SQL, they tend to be complex to write, and suffer from poor performance over large and high-dimensional datasets. In this paper, we propose a new logical operator COMPARE for relational databases that concisely captures the enumeration and comparison between subsets of data and greatly simplifies the expressing of a large class of comparative queries. We extend the database engine with optimization techniques that exploit the semantics of COMPARE to significantly improve the performance of such queries. We have implemented these extensions inside Microsoft SQL Server, a commercial DBMS engine. Our extensive evaluation on synthetic and real-world datasets shows that COMPARE results in a significant speedup over existing approaches, including physical plans generated by today's database systems, user-defined function (UDF), as well as middleware solutions that compare subsets outside the databases.


翻译:数据分析通常涉及对多个层面的数据子集进行比较,以寻找不同趋势和模式。虽然可以用SQL来表示数据子集之间的比较,但数据子集的写法往往比较复杂,而且对大型和高维数据集的性能不佳。在本文中,我们提议为关系数据库建立一个新的逻辑操作员COMPARE,以简明地记录数据子集之间的查点和比较,并大大简化大量比较查询的表达方式。我们利用COMPARE的语义最优化技术扩展数据库引擎,以大大改进这类查询的性能。我们已经在微软 SQL 服务器(商业DBMS引擎)内实施了这些扩展。我们对合成和真实世界数据集的广泛评价表明,COMPARE大大加快了现有方法,包括今天的数据库系统产生的物理计划、用户定义功能(UDF)以及比较数据库外子集的中软件解决方案。

0
下载
关闭预览

相关内容

iOS 8 提供的应用间和应用跟系统的功能交互特性。
  • Today (iOS and OS X): widgets for the Today view of Notification Center
  • Share (iOS and OS X): post content to web services or share content with others
  • Actions (iOS and OS X): app extensions to view or manipulate inside another app
  • Photo Editing (iOS): edit a photo or video in Apple's Photos app with extensions from a third-party apps
  • Finder Sync (OS X): remote file storage in the Finder with support for Finder content annotation
  • Storage Provider (iOS): an interface between files inside an app and other apps on a user's device
  • Custom Keyboard (iOS): system-wide alternative keyboards

Source: iOS 8 Extensions: Apple’s Plan for a Powerful App Ecosystem
【干货书】开放数据结构,Open Data Structures,337页pdf
专知会员服务
17+阅读 · 2021年9月17日
【干货书】机器学习速查手册,135页pdf
专知会员服务
126+阅读 · 2020年11月20日
专知会员服务
53+阅读 · 2020年9月7日
【经典书】C语言傻瓜式入门(第二版),411页pdf
专知会员服务
52+阅读 · 2020年8月16日
最新BERT相关论文清单,BERT-related Papers
专知会员服务
53+阅读 · 2019年9月29日
Hierarchically Structured Meta-learning
CreateAMind
26+阅读 · 2019年5月22日
Unsupervised Learning via Meta-Learning
CreateAMind
42+阅读 · 2019年1月3日
已删除
将门创投
5+阅读 · 2018年6月7日
Arxiv
0+阅读 · 2021年9月27日
Acceleration based PSO for Multi-UAV Source-Seeking
Arxiv
0+阅读 · 2021年9月23日
VIP会员
相关资讯
Hierarchically Structured Meta-learning
CreateAMind
26+阅读 · 2019年5月22日
Unsupervised Learning via Meta-Learning
CreateAMind
42+阅读 · 2019年1月3日
已删除
将门创投
5+阅读 · 2018年6月7日
Top
微信扫码咨询专知VIP会员