Analytical database systems are typically designed to use a column-first data layout that maps better to analytical queries of access patterns. This choice is premised on the assumption that storing data in a row-first format leads to accessing unwanted fields; moreover, transforming rows to columns at runtime is expensive. On the other hand, new data items are constantly ingested in row-first form and transformed in the background to columns to facilitate future analytical queries. How will this design change if we can always access only the desired set of columns? In this paper, to address this question, we present a radically new approach to data transformation from rows to columns. We build upon recent advancements in commercial embedded platforms with tightly-coupled re-programmable logic to design native in-memory access on rows and columns. We propose a new database management system (DBMS) architecture that is the first hardware/software co-design. It relies on an FPGA-based accelerator to transparently transform base data to any group of columns with minimal overhead at runtime. This design allows the DBMS to access any group of columns as if it already exists in memory. Our method, termed relational memory, currently implements projection, and offers the groundwork for implementing selection, group by, aggregation, and supporting joins in hardware, thus, vastly simplifying the software logic and accelerating the query execution. We present a detailed analysis of relational memory using both synthetic benchmarks and realistic workloads. Our relational memory implementation can convert on the fly rows to arbitrary groups of columns without any latency penalty. Essentially, relational memory can load in cache the desired columns from a row-oriented base data layout as fast as reading from column-oriented base data layout by outsourcing data transformation to the hardware.


翻译:分析数据库系统通常设计为使用一列数据布局,以更好地绘制第一列数据布局,用于分析访问模式的分析查询。这一选择的前提是假设以第一行格式存储数据导致访问不需要的字段;此外,将行转换成运行时的列费用昂贵。另一方面,新数据项目不断以第一行格式摄入,并在背景中转换成各栏,以便利今后的分析查询。如果我们总是能够只访问所需的一组列,设计如何改变这一设计?为了解决这个问题,我们提出了将数据从行转换为各栏的全新方法。我们利用商业嵌入平台的最新进展,以精密的任意字段格式进入了不需要的字段;此外,将行转换成运行时的列;我们提出了一个新的数据库管理系统(DBMS),这是首个硬件/软件联合设计。我们依靠一个基于FPGA的加速将基础数据转换为任何一组,运行时,可以使用最低的间接费用。我们的设计允许DBMS在商业嵌嵌入平台的最近一些进展中,如果已经使用内部流的直径直径,那么,我们用内部流的直径直径直为快速的直径直线数据,可以使用一个内部流的直径直线关系, 将一个直径直径直径直系数据转换为运行的直径直路的直到直径直径直路的直路的直路。

0
下载
关闭预览

相关内容

【干货书】面向计算科学和工程的Python导论,167页pdf
专知会员服务
41+阅读 · 2021年4月7日
专知会员服务
76+阅读 · 2021年3月16日
专知会员服务
38+阅读 · 2020年9月6日
Linux导论,Introduction to Linux,96页ppt
专知会员服务
77+阅读 · 2020年7月26日
【Manning新书】现代Java实战,592页pdf
专知会员服务
98+阅读 · 2020年5月22日
最新BERT相关论文清单,BERT-related Papers
专知会员服务
52+阅读 · 2019年9月29日
已删除
将门创投
12+阅读 · 2019年7月1日
Arxiv
0+阅读 · 2021年11月19日
Arxiv
0+阅读 · 2021年11月18日
Query Embedding on Hyper-relational Knowledge Graphs
Arxiv
4+阅读 · 2021年6月17日
Memory-Gated Recurrent Networks
Arxiv
12+阅读 · 2020年12月24日
Arxiv
6+阅读 · 2020年3月16日
VIP会员
相关VIP内容
【干货书】面向计算科学和工程的Python导论,167页pdf
专知会员服务
41+阅读 · 2021年4月7日
专知会员服务
76+阅读 · 2021年3月16日
专知会员服务
38+阅读 · 2020年9月6日
Linux导论,Introduction to Linux,96页ppt
专知会员服务
77+阅读 · 2020年7月26日
【Manning新书】现代Java实战,592页pdf
专知会员服务
98+阅读 · 2020年5月22日
最新BERT相关论文清单,BERT-related Papers
专知会员服务
52+阅读 · 2019年9月29日
相关资讯
已删除
将门创投
12+阅读 · 2019年7月1日
Top
微信扫码咨询专知VIP会员