Graph mining is one of the most important categories of graph algorithms. However, exploring the subgraphs of an input graph produces a huge amount of intermediate data. The 'think like a vertex' programming paradigm, pioneered by Pregel, cannot readily formulate mining problems, which is designed to produce graph computation problems like PageRank. Existing mining systems like Arabesque and RStream need large amounts of computing and memory resources. In this paper, we present Kaleido, an efficient single machine, out-of-core graph mining system which treats disks as an extension of memory. Kaleido treats intermediate data in graph mining tasks as a tensor and adopts a succinct data structure for the intermediate data. Kaleido utilizes the eigenvalue of the adjacency matrix of a subgraph to efficiently solve the subgraph isomorphism problems with an acceptable constraint that the vertex number of a subgraph is less than 9. Kaleido implements half-memory-half-disk storage for storing large intermediate data, which treats the disk as an extension of the memory. Comparing with two state-of-the-art mining systems, Arabesque and RStream, Kaleido outperforms them by a GeoMean 12.3$\times$ and 40.0$\times$ respectively.


翻译:图表开采是最重要的图表算法类别之一。 然而, 探索输入图的子图生成了大量中间数据。 “ 思考像顶点” 编程模式, 由Pregel率先推出, 无法轻易地提出采矿问题, 目的是产生像PageRank这样的图表计算问题。 现有的Arabeesque和RStream等采矿系统需要大量的计算和记忆资源。 在本文中, 我们介绍Kaleido, 一种高效的单一机器, 核心图外采矿系统, 将磁盘作为记忆的延伸。 Kaleido 将图形采矿任务中的中间数据作为高压处理, 并且为中间数据采用简洁的数据结构。 Kaleido 使用子图的对称矩阵的对称价值来有效解决子地形问题, 而一个子图的顶点数量小于9. Kaleirodo 用于存储大型中间数据的半位半位半位半位存储器。 将磁盘作为记忆的延伸部分处理。 Kaleidodrido, 将磁盘与两个州- mismatime- mextimetime- mission 分别由40 和阿拉伯和埃及- mest- mistime- mistime- mistime- mistime- mex- mistime- se- mistime- comms

0
下载
关闭预览

相关内容

【2020新书】图机器学习,Graph-Powered Machine Learning
专知会员服务
337+阅读 · 2020年1月27日
知识图谱本体结构构建论文合集
专知会员服务
102+阅读 · 2019年10月9日
LibRec 精选:AutoML for Contextual Bandits
LibRec智能推荐
7+阅读 · 2019年9月19日
Transferring Knowledge across Learning Processes
CreateAMind
26+阅读 · 2019年5月18日
移动端机器学习资源合集
专知
8+阅读 · 2019年4月21日
LibRec 精选:推荐系统的常用数据集
LibRec智能推荐
17+阅读 · 2019年2月15日
Unsupervised Learning via Meta-Learning
CreateAMind
41+阅读 · 2019年1月3日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
16+阅读 · 2018年12月24日
LibRec 精选:推荐系统的论文与源码
LibRec智能推荐
14+阅读 · 2018年11月29日
R文本分类之RTextTools
R语言中文社区
4+阅读 · 2018年1月17日
Capsule Networks解析
机器学习研究会
10+阅读 · 2017年11月12日
【LeetCode 136】 关关的刷题日记32 Single Number
Arxiv
3+阅读 · 2018年3月28日
Arxiv
26+阅读 · 2018年2月27日
Arxiv
6+阅读 · 2018年2月26日
VIP会员
相关VIP内容
【2020新书】图机器学习,Graph-Powered Machine Learning
专知会员服务
337+阅读 · 2020年1月27日
知识图谱本体结构构建论文合集
专知会员服务
102+阅读 · 2019年10月9日
相关资讯
LibRec 精选:AutoML for Contextual Bandits
LibRec智能推荐
7+阅读 · 2019年9月19日
Transferring Knowledge across Learning Processes
CreateAMind
26+阅读 · 2019年5月18日
移动端机器学习资源合集
专知
8+阅读 · 2019年4月21日
LibRec 精选:推荐系统的常用数据集
LibRec智能推荐
17+阅读 · 2019年2月15日
Unsupervised Learning via Meta-Learning
CreateAMind
41+阅读 · 2019年1月3日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
16+阅读 · 2018年12月24日
LibRec 精选:推荐系统的论文与源码
LibRec智能推荐
14+阅读 · 2018年11月29日
R文本分类之RTextTools
R语言中文社区
4+阅读 · 2018年1月17日
Capsule Networks解析
机器学习研究会
10+阅读 · 2017年11月12日
【LeetCode 136】 关关的刷题日记32 Single Number
Top
微信扫码咨询专知VIP会员