BFS (Breadth-First Search) is a typical graph algorithm used as a key component of many graph applications. However, current distributed parallel BFS implementations suffer from irregular data communication with large volumes of transfers across nodes, leading to inefficiency in performance. In this paper, we present a set of optimization techniques to improve the Graph500 performance for Pre-exacale system, including BFS accelerating with SVE (Scalable Vector extension) in matrix2000+, sorting with buffering for heavy vertices, and group-based monitor communication based on proprietary interconnection built in Tianhe Pre-exacale system. Performance evaluation on the customized Graph500 testing on the Tianhe Pre-exacale system achieves 2131.98 Giga TEPS on 512-node with 96608 cores, which surpasses the ranking of Tianhe-2 with about 16X fewer nodes in the June 2018 Graph500 list, and shows our customized Graph500 is 3.15 times faster on 512 nodes than the base version using the state-of-the-art techniques.


翻译:BFS(Breadth- First Search)是一种典型的图形算法,作为许多图形应用程序的关键组成部分。然而,目前分布的平行BFS实施过程存在不规则的数据通信,在节点之间有大量传输,导致性能低下。本文介绍了一套优化技术,以改善Exacale系统图500性能,包括BFS在矩阵2000年+中与SVE(可缩放矢量扩展)同步加速,对重脊椎进行缓冲排序,以及基于天河前排系统所建专有互连系统的小组监测通信。天河前排系统定制图500测试的性能评估在512诺德(96608核心)上实现了2131.98 Giga TEPS,该测试超过了Tianhe-2的排名,在2018年6月的图500列表中,其节点减少了约16X,显示我们定制的图500在使用最新技术的基版512个节点上速度为315倍。

0
下载
关闭预览

相关内容

Stabilizing Transformers for Reinforcement Learning
专知会员服务
57+阅读 · 2019年10月17日
强化学习最新教程,17页pdf
专知会员服务
168+阅读 · 2019年10月11日
[综述]深度学习下的场景文本检测与识别
专知会员服务
77+阅读 · 2019年10月10日
分布式并行架构Ray介绍
CreateAMind
9+阅读 · 2019年8月9日
Transferring Knowledge across Learning Processes
CreateAMind
26+阅读 · 2019年5月18日
LibRec 精选:位置感知的长序列会话推荐
LibRec智能推荐
3+阅读 · 2019年5月17日
Call for Participation: Shared Tasks in NLPCC 2019
中国计算机学会
5+阅读 · 2019年3月22日
计算机 | ISMAR 2019等国际会议信息8条
Call4Papers
3+阅读 · 2019年3月5日
计算机类 | ISCC 2019等国际会议信息9条
Call4Papers
5+阅读 · 2018年12月25日
计算机类 | 11月截稿会议信息9条
Call4Papers
6+阅读 · 2018年10月14日
Hierarchical Imitation - Reinforcement Learning
CreateAMind
19+阅读 · 2018年5月25日
【推荐】图像分类必读开创性论文汇总
机器学习研究会
14+阅读 · 2017年8月15日
A Sketch-Based System for Semantic Parsing
Arxiv
4+阅读 · 2019年9月12日
Efficient and Effective $L_0$ Feature Selection
Arxiv
5+阅读 · 2018年8月7日
Arxiv
4+阅读 · 2018年5月4日
VIP会员
相关VIP内容
Stabilizing Transformers for Reinforcement Learning
专知会员服务
57+阅读 · 2019年10月17日
强化学习最新教程,17页pdf
专知会员服务
168+阅读 · 2019年10月11日
[综述]深度学习下的场景文本检测与识别
专知会员服务
77+阅读 · 2019年10月10日
相关资讯
分布式并行架构Ray介绍
CreateAMind
9+阅读 · 2019年8月9日
Transferring Knowledge across Learning Processes
CreateAMind
26+阅读 · 2019年5月18日
LibRec 精选:位置感知的长序列会话推荐
LibRec智能推荐
3+阅读 · 2019年5月17日
Call for Participation: Shared Tasks in NLPCC 2019
中国计算机学会
5+阅读 · 2019年3月22日
计算机 | ISMAR 2019等国际会议信息8条
Call4Papers
3+阅读 · 2019年3月5日
计算机类 | ISCC 2019等国际会议信息9条
Call4Papers
5+阅读 · 2018年12月25日
计算机类 | 11月截稿会议信息9条
Call4Papers
6+阅读 · 2018年10月14日
Hierarchical Imitation - Reinforcement Learning
CreateAMind
19+阅读 · 2018年5月25日
【推荐】图像分类必读开创性论文汇总
机器学习研究会
14+阅读 · 2017年8月15日
Top
微信扫码咨询专知VIP会员