图能够方便地表达事物之间的关联关系,因而广泛应用于现实生活中的诸多应 用场景,例如社交网络图、电路图和电商交易图,为图计算赋能数据挖掘和分析提 供基础。由于图计算的重要性和普遍性,同一图计算平台上通常并行运行着大量图 算法(以下简称并发图计算任务),为不同的应用或者用户提供高性能的图计算能力 支撑。除了与传统图计算任务相同的计算特征外,并发图计算任务还存在着严重的 资源竞争、数据竞争等新型挑战,任务并发度和总体性能较低。为此,如何设计面 向并发图计算任务的高性能执行环境,快速挖掘出海量图数据中潜在的各种商业或 科学价值,已成为目前亟需解决的问题。为了高效支持图计算任务的执行,目前国内外学者已经从面向图计算的体系结 构和系统软件等方面开展了广泛的研究。然而,现有图计算硬件加速器和软件系统 无法充分感知不同图计算任务之间的运行时特征,例如潜在的数据局部性和通信行 为相似性等。现有方案在支持并发图计算任务时面临着数据访问行为不规则、冗余 访存开销大以及通信效率低等问题,导致严重的数据访问瓶颈和底层硬件资源的低 效利用。为了解决并发图计算任务面临的挑战,分别从体系结构层面和系统软件层 面开展研究来实现高性能并发图计算技术,有效支持并发图计算任务的执行。针对并发图计算任务数据访问行为不规则问题,提出了以数据局部性为中心的 并发图计算硬件加速技术,以提高并发图计算任务的访存效率。分析发现,由于不 同图计算任务往往沿着同一图拓扑来遍历相同图数据,这些任务之间存在极强的数 据局部性。基于此发现,该硬件加速技术首先动态探索并发图计算任务活跃图顶点 之间的依赖关系,使并发图计算任务沿着图拓扑遍历和处理相同图数据,以此来规 则化并发图计算任务的图遍历行为。其次,该硬件加速技术对并发图计算任务的图 顶点访问进行高效合并,从而提高顶点访问的局部性。实验结果表明,与现有图计 算硬件加速技术 HATS、Minnow 和 PHI 相比,本设计能够获得最高 11.3 倍的加速比。针对并发图计算任务冗余访存开销大问题,提出基于细粒度同步的核外并发图 计算技术。该技术首先提出了一种面向并发图计算任务的细粒度同步执行机制,使得只需在缓存和内存中加载和存储相同图结构数据的一个副本就能服务多个并发图 计算任务,从而降低图数据的冗余访存成本,提高底层硬件资源的利用率。其次, 提出了图结构感知的数据重划分和缓存机制,通过自适应地加载并发图计算任务所 需的图数据,并将频繁使用的图数据缓存在主存中,提高加载图数据利用率和最小 化 I/O 开销。实验结果表明,所提出的核外并发图计算技术,能够将现有图计算系统 GridGraph、GraphChi 和 X-Stream 的并发图计算任务吞吐率最高提升 13 倍。针对并发图计算任务在分布式环境下扩展性差的问题,提出了相似性感知的分 布式并发图计算技术。分析发现,并发图计算任务之间的通信行为存在极强的相似 性。基于此发现,首先提出了相似性感知的分布式并发图计算执行机制,其沿着图 划分块之间的拓扑关系来加载图数据,并以此高效驱动分布式平台中每个计算节点 上的任务执行,从而使得加载的图数据能够被更多任务共享;通过高效的通信机制 来使得不同任务的通信行为以规则的方式批量进行,从而降低并发图计算任务的通 信成本,提高通信效率。其次,提出了面向并发图计算任务的增量负载均衡机制和 面向动态图处理的数据存储优化机制,以此来提高分布式计算资源利用率和保证在 支持动态图处理时的执行效率。实验结果表明,与分布式图计算系统 Gemini 和 Seraph 相比,本设计在支持并发图计算任务时能够获得最高 6 倍的加速比。总的来说,本文分别研究了并发图计算任务不规则访存行为与底层体系结构不 匹配问题、并发图计算任务之间冗余数据访存开销高问题以及分布式并发图计算扩 展性差问题,围绕体系结构、单机和分布式系统软件层面实现高性能并发图计算技 术,显著提升并发图计算任务的执行性能。

成为VIP会员查看完整内容
32

相关内容

博士论文是由攻读博士学位的研究生所撰写的学术论文。它要求作者在博士生导师的指导下,选择自己能够把握和驾驭的潜在的研究方向,开辟新的研究领域。由此可见,这就对作者提出了较高要求,它要求作者必须在本学科的专业领域具备大量的理论知识,并对所学专业的理论知识有相当深入的理解和思考,同时还要具有相当水平的独立科学研究能力,能够为在学科领域提出独创性的见解和有价值的科研成果。因而,较之学士论文、硕士论文,博士论文具有更高的学术价值,对学科的发展具有重要的推动作用。
【博士论文】复杂场景下高精度有向目标检测的研究
专知会员服务
49+阅读 · 2023年12月1日
【博士论文】基于深度学习的单目场景深度估计方法研究
【博士论文】开放环境下的度量学习研究
专知会员服务
46+阅读 · 2021年12月4日
【博士论文】机器学习中的标记增强理论 与应用研究
专知会员服务
29+阅读 · 2021年12月3日
【博士论文】大数据相似查询关键技术研究
专知会员服务
23+阅读 · 2021年12月2日
专知会员服务
36+阅读 · 2020年12月22日
专知会员服务
55+阅读 · 2020年12月20日
【博士论文】解耦合的类脑计算系统栈设计
专知会员服务
30+阅读 · 2020年12月14日
【博士论文】辨识性特征学习及在细粒度分析中的应用
专知会员服务
29+阅读 · 2020年12月10日
专知会员服务
73+阅读 · 2020年12月7日
【MIT博士论文】数据高效强化学习,176页pdf
最新《图嵌入组合优化》综述论文,40页pdf
最新《动态网络嵌入》综述论文,25页pdf
专知
34+阅读 · 2020年6月17日
【优青论文】深度神经网络压缩与加速综述
计算机研究与发展
14+阅读 · 2018年9月20日
国家自然科学基金
0+阅读 · 2016年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
Deep graph kernel point processes
Arxiv
0+阅读 · 2月2日
Arxiv
156+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
398+阅读 · 2023年3月31日
Arxiv
139+阅读 · 2023年3月24日
Arxiv
20+阅读 · 2023年3月17日
VIP会员
相关VIP内容
【博士论文】复杂场景下高精度有向目标检测的研究
专知会员服务
49+阅读 · 2023年12月1日
【博士论文】基于深度学习的单目场景深度估计方法研究
【博士论文】开放环境下的度量学习研究
专知会员服务
46+阅读 · 2021年12月4日
【博士论文】机器学习中的标记增强理论 与应用研究
专知会员服务
29+阅读 · 2021年12月3日
【博士论文】大数据相似查询关键技术研究
专知会员服务
23+阅读 · 2021年12月2日
专知会员服务
36+阅读 · 2020年12月22日
专知会员服务
55+阅读 · 2020年12月20日
【博士论文】解耦合的类脑计算系统栈设计
专知会员服务
30+阅读 · 2020年12月14日
【博士论文】辨识性特征学习及在细粒度分析中的应用
专知会员服务
29+阅读 · 2020年12月10日
专知会员服务
73+阅读 · 2020年12月7日
相关基金
国家自然科学基金
0+阅读 · 2016年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
微信扫码咨询专知VIP会员