We present an end-to-end automated workflow that uses large-scale remote compute resources and an embedded GPU platform at the edge to enable AI/ML-accelerated real-time analysis of data collected for x-ray ptychography. Ptychography is a lensless method that is being used to image samples through a simultaneous numerical inversion of a large number of diffraction patterns from adjacent overlapping scan positions. This acquisition method can enable nanoscale imaging with x-rays and electrons, but this often requires very large experimental datasets and commensurately high turnaround times, which can limit experimental capabilities such as real-time experimental steering and low-latency monitoring. In this work, we introduce a software system that can automate ptychography data analysis tasks. We accelerate the data analysis pipeline by using a modified version of PtychoNN -- an ML-based approach to solve phase retrieval problem that shows two orders of magnitude speedup compared to traditional iterative methods. Further, our system coordinates and overlaps different data analysis tasks to minimize synchronization overhead between different stages of the workflow. We evaluate our workflow system with real-world experimental workloads from the 26ID beamline at Advanced Photon Source and ThetaGPU cluster at Argonne Leadership Computing Resources.


翻译:我们提出了一种端到端的自动化工作流程,利用大规模远程计算资源和嵌入GPU平台的边缘,实现AI/ML加速的实时分析从相邻重叠扫描位置收集的X射线群扫描数据。群扫描是一种无透镜方法,通过同时数值反演大量相邻重叠扫描位置的衍射图案来成像样品。这种采集方法可以通过X射线和电子实现纳米尺度成像,但这通常需要非常大的实验数据集和相应高的周转时间,这可能限制实验能力,如实时实验控制和低延迟监测。在这项工作中,我们介绍了一种可以自动化群扫描数据分析任务的软件系统。我们通过使用PtychoNN的修改版本来加速数据分析流程--一种用于解决相位恢复问题的基于ML的方法,与传统迭代方法相比,显示出两个数量级的加速。此外,我们的系统协调并重叠不同的数据分析任务,以最小化工作流程不同阶段之间的同步开销。我们用来自Advanced Photon Source的26ID波束线和Argonne Leadership Computing Resources的ThetaGPU群集的真实实验负载评估了我们的工作流程系统。

0
下载
关闭预览

相关内容

【MIT-AI+医学课程】面向生命科学的深度学习课程
专知会员服务
48+阅读 · 2022年4月17日
专知会员服务
61+阅读 · 2020年3月19日
[综述]深度学习下的场景文本检测与识别
专知会员服务
78+阅读 · 2019年10月10日
征稿 | International Joint Conference on Knowledge Graphs (IJCKG)
开放知识图谱
2+阅读 · 2022年5月20日
【泡泡汇总】CVPR2019 SLAM Paperlist
泡泡机器人SLAM
14+阅读 · 2019年6月12日
无监督元学习表示学习
CreateAMind
27+阅读 · 2019年1月4日
Zero-Shot Learning相关资源大列表
专知
52+阅读 · 2019年1月1日
R工程化—Rest API 之plumber包
R语言中文社区
11+阅读 · 2018年12月25日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
17+阅读 · 2018年12月24日
利用动态深度学习预测金融时间序列基于Python
量化投资与机器学习
18+阅读 · 2018年10月30日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2008年12月31日
Arxiv
17+阅读 · 2020年11月15日
VIP会员
相关VIP内容
【MIT-AI+医学课程】面向生命科学的深度学习课程
专知会员服务
48+阅读 · 2022年4月17日
专知会员服务
61+阅读 · 2020年3月19日
[综述]深度学习下的场景文本检测与识别
专知会员服务
78+阅读 · 2019年10月10日
相关资讯
征稿 | International Joint Conference on Knowledge Graphs (IJCKG)
开放知识图谱
2+阅读 · 2022年5月20日
【泡泡汇总】CVPR2019 SLAM Paperlist
泡泡机器人SLAM
14+阅读 · 2019年6月12日
无监督元学习表示学习
CreateAMind
27+阅读 · 2019年1月4日
Zero-Shot Learning相关资源大列表
专知
52+阅读 · 2019年1月1日
R工程化—Rest API 之plumber包
R语言中文社区
11+阅读 · 2018年12月25日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
17+阅读 · 2018年12月24日
利用动态深度学习预测金融时间序列基于Python
量化投资与机器学习
18+阅读 · 2018年10月30日
相关基金
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2008年12月31日
Top
微信扫码咨询专知VIP会员