MIT提出FPGA加速机器学习推理，提速175倍轻松处理EB数据集

会员服务 ·

MIT提出FPGA加速机器学习推理，提速175倍轻松处理EB数据集

2019 年 8 月 25 日 新智元

新智元原创

编辑：鹏飞

【新智元导读】由麻省理工学院助理教授Philip Harris和核科学实验室博士后Dylan Rankin等国际科学家团队测试的新机器学习技术可以在眨眼间发现大型强子对撞机（LHC）海量数据中的特定粒子特征。

MIT助理教授Philip Harris和核科学实验室博士后Dylan Rankin等国际科学家团队正在测试一种新的机器学习技术，该技术可以在眨眼间在大型强子对撞机（LHC）浩瀚如海的数据中发现特定粒子特征。

新系统既复杂又迅速，可以在数据集不断变大变复杂的情况下，让我们得以一窥机器学习将在粒子物理学的未来发现中，会发挥怎样举足轻重的作用。

论文地址：

https://arxiv.org/pdf/1904.08986.pdf

机器学习成为攻坚利器

大型强子对撞机每秒造成大约4000万次碰撞。筛选如此大量数据，需要强大的计算机，来识别其中需要科学家去关注的碰撞，无论是暗物质还是希格斯粒子。

现在，费米实验室（Fermilab），欧洲核子研究中心（CERN），麻省理工学院，华盛顿大学和其他地方的科学家们已经测试了一种新的机器学习系统，与现有方法相比，该系统可将处理速度提高30到175倍！

传统方法目前每秒只能处理不到一个图像。相比之下，新的机器学习系统每秒最多可以查看600张图像。在训练期间，系统学会挑选出一种特定类型的后碰撞粒子模式。

哈里斯说：“我们所识别的碰撞模式，顶夸克是大型强子对撞机上探测的基本粒子之一。能够分析尽可能多的数据非常重要，每一条数据都带有关于粒子如何相互作用的有趣信息。“

等目前的LHC升级完成后，数据将以前所未有的方式涌入；到2026年，17英里的粒子加速器预计将产生20倍于目前的数据，同时图像也将以比现在更高的分辨率拍摄。总而言之，科学家和工程师估计大型强子对撞机所需的计算能力是目前的10倍以上。

哈里斯继续说道：“未来的挑战迫在眉睫，随着计算变得更加准确，以及探测出更加精确的效果，它变得越来越难。”

该项目的研究人员对他们的新系统进行了训练，以识别顶夸克的图像，这是最庞大的基本粒子类型，比质子重180倍。

“通过我们提供的机器学习架构，就能够获得高质量的科学质量结果，与世界上最好的顶夸克识别算法相媲美，”哈里斯解释说。“高速实施核心算法使我们能够灵活地在最需要的关键时刻增强LHC计算。”

EB级的数据集也能轻松处理

凭借大型数据集和高数据采集速率，高性能和高吞吐量计算资源是实验粒子物理计划的基本要素。这些实验在探测器技术的复杂性和粒子束的强度方面不断增加。

因此，粒子物理数据集的大小正在增加，就像处理数据的算法的复杂性一样。例如，大型强子对撞机（HL-LHC）的高亮度阶段，将提供比当前LHC运行多15倍的数据。

HL-LHC将以40 MHz的速率碰撞质子束，碰撞环境中每次碰撞的粒子数将是原来的5倍。

Compact Muon Solenoid（CMS）实验将针对HL-LHC进行升级，读取通道的数量将增加10倍。通过一系列在线过滤器，CMS旨在以5 kHz的速率存储HL-LHC碰撞事件。

这样的数据速率导致数据集的规模为EB级。未来的中微子实验，如深层地下中微子实验（DUNE）和宇宙学实验、平方公里阵列（SKA），预计将产生百亿亿字节的数据集。

大规模粒子物理实验面临着高吞吐量计算资源的挑战。在具有增强的并行化的专用硬件上新的异构计算范例，例如现场可编程门阵列（FPGA），能够提供具有极大潜在增益的解决方案。

机器学习算法在粒子物理中用于模拟，重建和分析中，不断增长的应用，自然地部署在这样的平台上。

实验证明，机器学习推理的加速即Web服务，代表了粒子物理实验的异构计算解决方案，只需要对当前计算模型的最小修改。

作为示例，我们重新训练ResNet50卷积神经网络，以展示LHC顶级夸克喷射标记的最先进性能，并应用ResNet50模型和中微子事件分类的迁移学习。

使用Microsoft的Project Brainwave来加速ResNet50图像分类模型，我们使用Brainwave作为云（边缘或本地）服务的实验物理软件框架实现了60（10）毫秒的平均推断时间，显示了一个因素导致模型推断延迟比传统CPU推断提高了30-175倍。

作为粒子物理计算模型的边缘或云服务，协处理器加速器可以具有更高的占空比，并且可能更具成本效益。

登录查看更多

相关内容

机器学习推理

关注 0

【ICML2020-伯克利】反直觉！大模型重压缩提升Transformer的训练和推理效率，47页ppt

专知会员服务

70+阅读 · 2020年7月1日

【MIT硬核新书】深度神经网络高效处理，82页pdf，Efficient Processing of DNN

专知会员服务

130+阅读 · 2020年6月22日

基于FPGA的机器学习硬件加速研究进展

专知会员服务

81+阅读 · 2020年6月20日

【硬核书】可扩展机器学习：并行分布式方法

专知会员服务

86+阅读 · 2020年5月23日

【2019机器学习大总结】机器学习和机器人:我的2019年领域状态

专知会员服务

54+阅读 · 2019年12月31日

如何加速NVIDIA gpu上的训练、推理和ML应用？108页ppt，Accelerating training, inference, and ML applications on NVIDIA GPUs

专知会员服务

61+阅读 · 2019年12月29日

【MIT】大型元学习数据集（Supplementary Materials for Niseko: a Large-ScaleMeta-Learning Dataset），麻省理工学院博士| Zeyuan Shang

专知会员服务

15+阅读 · 2019年12月24日

【NeurIPS2019教程】深度神经网络的高效处理:从算法到硬件架构

专知会员服务

61+阅读 · 2019年12月9日

【Google AI新论文EfficientDet】规模化高效化的物体检测，EfficientDet: Scalable and Efficient Object Detection(附pdf)

专知会员服务

27+阅读 · 2019年11月24日

【上海交通大学】分布式移动端机器学习综述论文，28页pdf

专知会员服务

45+阅读 · 2019年10月12日

CCAI 2019 | 张艳宁：高分辨率图像智能处理技术

中国人工智能学会

3+阅读 · 2019年8月14日

直播报名 | CUDA并行计算编程基础：如何利用GPU加速应用程序？

PaperWeekly

6+阅读 · 2019年7月15日

谷歌出品EfficientNet：比现有卷积网络小84倍，比GPipe快6.1倍

新智元

8+阅读 · 2019年6月2日

量子计算、边缘计算、数据挖掘前沿研究报告

人工智能学家

6+阅读 · 2019年3月16日

《常用算法之智能计算 (五) 》：模糊计算

数盟

9+阅读 · 2018年12月24日

在深度学习中处理不均衡数据集

极市平台

19+阅读 · 2018年11月27日

AutoML自动模型压缩再升级，MIT韩松团队利用强化学习全面超越手工调参

新智元

4+阅读 · 2018年9月12日

【学界】毫秒级图像去噪！英伟达、MIT新AI系统完美去水印

GAN生成式对抗网络

8+阅读 · 2018年7月17日

资源 | 25个深度学习开源数据集

人工智能头条

4+阅读 · 2018年4月22日

深度学习之图像超分辨重建技术

机器学习研究会

12+阅读 · 2018年3月24日

Compositional Generalization in Image Captioning

Arxiv

3+阅读 · 2019年9月16日

Advances in Natural Language Question Answering: A Review

Arxiv

5+阅读 · 2019年4月10日

Discovery and recognition of motion primitives in human activities

Arxiv

4+阅读 · 2019年2月4日

GAN Dissection: Visualizing and Understanding Generative Adversarial Networks

Arxiv

11+阅读 · 2018年12月8日

High Performance Software in Multidimensional Reduction Methods for Image Processing with Application to Ancient Manuscripts

Arxiv

4+阅读 · 2018年7月18日

Image Captioning

Arxiv

11+阅读 · 2018年5月13日

An application of cascaded 3D fully convolutional networks for medical image segmentation

Arxiv

9+阅读 · 2018年3月14日

CuLDA_CGS: Solving Large-scale LDA Problems on GPUs

Arxiv

3+阅读 · 2018年3月13日

Single-Perspective Warps in Natural Image Stitching

Arxiv

4+阅读 · 2018年2月13日

Caffeinated FPGAs: FPGA Framework For Convolutional Neural Networks

Arxiv

10+阅读 · 2016年9月30日

VIP会员