29岁MIT博士小姐姐努力6年、处理半吨硬盘数据，“洗”出人类第一张黑洞照片

会员服务 ·

29岁MIT博士小姐姐努力6年、处理半吨硬盘数据，“洗”出人类第一张黑洞照片

2019 年 4 月 11 日 量子位

黑洞栗郭一璞发自凹非寺
量子位报道 | 公众号 QbitAI

人类第一次看到黑洞照片之后，一名小姐姐的照片也跟着刷了屏。

她激动得十指交叉，身边的电脑屏幕上，黑洞的样子模糊显现出来，一行行代码在旁边滚动。

在Facebook上发出这张照片时，小姐姐说：

看着我做的第一张黑洞照片一点点“洗”出来，真是不可思议。

“我做的第一张黑洞照片”？

对，全人类看到的第一张黑洞照片，就是她“做”的。

这位小姐姐名叫Katie Bouman (凯蒂 · 布曼) ，今年29岁。她带领算法团队“洗”出了这张照片，也成了第一批“看到”黑洞的人类之一。

人类“拍”到的第一张黑洞照片，并不是像我们拿手机拍照那样，点下屏幕就好，而是需要分布在全球各地的许多天文望远镜在同一时间“按下快门”，记录无线电数据。

然后，再依靠机器学习算法，把数据拼到一起，重建出图像。而这个“洗照片”的任务，就是凯蒂在MIT读博时做的项目。

搞定半吨硬盘

六年前，凯蒂开始了她在MIT CSAIL的博士生涯，想要研究“如何看见或者测量肉眼看不见的东西”，黑洞简直是再合适不过的研究对象了。因此，她加入了EHT（事件视界望远镜）团队。

凯蒂的本科读的密歇根大学的电气工程，硕士读的是MIT的电气工程和计算机科学专业，可以说，对于天文方面，她当时一窍不通。

就这样，她开始研究“把多台天文望远镜获得的数据合成一张黑洞照片”的算法。

一搞就是三年的秘密工作。在2016年之前，这个项目一直是保密的，小姐姐研究这么激动人心的项目，却憋着不能说，连自己的家人都没告诉。

而且直到2017年6月，凯蒂的算法才终于可以开始实战。她收到了一堆装着黑洞观测数据的硬盘：

这些硬盘足有半吨，从世界各地用飞机运来。数量之大，甚至让人联想到1969年玛格丽特·汉密尔顿为阿波罗11号登月而准备的一人高的代码。

这些硬盘中的数据，来自智利、夏威夷、南极洲、亚利桑那、西班牙、墨西哥六个地方的一共八台天文望远镜。

天文望远镜获取的数据量非常大，一晚上就能收集到2PB（约2000TB）。如此庞大的数据难以用网络传输，必须装到硬盘里，空运到MIT。

而且，这半吨硬盘里的数据不仅仅是黑洞，还包含天空中的各种复杂、凌乱的数据，凯蒂要靠这些数据，拼出一张完整的黑洞写真。

本来，根据射电望远镜数据还原天体图像需要人类天文学家参与。他们以自己的专业知识，将成像算法指引到他们认为正确的方向。

然而面对PB级稀疏、嘈杂的数据，想靠人力从中找出图像太难了。于是，他们使用了机器学习方法。

虽然这支团队已经花了好几年的时间构建算法，在合成数据上实验，但直到有了这些硬盘，他们才能真正知道他们的算法，是不是真的能捕捉到不可见的黑洞。

这项任务究竟什么样？

就好比，你把一颗鹅卵石扔进池塘，却还想看到它的样子。

一石激起的涟漪

入水的瞬间，石子会激起一圈一圈的涟漪。

只要这些涟漪，就算石子沉到水下，也依然可以通过算法重现它的模样。

黑洞，就像是这颗已经看不见的鹅卵石。

不同的望远镜收到的两股无线电波相遇，就起了涟漪，学名叫做“干涉”。

而凯蒂提出的CHIRP算法，便是依靠干涉来重建黑洞的。

具体来说，从银河中心传来的无线电信号，到达两台望远镜的时间是不一样的，干涉也是这样发生的。

所以说，重建黑洞照片，最重要的就是时间差。

可是，地球有厚重的大气层保护着，无线电波穿过大气层的时候，速度会变慢，时间的测定也就不够准确了。

所以，小姐姐想出了一种机智的方法，来解决这个问题：

如果每一个测量值，都是三台望远镜 (不是两台) 相乘的结果，大气带来的误差就能相互抵消了。

这样一来，算法有了，团队便开始“冲洗”黑洞的照片了。

一洗就是两年

半吨硬盘的数据量处理起来，工程量还是太大了。

洗照片的过程中，一度有四个团队同时工作，每个团队负责分析一部分数据。

原本预计一年洗好的照片，花了两年时间才让世界看到。

除了耗时之外，小姐姐也说过，团队就是一口大锅，里面有天文学家，物理学家，数学家，工程师……如果不是这样，也不可能完成这个从前看来不可能的任务。

而她的工作，是在照片终于合成成功并公布之后，凯蒂终于可以告诉全世界，合成第一张黑洞照片的意义：

这是我们了解黑洞的一个窗口，从这里开始，我们验证了我们的物理规律。虽然我们已经靠理论推断出黑洞的样子，但只有亲眼所见才能验证，因此，看到黑洞图像也是巨大的科学进步。

现在，凯蒂早已博士毕业，继续在MIT的EHT项目做了一段时间的博士后之后，即将成为加州理工大学的助理教授。

庞大的团队

除了凯蒂之外，整个团队还有很多人，他们来自各种各样的领域。

凯蒂在2017年的TED演讲中分享了团队的核心成员名单，包括：

Sheperd Doeleman
哈佛大学黑洞计划观测助理主任

Andrew Chael
哈佛大学黑洞计划研究生

Lindy Blackburn
哈佛大学黑洞计划射电天文学家

Michael Johnson
哈佛 - 史密森尼天体物理中心研究员

Katherine Rosenfeld
哈佛 - 史密森尼天体物理中心研究员

Hotaka Shiokawa
哈佛 - 史密森尼天体物理中心博士后

William T. Freeman
MIT计算机科学与人工智能实验室教授

Vincent Fish
MIT Haystack天文台研究科学家

Kazumori Akiyama
MIT Haystack天文台博士后

Daniel Zoran
DeepMind研究科学家

传送门

最后，如果你对他们所用的算法感兴趣，可以读一下这篇论文：

Computational Imaging for VLBI Image Reconstruction
https://dspace.mit.edu/handle/1721.1/103077

— 完 —

订阅AI内参，获取AI行业资讯

活动报名|多模态视频人物识别

加入社群

量子位AI社群正在招募，量子位社群分：AI讨论群、AI+行业群、AI技术群；

欢迎对AI感兴趣的同学，在量子位公众号（QbitAI）对话界面回复关键词“微信群”，获取入群方式。（技术群与AI+行业群需经过审核，敬请谅解）

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

喜欢就点「好看」吧 !

登录查看更多

相关内容

麻省理工学院

关注 2

深入学习的成功来自于三个方面：高效的算法、强大的硬件和大规模的数据集。我们的实验室针对前两个方面，麻省理工学院汉实验室正在寻找有动机的学生在深入学习和计算机架构领域来解决有影响的人工智能问题，具有较轻的模型和较高的计算效率。

【MLSS2020】最新《几何深度学习》教程，帝国理工学院Michael Bronstein教授，166页ppt

专知会员服务

111+阅读 · 2020年7月10日

【实用书】Python机器学习Scikit-Learn应用指南，247页pdf

专知会员服务

270+阅读 · 2020年6月10日

【纽约大学】最新《离散数学》笔记，451页pdf

专知会员服务

131+阅读 · 2020年5月26日

少标签数据学习，54页ppt

专知会员服务

205+阅读 · 2020年5月22日

干净的数据：数据清洗入门与实践，204页pdf

专知会员服务

164+阅读 · 2020年5月14日

【经典】《上海交通大学生存手册》，一本让你在大学活出精彩的秘籍

专知会员服务

203+阅读 · 2020年4月18日

【MIT-Google】反思小样本图像分类:一个好的嵌入是你所需要的全部?

专知会员服务

36+阅读 · 2020年3月28日

【帝国理工学院】医疗影像中「因果性」至关重要，Glocker这52页ppt讲述医疗机器学习因果性

专知会员服务

51+阅读 · 2020年3月15日

【经典书】Python计算机视觉编程，中文版，363页pdf

专知会员服务

144+阅读 · 2020年2月16日

MATLAB玩转深度学习？新书「MATLAB Deep Learning」162页pdf

专知会员服务

103+阅读 · 2020年1月13日

印度首次挑战登月告败，一步之遥≈多大差距？

人工智能学家

4+阅读 · 2019年9月7日

Deep-CEE：AI深度学习工具，帮助天文学家探索深空

深度学习探索

5+阅读 · 2019年7月21日

30秒让图片变裸照，使用无门槛，这个软件比Deepfake杀伤力更大

AI100

28+阅读 · 2019年6月28日

爱因斯坦未披露演讲公开了？不，这只是一张图、一段音合成的AI视频

机器之心

7+阅读 · 2019年6月21日

日本“妻子”机器人上线1小时被抢空，AI时代人类可还有未来？

全球人工智能

13+阅读 · 2019年5月5日

相知吕琳媛，复杂网络圈里一个才华横溢的萝莉教授

德先生

6+阅读 · 2019年3月8日

麻省理工（MIT）：高校学科划分是人类自缢的绳索

人工智能学家

4+阅读 · 2018年9月6日

人工智能的阴暗面

计算机与网络安全

6+阅读 · 2018年1月8日

天天写代码，觉得自己特别苦逼？嗯，还有20年AI就来解放你

量子位

3+阅读 · 2017年12月11日

125位画师用7年制作了一部油画电影，交给人工智能会如何？

钛媒体

4+阅读 · 2017年12月4日

Towards a Human-like Open-Domain Chatbot

Arxiv

14+阅读 · 2020年1月27日

Adversarial NLI: A New Benchmark for Natural Language Understanding

Arxiv

4+阅读 · 2019年10月31日

Compositional Generalization in Image Captioning

Arxiv

3+阅读 · 2019年9月16日

Towards Automated Machine Learning: Evaluation and Comparison of AutoML Approaches and Tools

Arxiv

3+阅读 · 2019年9月3日

Unsupervised Image Captioning

Arxiv

7+阅读 · 2018年11月27日

Image Captioning

Arxiv

11+阅读 · 2018年5月13日

Learning to Guide Decoding for Image Captioning

Arxiv

6+阅读 · 2018年4月3日

Single-Perspective Warps in Natural Image Stitching

Arxiv

4+阅读 · 2018年2月13日

Towards Synthesizing Complex Programs from Input-Output Examples

Arxiv

3+阅读 · 2018年1月30日

Fluency-Guided Cross-Lingual Image Captioning

Arxiv

3+阅读 · 2017年8月15日

VIP会员