作者 | 微软亚洲研究院
本文转自「微软亚洲研究院AI头条」公众号。
编者按:从人类诞生的那一刻起,人们对宇宙奥秘的求索就从未停止。今天,天文学已经进入了一个具有多波段、多信使的海量观测数据的黄金时期,人工智能技术将对天文领域产生深远影响。近日,美国亚利桑那大学天体物理学博士、清华大学天文系蔡峥教授受邀来到微软亚洲研究院,与我们分享了天体物理研究与人工智能方法相结合的前沿探索。
嘉宾介绍
蔡峥,2015 年获得美国亚利桑那大学天体物理学博士学位,2015 年—2019 年在美国加州大学圣克鲁兹分校从事博士后研究,获美国太空总署(NASA)“哈勃学者”(Hubble Fellow)称号。2019 年任清华大学天文系助理教授(tenure track),同年入选中组部第十五批青年千人计划,共发表论文 30 余篇,引用 1500 余次,担任《Nature》等杂志审稿人。他发现宇宙早期大尺度结构以及发现宇宙早期最亮的星云,被美国 CNN,英国 BBC 等主流媒体报道。蔡峥领导的多项研究入选哈勃太空望远镜、以及地面最大望远镜的观测计划。他也参与多个新望远镜与探测仪器研发,如位于智利的新的世界最大光谱巡天望远镜等。
经常有人问我做什么,我说“天体物理”,他们就说:“那你给我算个命吧”,可能跟大家最有关的就是星座。但是我们宇宙研究究竟在做什么呢?中国的一些哲学家在 2000 多年前就说了,“上下四方谓之宇,古往今来谓之宙。”所谓宇宙,就是空间和时间上的研究。
我们先从空间上看。离地球最近的恒星是太阳,如果到一光年尺度,就可以看到离太阳最近的恒星。到几百、上千甚至到上万光年,你可以看到银河系的旋臂。到了 10 万光年,你就可以看到银河系的全貌和它周围的星系。而到上百万、上千万光年,我们发现还有很多像银河系一样的星系。所有星系在宇宙中的三维排布是一个纤维网的大尺度结构。我们的血管还有蜘蛛网也是拓扑结构,是非常相似的。
图1:人类对宇宙在空间上的认识
在图 1 中,人们脑海中的星系大概是最左边的样子,但是,近二三十年,我们发现星系实际上处于巨大的暗物质当中,可见部分只占整个暗物质晕非常小的比例,暗物质是可见物质的六倍多。但是你为什么感觉不到呢?因为我们所有的感受都是因为电磁相互作用,但是暗物质和我们只有引力作用,除此之外可能还存在一点点弱相互作用,但这还只是理论假设。
大家可能听说过清华大学在 2400 米的地下有一个锦屏山地下实验室。为什么在 2000 多米的地下可能探测到暗物质呢?因为在那里所有可见物质,不管能量多高,都已经被挡住了。如果能观测到那里的粒子,那应该就是不和正常物质有电磁相互作用的暗物质。目前锦屏山还没有发现任何痕迹,但暗物质是客观存在的,已经有科学家通过星系的旋转曲线等多种独立的天文方法推测出来了。星系就是被暗物质凝聚在一起,整个暗物质晕又呈纤维网状排布。这是空间上我们研究的一个尺度。
从时间上说,我们知道宇宙中有一次大爆炸,宇宙正在膨胀中。宇宙起源离现在大概 130 亿年,爆炸后它一直在减速膨胀,但在距今 70-80 亿年,它开始加速膨胀。这也是我们用很多方法实际观测到的。为什么会加速膨胀呢?因为宇宙中还有一种更神秘的东西叫暗能量,在宇宙膨胀到一定程度,物质密度已经极低的情况下,它能驱动宇宙的加速膨胀。在宇宙中,暗能量占 70%,暗物质占近 26%,可见物质只占 4% 左右。
图2:人类对宇宙在时间上的认识
现在天文学进入了一个黄金时期。我们进入了多波段、多信使的时代,从最短的波,到最长的波,我们在全波段都有一些比较好的设备;不光能看电磁波,还能看引力波。引力波也是最近发现的,两黑洞并合时会产生一种波,这种波很弱,但是能让整个度规或时空发生变化。引力波实验是相对论和量子力学最完美的一个结合。
天文学与我们的生活也息息相关。我们手机用的锂电池,它的材料就是大爆炸三分钟以内的产物。我们戴的金戒指,是八个太阳质量以上的超大恒星爆炸才产生的东西。太阳爆炸最多形成铁,而这些金是太阳系周围的一些超大恒星爆炸了,金经过亿万年终于飘到地球上,然后被我们捞起来做成戒指。我们身体里所有的碳和铁都是超新星爆炸产生的,人的意识是怎么来的我们还不知道,但是构成人体的材料都来自宇宙。当然,最后地球也会被太阳吞食,所有原料也都会进入星际空间,再形成一颗恒星,所以卡尔·萨根曾经说过,宇宙在哪儿呢?宇宙实际就在我们的身体里。从这个意义上来说,我们每个人都是“来自星星的你”。
天文学也将进入一个大数据时代,在这个过程中,微软还做了巨大的贡献。在智利,有全球最大的光学望远镜——大型综合巡天望远镜(Large Synoptic Survey Telescope, LSST),它能对太空进行不间断地扫描,预计将发现 100 亿个新星系,每年能产生 10 PB 数据。比尔·盖茨也曾捐赠 1000 万美元给该项目。
我觉得天文学是人工智能大数据应用的最好领域。在现在的天文学研究里,即使只是用了一点点和人工智能相关的技术,就能对整个天体物理领域产生深远影响。虽然人工智能技术在天体物理领域的应用还处于起步阶段,但人工智能已经开始真正参与人类对自然界新规律的发现。今天我想给大家举一些人工智能在天体物理中应用的例子。
图7:宇宙学的神经网络可以用星系的三维分布预测宇宙学参数
看到这些结果,我一直在思考。第一点是深度学习为什么会比一些传统的数学方法好?我觉得它可能是找到一些额外的信息,比如说以前我们用两点相关函数,但是深度学习相当于找到了三点相关函数甚至是四点相关函数,它比我们找到了更多的关系。
第二个问题是,既然人工智能比传统方法进步了那么多,那么擅长解决逆问题,那它能不能进一步告诉我们这些参数之间的规律或定律。比如刚刚所说的深度学习在高噪声下识别出吸收线的问题,比人还厉害!其实,这样的吸收体,是因为海森堡发现能量和时间存在“不确定性原理”(uncertainty principle)。只要你承认量子力学有不确定性原理,时间和能量并不能同时测准,位置和动量也不可能同时测准,就必然产生这样的吸收。还有引力透镜实际上代表了爱因斯坦一个非常深刻的思想,就是质量告诉时空怎么弯曲、时空告诉光线怎么运动。爱因斯坦场方程可以写成非常优美的一个公式。计算机在深度学习大量知识后,能不能也推出像这样有深度的原理或公式呢?
如果这个对人工智能来说太复杂了,那能不能试着让人工智能找出开普勒第三定律呢?这是大家高中都学过的,由开普勒根据第谷在 16 世纪精度有限的实测数据提出的,他发现行星公转周期的平方和行星公转轨道半长轴的三次方成正比。这是牛顿万有引力定律的重要基础,也是引力平方反比例的直接推论,而平方反比例是引力波静质量为零,以光速传播、甚至光子静质量为零的重要基础。我觉得计算机到现在仍然总结不出来这么优美、深刻的公式,它算出来可能会很精确,有很多小数,因为它还发现不了数字背后深刻的规律。大自然就是这么神奇,这也许是人工智能未来的方向之一。
图8:正在规划建设中的南天大视场光谱巡天望远镜(SSST),它和其他望远镜的协同观测,将有望将我国的天文研究带入新时代。
最后我来讲一下天文在大家生活中的一些应用吧。比如 CCD(感光耦合元件),其实上世纪 70 年代 NASA 应用 CCD 最重要的原因之一,就在于为了天文观测更高的信噪比,因为当时仅靠胶片看不清楚宇宙图片,所以做出了一个可以持续曝光的元件。经过 40 年的发展,我们手机里的 CCD 已经完全改变了大家的生活。没有 CCD 大概也不会有人工智能,因为如果都是胶片,就不可能把图片数字化。WIFI 也是为了发现天文的“霍金辐射”发展出来的,GPS 中也应用了广义相对论的原理。
如果你问我天文有什么用,我还是坚持会说,天文实际上没用,它主要是为了满足人类的好奇心。但我觉得天文学最“有用”的一点就在于,它能将我们眼前的未知变成身后的已知。将未知变成已知,这才是人类文明进步中最重要的一个能力和动力。我希望有朝一日,我们中国也能加入这个俱乐部,真正能够有更多引领人类文明、知识灯塔的科学工程,这也是对我们大学 2050 年前建立世界学术殿堂的必然要求。
提问一:刚才说通过爱因斯坦环可以预测暗物质晕的分布,这个分布是唯一的吗?
答:这个问题特别好,我相信是不唯一的,比如多几个子结构可能能产生差不多的爱因斯坦环,或者取决于背景和前景的星系。但是从现在训练出来的结果来看,虽然真实分布可能有一些微小的差别,但是它能把主要的结构预测得非常好。这点其实非常神奇。
提问二:对于某一个宇宙规律,假如我知道函数和参数形式,当有很好的数据的时候,拟合参数的能力会很强。但大部分时候,宇宙的规律,参数的形式,这些我们并不知道。那么怎样让我们有些先验,去知道这些规律和参数形式?是不是能把一些公理、定理表示到计算机系统里,把它当作一种先验,再去推导其他规律。
答:这个问题也非常好,首先我们还不知道怎么解决。我跟微软的沈向洋博士(微软全球执行副总裁)和 UCSD 的苏浩教授都聊过,他们也觉得可能得建立一个公式集,让计算机先了解人类已有公式的形式,让它知道怎么尝试。(提问者:也可以让计算机跟我们建议一些候选的公式形式,最后还需要人去证实。)对,一个是需要人去证实,第二,实际上每一条公理背后都有更深刻的哲学层面的原理,比如说光速不变原理,这些可能只能靠人来归纳,但是能找到公式可能已经会是下一步很厉害的一个进展了。
提问三:我们其实已经知道爱因斯坦环是怎么形成的了,那我们做这个研究的目的,是想要知道那个地方有什么、是什么样的,还是说我想发现一些新的东西?
答:这个问题也很深刻,就像你说的那样,这个研究确实不会给我们增加新的知识,但它铁证如山地告诉我们的是那块暗物质晕长什么样,它让我们更一步确信了暗物质的存在,并且暗物质比可见物质多得多。
张钹院士:人工智能的魅力就是它永远在路上 | CCAI 2019
Facebook 自然语言处理新突破:新模型能力赶超人类 & 超难 NLP 新基准
巴赫涂鸦创作者 Anna Huang 现身上海,倾情讲解「音乐生成」两大算法
点击“阅读原文”加入 ICCV 顶会交流小组
微软亚洲研究院(Microsoft Research Asia)位于北京市海淀区中关村丹棱街5号微软大厦2号楼12-14层,是微软研究院之一,也是微軟在海外最大的研究院及微软在亚洲的第一個研究院,2004年被麻省理工学院《技术评论》称为“世界上最火的计算机实验室”。经过多年的发展,微软亚洲研究院拥有超过230名全职研究员、工程师与超过250名访问学者与实习生。