500万GB数据“拼”出黑洞照片!MIT美女博士还原终极算法

智东西(公众号:zhidxcom)
文 | 心缘

人类第一张黑洞照片真的是拍出来的吗?

昨夜,全世界都被人类史上首张非电脑合成的黑洞照片刷屏。不过,这张图片并不是不是普通意义上的黑洞照片,它不是直接快门一按就拍摄出来,而是由一支精锐的算法团队“拼”出来的。

500万GB数据“拼”出黑洞照片!MIT美女博士还原终极算法

这个算法团队的leader是个来自麻省理工学院的29岁漂亮小姐姐,她名为凯蒂 · 布曼(Katie Bouman),在计算机科学实验室中做让电脑解析图片和视频信息的研究。

布曼带领研究团队研发了一种机器学习算法CHIRP,使用地球上8台最顶尖望远镜的观测数据,将距离5500万光年的M87星云的照片拼接在一起,拼出了世界上第一张黑洞。

布曼在Facebook上分享了自己的成就,写道:“难以置信地看着我曾经制作过黑洞的第一张图片正在重建中。”

500万GB数据“拼”出黑洞照片!MIT美女博士还原终极算法

美国总统特朗普的女儿伊万卡也在twitter恭贺小姐姐:“今日,世界将看到第一个黑洞图——科学家Katie Bouman使得这个惊叹的成就成为可能。恭喜!像Bouman这样#WomanInSTEM万岁!”

500万GB数据“拼”出黑洞照片!MIT美女博士还原终极算法

随着这张照片在全球引发风暴,布曼小姐姐在TED的演讲也被挖了出来,揭秘这张黑洞照片究竟是怎样“拼”成的?

布曼曾在密歇根大学攻读学士学位,于2017年在麻省理工学院完成了博士学位,随后继续在麻省理工学院的EHT项目做了一段时间的博士后。今年秋季,她将开始在加州理工学院担任助理教授,重点研究计算机成像。

布曼小姐姐说,拍摄需要同时具备2个核心组件:一个地球大小的望远镜,和一个可以合成最终图片的算法

TED传送门:

一、一个地球大小的望远镜

天文学家经过经年累月的观察得出结论,体积足够小,而质量又大到能让恒星们围绕着旋转的唯一物体,就是超级黑洞,它的密度大到能吸进周围一切物体,甚至是光。

虽然黑洞本质上是看不见的,但如果以无线电波长放大,我们就会看一圈光线由围绕黑洞的等离子体引力透镜产生,这个黑洞在背后明亮物质的衬托下,留下了一个圆形的暗影,而它周围那明亮的光环勾勒出黑洞的边界。这个边界称为事件视界。

500万GB数据“拼”出黑洞照片!MIT美女博士还原终极算法

黑洞离我们那么遥远,从地球上看,还没月球上的一个橘子大。这导致给它拍照无比艰难。

由于衍射现象,我们能看到的最小物体是有限制的,而当我们看到的东西越来越小时,望远镜需要变得很大。

500万GB数据“拼”出黑洞照片!MIT美女博士还原终极算法

但即便是地球上功能最强的光学望远镜,其分辨率甚至还不足以让我们得到月球表面的图片。史上从地球上拍摄的最清晰的月球表面图片,包含约1.3万个像素,每个像素包含超过150万个橘子,我们需要一个和整个地球一样大的望远镜,来看清月球上的橘子,以及黑洞。

500万GB数据“拼”出黑洞照片!MIT美女博士还原终极算法

造出这么大的射电望远镜无异于天方夜谭,不过,办法总是人想出来的。一个事件视界望远镜(Event Horizon Telescope,EHT)国际合作项目就此诞生了。这个项目秘密进行了三年,直到2016年才首次公布。

500万GB数据“拼”出黑洞照片!MIT美女博士还原终极算法

通过国际合作,该项目团队通过电脑建造了一个与地球一样大的虚拟望远镜,由8个分布在地球不同地方(智利ALMA、智利APEX、西班牙IRAM、夏威夷Maxwell、墨西哥LMT、夏威夷SMA、美国ARO、南极SPT)的无线电望远镜,组成一个遍及全球的网。

500万GB数据“拼”出黑洞照片!MIT美女博士还原终极算法

这些无线电模拟望远镜的光圈,可以产生捕捉探索了银河系中心的超大质量黑洞——射手座A所需的分辨率。

每个望远镜都有用于存储数据的大型硬盘驱动器,望远镜之间协同工作,通过原子钟的准确时间相连,各地研究团队通过收集上万千兆字节的数据,来定位黑洞的边界光线。

500万GB数据“拼”出黑洞照片!MIT美女博士还原终极算法

布曼说,如果上文我们提到的地球大小的望远镜被造出来了,就相当于一个巨大的球形迪斯科灯,每一面镜子都会收集光线,我们就可以将这些光线组合成图片,从而看到清晰的黑洞边界。

但假设我们将大多数镜子移走,只保留几片,我们仍可以尝试将信息合成图片。

留下来的这几片镜子就是地球上的八台望远镜们,但它们对于制成一张黑洞照片来说还远远不够。

500万GB数据“拼”出黑洞照片!MIT美女博士还原终极算法

还好,地球一直在转圈。

每当地球旋转时,这些望远镜就可以收集到新的信息,我们就可以看到图片的不同部分。

二、夜产200万GB的庞杂数据源

布曼的团队所开发的算法,可以将迪斯科灯上空缺部分填满,从而“拼”出黑洞照片。

2017年4月,8台望远镜终于凑出了时间,同时来观测黑洞,每晚产生的数据是2PB=2000TB=2000000GB。

2017年6月,布曼收到来自超过半吨的硬盘,里面装着来自上述八台望远镜的5PB黑洞观测数据,相当于5000年的mp3,或者40000人提供的一生的自拍。

500万GB数据“拼”出黑洞照片!MIT美女博士还原终极算法

▲布曼收到的黑洞图片数据硬盘

但是,硬盘里的数据那么繁杂,怎么知道谁才属于黑洞呢?

在人力所不能及的地方,就是机器学习出场的时候!

从银河中心传到各个望远镜的时间并完全一致,当不同的望远镜收到的两股无线电波相遇,就产生了“干涉”。

然而,无线电波穿过大气层时,速度会变慢,结果时间测定就不够准确。为了解决这一问题,布曼所在的研究团队提出了CHIRP算法,让每个测量值都是三台望远镜相乘的结果,抵消了大气导致的误差。

布曼他们用2年时间处理这些数据,终于在2019年4月从这些数据中还原出了这个黑洞的照片。

三、一个可以合成最终图片的算法

布曼所研发的CHIRP算法,就是使用Patch priors进行连续高分辨率图像重建,补足八个望远镜提供的有限数据,捕捉黑洞的边界,生成一张看起来像是黑洞图片。

由于望远镜数量的限制,样本数量有限,可能有无数张图片符合望远镜所测量到的信息,其中有些图片可能会更贴近我们想象中的黑洞,有些图片则完全不像。

首先,按照图片是真正黑洞图片的可能性进行排序,选出可能性最高的那张图。

500万GB数据“拼”出黑洞照片!MIT美女博士还原终极算法

但问题是,没人见过真正的黑洞,那么什么样的图才像真正的黑洞呢?黑洞的结构又该如何假设呢?

使用像《星际穿越》里黑洞图那样的模拟图?这并非不可行,只是存在一个问题,如果爱因斯坦的理论是错的,怎么办?

布曼说,他们希望获得尽可能真实的图片,但如果在算法掺入太多爱因斯坦的公式,最终只会看到自己希望看到的。但是,你怎么就能确定我们不能在宇宙中心看到一头大象呢?

500万GB数据“拼”出黑洞照片!MIT美女博士还原终极算法

不同类型的照片有完全不同的特征,人们可以轻松分辨一张黑洞模拟图和日常生活照之间的差别,我们需要在不过度提供某类照片特征的情况下,让算法知道一张正常的图片应该是什么样。

一个办法就是向算法输入拥有不同特征的图片,然后看看这些图片会如何影响重建的结果。如果不同类型的图片输出了相似的结果,那么就说明此前对图片的假设并没有导致结果出现太大偏差。

这有点像让三个来自不同国家的法医素描师,根据同样的文字描述来作画,如果他们画的差不多,那么就相对确定他们各自的文化背景没有影响到他们的画。

500万GB数据“拼”出黑洞照片!MIT美女博士还原终极算法

将不同图片的特征赋予算法的一个方法,就是使用现有图片的碎片特征。因此,布曼将图片分解成无数个小图片,然后像拼图一样处理这些小图片,最后获得符合望远镜所测量数据的完整图片。

不同类型的照片有完全不同的拼图碎片,所以当使用相同的数据和截然不同的拼图来重现图像时,会发生什么?

500万GB数据“拼”出黑洞照片!MIT美女博士还原终极算法

布曼先从黑洞模拟类的拼图开始,拼成比较符合我们想象的黑洞的样子。但得到这个结果是否仅仅是因为我们拿的是黑洞模拟拼图呢?

随后,他们又拿宇宙各种天体的照片、人们日常生活的照片去拼图,均得到相似的图片。

500万GB数据“拼”出黑洞照片!MIT美女博士还原终极算法

布曼他们做的另一件事,是用同一组拼图获得不同类型的源图片。所以在模拟实验中,他们假设黑洞看起来像一个非黑洞天体,比如像一头大象。

当下面一排由算法算出的图片与上排真实图片十分相似时,他们就对算法有了更多信心。

500万GB数据“拼”出黑洞照片!MIT美女博士还原终极算法

此处所有图片都是由拼接日常照片得出。

所以,一张人们从未见过的黑洞照片,最终却可能由人、楼房、树、小猫、小狗等我们熟悉的日常图片构成。

这样的想法使得拍摄第一张黑洞照片成为可能,并将爱因斯坦的理论置于其最严格的测试之中; 所观察到的黑洞的大小和形状都可以通过广义相对论方程来预测,同时使得科学家们每天所依靠的著名理论有望被校验。

布曼论文传送门:Computational Imaging for VLBI Image Reconstruction
https://dspace.mit.edu/handle/1721.1/103077

结语:第一张黑洞照片背后的价值

最后,附送我们在EHT官网上找到了183M的黑洞超高清大图(7416×4320)的压缩版:

500万GB数据“拼”出黑洞照片!MIT美女博士还原终极算法

很遗憾,我们被刷屏了连续两天的黑洞照片并不是真正的“黑洞照片”,更合适的理解是科学家们对庞大的黑洞观测数据进行合成后的一种“视觉呈现”,并通过这一图像,验证了爱因斯坦黑洞理论的成立,以及黑洞与人类之前想象中形象的相似性。

但这个照片凝聚了来自全世界的天文学家、物理学家、数学家和工程学家们智慧和汗水的结晶,他们用创新的思维和不同常人的毅力完成了这一人类史上伟大的壮举。

史上第一次拍摄黑洞事件视界图像的面纱终于被揭开,而人工智能算法在其中的作用不可估量。英国媒体Dailymail认为,事件视界望远镜的观测可以算作本世纪最重要的科学突破。

正如布曼所言,就像所有新发现一样,这只是一个开始。