在宇宙学模拟中培训的“深度学习”算法在分类Hubble图像中的真实星系上令人惊讶地成功。第一排:来自计算机仿真的高分辨率图像,通过三个演化阶段(之前,期间和之后的“蓝色块”阶段)。中间排:在哈勃太空望远镜观察的情况下,从进化的三个阶段的计算机模拟中的计算机模拟相同的图像。底行:哈勃太空望远镜图像的遥远幼年星系分类为培训的深层学习算法,以识别Galaxy Evolution的三个阶段。每个图像的宽度约为100,000个轻微的岁月。前两行的图像信用:Greg Snyder,太空望远镜科学院,Marc Huertas公司,巴黎天文台。对于底行:HST图像来自宇宙装配近红外深度紫外线传统调查(CANDELS)。
在宇宙学模拟中训练的“深度学习”算法在分类Hubble图像中的真实星系上令人惊讶地成功。
一种称为“深度学习”的机器学习方法,已被广泛用于人脸识别和其他图像和语音识别应用,在帮助天文学家分析星系的图像并理解它们的形式和发展方式的承诺。
在一项新的研究中,在天体物理学期刊上被公布,研究人员使用了计算机模拟的星系形成来训练深度学习算法,然后在从哈勃太空望远镜的图像分析星系的图像时令人惊讶地证明了。
研究人员使用模拟中的输出来生成模拟星系的模拟图像,因为它们将通过哈勃太空望远镜看观察。模拟图像用于训练深度学习系统,以识别在模拟中先前识别的星系演变的三个关键阶段。研究人员然后给了系统一组大量的实际漏洞图像来分类。
结果表明,神经网络的模拟和真实星系的分类中存在显着的一致性。
“我们并没有想到这一切都是成功的。我惊讶于这是多么强大,“乔克斯·乔克布拉克(Santa Cruz)的Santa Cruz粒子物理研究所的成员(UC Santa Cruz)的Santa Cruz学院成员说。“我们知道模拟有局限性,所以我们不想制造太强大的索赔。但我们不认为这只是一个幸运的侥幸。“
星系是复杂的现象,在数十亿年的发展中改变了他们的外观,星系的图像只能及时提供快照。天文学家可以深入了解宇宙,从而“及时回到时间”以查看早期的星系(由于它需要光线才能沿着宇宙距离的时间),但在算法中才能在仿真中进行。将模拟星系与观察到的星系进行比较可以揭示实际星系的重要细节及其可能的历史。
蓝块
在新的研究中,研究人员对富含气体的星系的进化中的仿真现象特别感兴趣,当大气流入一个小型,致密,恒星形成区域的星系燃料形成的中心时被称为“蓝块”。(年轻,热的星星发出短的“蓝色”波长的光,所以蓝色表示一个带有活跃的星形形成的星系,而较老的,凉爽的星星发出更多“红色”光。)
在模拟和观测数据的两个中,计算机程序发现,“蓝块”阶段仅发生在具有特定范围内的肿块的星系中。随后是在中心区域淬火星形形成,导致紧凑的“红色块”相。质量范围的一致性是一个令人兴奋的发现,因为它表明深度学习算法正在识别它自己的模式,这些模式是由实际星系中发生的关键物理过程产生的模式。
“这可能在一定尺寸的范围内,星系在UC Santa Cruz的天文学和天体物理学教授emeritus emeritus emeritus emeritus说。
研究人员使用了由Primack和国际合作者开发的最先进的Galaxy模拟(Vela模拟),包括丹尼尔柯尼诺(海德堡大学),他运行模拟,以及Avishai Dekel(希伯来大学) LED分析和解释它们并根据它们开发了新的物理概念。然而,所有此类模拟都是有限的,因此在他们捕获Galaxy形成的复杂物理学的能力中。
特别地,本研究中使用的模拟不包括来自活性银核的反馈(由于气体通过中央超大黑洞增加气体,从辐射注射能量)。许多天文学家认为这一过程是一个重要因素调节星系中的星形形成。然而,对遥远的年轻星系的观察似乎表明了导致模拟中看到的蓝核阶段的现象的证据。
坎德拉
对于观察数据,团队使用了通过CANDELS项目(宇宙装配近红外深度紫外线调查)获得的星系的图像,这是哈勃太空望远镜历史上最大的项目。第一作者Marc Huertas-Company,巴黎观测所和巴黎Diderot大学的天文学家已经完成了使用公开可用的坎德拉数据将深入学习方法应用于Gensaxy分类的开创性工作。
Koo,一位Candels Co-Conductigator,邀请Huertas-Company访问UC Santa Cruz继续这项工作。谷歌为他们的深度学习提供了对天文学的支持,通过研究资金的礼品来到koo和primack,允许惠佩斯公司在圣克鲁斯的过去两个夏天,在2018年夏天的另一个访问计划。
“这个项目只是我们的几个想法之一,”Koo说。“我们想选择一个过程,即理论家可以根据模拟方式清晰地定义,这与Galaxy看起来的外观有关,那么在观察中将寻找深度学习算法。我们刚刚开始探索这种研究的新方法。这是一种新的融合理论和观察方式。“
多年来,Primac一直与UC Santa Cruz的Koo和其他天文学家密切合作,比较他的团队模拟Galaxy形成和随着Campers观测的演变。“在帮助我们理解坎德尔斯观察方面,Vela模拟已经取得了很大的成功,”Primack说。“但没有人有完美的模拟。随着我们继续这项工作,我们将继续发展更好的模拟。“
根据Koo的说法,深度学习有可能揭示人类无法看到的观测数据的方面。缺点是算法就像一个“黑匣子”,所以很难知道机器使用的数据中的功能是用来进行分类的。然而,网络询问技术可以识别图像中的哪些像素对分类贡献,并且研究人员在其网络上测试了一种这样的方法。
“深入学习寻找图案,机器可以看到这种模式,我们人类不会看到它们,”Koo说。“我们希望在这种方法中进行更多的测试,但在这个概念证明研究中,机器似乎在数据中成功地找到了在模拟中确定的Galaxy Evolution的不同阶段。”
在未来,他说,由于大型调查项目和新望远镜等大型舞台调查望远镜,詹姆斯韦伯太空望远镜等大型舞台调查望远镜和广泛的红外测量望远镜,将有更多的观察数据来分析。深度学习和其他机器学习方法可能是有助于了解这些大规模数据集的强大工具。
“这是在天文学中使用先进人工智能的非常激动人心的时期,”Koo说。
除了Primack,Koo和Huertas-company之外,本文的同志包括在耶路撒冷希伯来大学的Avishai Dekel(以及UC Santa Cruz的访问研究员);希伯来大学的沙龙·莱普勒;丹尼尔·柯尼诺省在海德堡大学;约翰霍普金斯大学的Raymond Simons;太空望远镜科学研究所的格雷戈里斯奈德; Mariangela Bernardi和H. Dominuquez Sanchez在宾夕法尼亚大学;朱辰在上海师范大学; Christoph Lee在UC Santa Cruz;在巴黎天文台的Berta Margalef-Bentabol和Diego Tuccillo。
除了谷歌的支持外,这项工作还部分支持法国 - 以色列照片,美国以色列锦标科学基金会,美国国家科学基金会和哈勃太空望远镜的补助金。VELA计算机模拟在美国宇航局的Pleiades SuperComputer和Doe的国家能源研究科学中心(NERSC)上运行。
纸:深度学习在特征质量范围内识别中央蓝块阶段的高Z星系