机器学习首先确认了50个新行星– AI区分真实和“假”行星
华威大学的科学家开发了一种新的机器学习算法,确认了五十个潜在行星的存在。
天文学家第一次使用基于机器学习的过程(一种人工智能形式)来分析潜在行星的样本,并确定哪些是真实的,哪些是“假”的或假阳性的,从而计算出每个行星的概率成为一个真正的星球的候选人。
他们的研究结果发表在皇家天文学会月度通告上的一项新研究中,在该研究中,他们还首次对这种行星验证技术进行了大规模比较。他们的结论为统计确认未来系外行星发现时使用多种验证技术(包括其机器学习算法)提供了理由。
许多系外行星调查都通过望远镜中的大量数据来搜索行星在望远镜与恒星之间通过的迹象,这就是所谓的过境。这会导致望远镜探测到的恒星光线倾泻而下,但这也可能是由于双星系统,来自背景物体的干扰,甚至相机中的微小误差所致。这些误报可以在行星验证过程中筛选出来。
沃里克物理与计算机科学系以及艾伦·图灵研究所的研究人员构建了一种基于机器学习的算法,该算法可以从望远镜任务(例如,美国国家航空航天局(NASA)的开普勒(Kepler)和TESS。
它经过训练,可以使用两个大的已确认行星样本和来自现已退休的开普勒任务的误报来识别真实的行星。然后,研究人员将该算法用于开普勒尚未确认的行星候选数据集上,从而产生了五十个新的确认行星,并且第一个要通过机器学习进行验证。先前的机器学习技术已经对候选者进行了排名,但从未确定候选者自己是真正行星的可能性,这是行星验证的必要步骤。
这五十个行星的范围从海王星到大到比地球还小,其轨道长达200天,甚至只有一天。通过确认这五十个行星是真实的,天文学家现在可以优先使用专用望远镜对它们进行进一步观察。
华威大学物理系的大卫·阿姆斯特朗博士说:“我们开发的算法使我们能够跨阈值筛选五十个候选行星,从而将其升级为真实行星。我们希望将此技术应用于来自TESS和PLATO等当前和未来任务的大量候选人中。
“就行星验证而言,以前没有人使用过机器学习技术。机器学习已用于对行星候选者进行排名,但从未在概率框架中使用它,这是真正验证行星所需要的。现在,我们无需说出哪些候选者更可能是行星,而是可以说出确切的统计可能性是多少。如果候选人的假阳性几率小于1%,则被认为是经过验证的星球。”
沃里克大学计算机科学系的Theo Damoulas博士以及艾伦·图灵研究所数据中心工程和图灵研究员副主任说:“统计机器学习的概率方法特别适合于天体物理学中的一个令人兴奋的问题,该问题需要吸收来自阿姆斯特朗博士等专家的先验知识,并对预测中的不确定性进行量化。当概率方法的额外计算复杂性得到显着回报时,这是一个很好的例子。”
一旦构建并训练了该算法,该算法将比现有技术更快,并且可以完全自动化,从而使其非常适合分析TESS等当前调查中观察到的潜在成千上万的行星候选者。研究人员认为,这应该是将来集体用来验证行星的工具之一。
阿姆斯特朗博士补充说:“迄今为止,仅使用一种方法就已经验证了大约30%的已知行星,但这并不理想。仅出于这个原因,就需要开发新的验证方法。但是,机器学习还使我们能够非常快速地做到这一点,并更快地确定候选人的优先级。
“我们仍然必须花时间训练算法,但是一旦完成,将其应用于将来的候选人变得容易得多。您还可以合并新发现以逐步改进它。
“预计像TESS这样的调查将有成千上万的行星候选者,理想的是能够始终如一地对其进行分析。如此快速,自动化的系统可以使我们以更少的步骤一路验证行星,从而使我们高效地完成了任务。”
参考:“利用机器学习进行系外行星验证:David J Armstrong,Jevgenij Gamper,Theodoros Damoulas的50个经过验证的新开普勒行星,2020年8月20日,皇家天文学会月报。DOI:10.1093
/ mnras / staa2498
阿姆斯特朗博士的研究得到了英国研究与创新机构科学技术设施委员会(STFC)通过欧内斯特·卢瑟福奖学金的支持。