物理科学

用机器学习重建天文图像

我们对宇宙如何运作的大部分了解,都是通过分析从天空捕获的天文信号来了解的。然而,这些信号不可避免地会有一些与之相关的噪音——所以天文学家如何确定他们观察到的奇怪的、意外的信号反映了现实呢?剑桥大学的爱德华·希格森(Edward Higson)和他的同事在处理这个问题上取得了进展,他们构建了机器学习算法,可以处理有噪声的天文图像,重建清晰的图像。利用贝叶斯统计,他们的软件为天文学家提供了处理观测数据的有用工具。

为了获得关于宇宙的知识,天文学家使用各种各样的望远镜来收集来自天空的电磁辐射。随着望远镜的改进,研究人员对天空的观测越来越详细,有待理论物理学家解释的有趣观测继续涌现。然而,从尘埃云到望远镜的缺陷,各种各样的障碍意味着观测不可能是完美的;天文信号不可避免地会有某种程度的噪声与之相关。由于这些信号的复杂性质,天文学家们努力想弄清楚,在没有噪声的情况下,这些意想不到的信号应该是什么样子。在他们的研究中,希格森博士和他的同事们设计了一个尖端的解决方案,以解决基于机器学习的图像处理问题。

贝叶斯帮了点小忙
当研究人员需要预测某些事件发生的可能性时,他们有各种各样的统计技术可供选择。许多流行的方法使用贝叶斯统计——一种以18世纪英国统计学家托马斯·贝叶斯命名的方法,他认为我们对一个命题的信心会随着实验收集到的更多信息而改变。贝叶斯用一个现在被称为“贝叶斯定理”的等式来模拟这种统计行为。几个世纪后,Higson博士和他的同事们将他的数学作为神经网络的基础,成功地重建了有噪声的天文图像。

Higson博士解释说:“我的研究重点是利用数据推断宇宙的方法,包括在我们没有一个很好的观测信号的理论模型的情况下。”“我使用贝叶斯统计,它将概率定义为对一个命题的‘信任程度’,并可以分析不可重复的事件,其中我们的不确定性是由于有限的信息。”

可以理解,使用这些方法来分析像神秘的天文图像这样复杂的输入是一项艰巨的任务。然而,自贝叶斯时代以来,统计技术已经有了显著的进步,现在Higson博士的团队可以基于“嵌套采样”的计算技术可靠地重建这些图像。

应用嵌套的抽样
嵌套抽样是一种越来越流行的用于执行贝叶斯统计计算的计算技术。这种方法是由剑桥天体物理学家John Skilling在2004年发明的,能够处理具有挑战性的数据集和高维概率分布。

假设这3个噪声数据集(中间列)在视觉上看起来非常相似,贝叶斯稀疏重构可以计算出底层真实信号(左列)之间的差异,并生成与真实信号非常匹配的数据(右列)。
摘自Edward Higson等人。贝叶斯稀疏重建:天文学成像和机器学习的蛮力方法。Mnras(2019) 483(4): 4828-4846。由牛津大学出版社代表皇家天文学会许可转载。
请访问:https://academic.oup.com/mnras/article/483/4/4828/5232384?searchresult=1
这个数字不包括在本出版物的知识共享许可协议下。有关权限,请联系journals.permissions@oup.com。

Higson博士对使用嵌套采样来重建有噪声的天文图像特别感兴趣。他的团队开发的嵌套采样软件可以用贝叶斯数学分析这些图像。这使得神经网络可以通过寻找图像的简单(“稀疏”)数学描述来预测清晰图像应该是什么样子。

Higson博士继续说道:“我们使用嵌套采样来实现‘贝叶斯稀疏重建’,这是一种在天体物理学中广泛使用的贝叶斯计算的流行方法。”“我们的大部分研究都集中在改进这项技术,使其能够更好地处理贝叶斯稀疏重建问题,并理解这些计算中的不确定性。”为了达到这一目的,Higson博士和他的同事进行了广泛的研究,研究如何在充分利用现代计算机现有能力的同时,将嵌套抽样用于贝叶斯统计计算。

我使用贝叶斯统计,它可以分析不可重复的事件,其中我们的不确定性是由于有限的信息。

提高嵌套抽样效率
尽管它很有用,但嵌套采样机器学习所需要的快速、重复计算可能会使该技术计算密集型。在早期的研究中,Higson博士的团队通过构建算法来解决这个问题,这种算法大大降低了运行嵌套采样软件所需的计算能力。Higson博士解释说:“‘动态嵌套抽样’是嵌套抽样算法的推广,与标准嵌套抽样相比,它在计算效率上有很大的提高。”

在每一行中,左边的图像显示的是哈勃太空望远镜拍摄的星系。给定这些图像的噪声非常大的版本(每行中间),贝叶斯冗余重构产生一个适合的噪声数据(每行右侧),精确地再现原始图像。
摘自Edward Higson等人。贝叶斯稀疏重建:天文学成像和机器学习的蛮力方法。Mnras(2019) 483(4): 4828-4846。由牛津大学出版社代表皇家天文学会许可转载。
请访问:https://academic.oup.com/mnras/article/483/4/4828/5232384?searchresult=1。
这个数字不包括在本出版物的知识共享许可协议下。有关权限,请联系journals.permissions@oup.com。

使用更新的算法,研究人员编写的软件可以有效地对大量数据进行贝叶斯统计分析。Higson博士解释说,动态嵌套采样有望成为处理现代望远镜产生的数据和图像流的强大工具。“动态嵌套采样现在已经被应用到天体物理学的各种问题中,”他继续说。“计算效率的提高与嵌套采样软件的进步相结合,有可能使贝叶斯稀疏重建框架在未来应用于更大、更复杂的数据集。”

然而,他们的算法的效率并不是实现嵌套抽样的唯一困难。为了确保他们重建的图像是可靠的,研究人员首先需要找到方法来理解他们的软件执行的计算中的错误,并估计可能的错误有多大。

检查错误
动态嵌套抽样源自Higson博士和他的同事们的努力,他们试图了解软件中的错误来源,然后教它自动识别和改进计算中最有可能包含错误的部分。Higson博士说:“我们分析了嵌套抽样参数估计中的抽样误差,并创建了一种方法,用于对单个嵌套抽样计算进行数值估计。”然后,该团队使用这种估计技术作为动态嵌套抽样算法的基础,自动识别他们的软件应该做什么来最好地提高计算精度。

这些努力还导致了另一个软件包,为嵌套抽样计算提供误差分析。Higson博士继续说:“我们开发了诊断测试来检测软件是否没有准确地执行嵌套抽样算法。”“不确定性估计和诊断在‘nestcheck’软件包中实现。”

通过将nestcheck集成到他们的动态嵌套抽样算法中,研究人员集中了所有的努力来提高软件的效率和准确性。在他们最新的研究中,Higson博士和他的同事使用他们的先进软件来演示他们的贝叶斯稀疏重建技术。

我们使用嵌套抽样来实现“贝叶斯稀疏重建”,这是贝叶斯计算的一种流行方法。

信号重建的基础
在2019年的研究中,希格森博士的团队首次开发了通过机器学习建立模型来重建信号的方法,机器学习试图尽可能简单地表达信号。这些模型的基本组成部分被称为“基函数”——一组数学函数,可以用来近似天文信号的基本属性。Higson博士解释说:“我们提出了一个有原则的贝叶斯信号重建框架,在这个框架中,信号由基函数建模,基函数的数量和形式由数据本身决定。”

利用这个框架,该团队建立了一种在噪声数据中识别清晰信号的原则方法。因此,研究的第一部分为他们提供了一个基础,他们可以在此基础上测试他们的算法在真实情况下的性能。

重建真实信号
在研究的下一部分,Higson博士和他的同事将他们的技术应用于真实望远镜收集的噪声图像上。该软件还被用于使用神经网络处理图像。神经网络是受我们大脑运行过程的启发而产生的计算系统。在这个应用程序中,神经网络可以以类似于基函数的方式使用。在这种情况下,该团队的算法使用神经网络对噪声信号进行贝叶斯统计,从而产生清晰的图像。

Higson博士解释说:“我们展示了重建有噪声的一维和二维信号的方法,包括处理天文图像的例子。”“我们还将贝叶斯稀疏重建框架应用到神经网络,它使我们能够找出用于拟合数据集的最佳神经网络类型。”与之前的算法不同,Higson博士的软件允许模型根据数据的复杂性调整其复杂程度。

天文学家的新工具箱
多亏了Higson博士和他的同事的工作,天文学家才有机会使用机器学习技术来处理他们的图像。他们的软件可以帮助重构清晰的图像,即使是对于最奇怪和最意想不到的观测,理论物理学家还没有提供任何解释。随着望远镜继续以更高的细节水平观察宇宙,该软件可能成为一个重要的工具,以确保重建日益奇怪和多样化的天文观测是真正可靠的。

个人反应

你认为在贝叶斯稀疏重建后哪些图像会产生特别有趣的结果?

当噪声和多个重叠源使确定图像中有多少天体以及每个天体的样子变得困难时,这项技术特别有用。一个真正令人兴奋的应用是哈勃太空望远镜拍摄的最遥远的照片,它显示了可观测宇宙边缘附近的混乱星系。贝叶斯稀疏重建可以用来计算出这些图像中有多少独立的重叠星系,以及单个星系的形状。

本文是在研究团队的批准下创建的。这是一个合作制作,由那些特色的支持,免费援助,全球分发。

想读更多这样的文章吗?

注册到我们的邮件列表,阅读对你最重要的话题。
报名!

留下一个回复

您的电子邮件地址将不会被公布。必填字段已标记

感谢您表示有兴趣加入我们的邮寄名单和社区。下面您可以选择您希望我们与您互动的方式,我们将随时为您更新我们的最新内容。

您可以更改您的偏好或取消订阅,请点击任何您收到的电子邮件页脚的取消订阅链接,或通过以下方式与我们联系audience@www.graceymay.com在任何时候,如果您对我们如何处理您的数据有任何问题,请查看我们的隐私协议。

您想了解更多关于我们的服务吗?

我们使用MailChimp作为我们的营销自动化平台。通过点击下面提交此表格,您确认您提供的信息将被转移到MailChimp进行处理隐私政策条款。

订阅我们的免费刊物