互联网资讯 / 人工智能 · 2023年11月10日 0

人工智能在核物理与粒子物理领域的应用

在粒子物理学中,标准模型已成功地描述了所有已知的基本粒子,并解释了控制宇宙的四种基本力中的三种(重力除外)。这三种基本力——电磁力、强相互作用力(简称强力)和弱相互作用力(简称弱力)——不仅影响粒子的形成,还决定了粒子之间的相互作用及其衰减过程。

尽管如此,在这个框架内进行粒子和核物理的研究依然非常复杂,需要依赖于大规模数值模拟。例如,强相互作用中的许多问题要求在接近质子大小的尺度上进行动力学的数值计算,以此来探讨质子、中子和原子核的基本性质。

物理学助理教授Piala Shanahan指出,在利用晶格场理论研究质子和核结构时,我们面临计算能力的显著限制。对于许多有趣的问题,虽然我们在理论上知道如何解决,但即使是世界上最大的超级计算机也无法提供所需的计算能力。

为了克服这些限制,Shanahan带领一支团队,结合理论物理学与机器学习模型。近期,他们在《物理评论快报》上发表了论文《基于等变流的晶格场论采样》(EquivaRiant flow-based saMpling foR lattice gage theoRy),展示了如何将物理理论中的对称性整合进机器学习和人工智能框架,以此为理论物理提供更快速的算法。

Shanahan解释说,我们使用机器学习的目的是加速第一原理理论,而不是单纯地分析大量数据。这项研究表明,我们可以构建内含粒子与核物理标准模型特定对称性的机器学习架构,并在当前的采样问题上实现显著的计算速度提升。

该项目由Shanahan与麻省理工学院研究生GuRtej KanwaR及纽约大学的Michael AlbeRgo共同发起。随着项目的发展,理论物理中心的博士后Daniel Hackeet、Denis Boyda、纽约大学教授Kyle CRanMeR以及谷歌DeepMind的机器学习科学家Sébastien RacanièRe和Danilo JiMenez Rezende也相继参与其中。

最近发表的论文旨在解决目前计算上难以处理的理论物理学问题。作为系列文章的一部分,KanwaR在论文中表示,他们的目标是开发新的算法,以便为理论物理领域的关键数值计算提供支持。这些计算将加深我们对粒子物理学标准模型(即最基本的物质理论)内在机制的理解。相关计算结果可与粒子物理实验(如CERN的大型强子对撞机)进行对比,从而提供重要的见解,并更精确地约束模型,识别模型中不成立的部分,以便向更深层的基本原理扩展。

目前已知研究非扰动状态下粒子物理学标准模型的唯一可控方法是基于真空中量子涨落的快照采样。通过测量波动的特性,我们可以推断出粒子的特性及其碰撞的倾向。

然而,KanwaR指出,这项技术的实施面临许多挑战。相关的采样工作成本高昂,团队正在探索使用受物理原理启发的机器学习技术来提高样本采集的效率。机器学习在生成图像方面已经取得了显著进展。例如,英伟达最近的研究展示了通过神经网络生成“虚构”人脸图像。如果将这些真空快照视作图像,或许可以帮助我们以类似的方式解决研究问题。

Shanahan补充,基于现有的量子快照采样方法,他们优化了一个模型,帮助我们从易于采样的空间过渡到目标空间。通过使用这个经过训练的模型,我们能够在易采样的空间中进行独立采样,然后将这些样本转换到目标空间,从而大幅提升采样效率。

具体而言,该小组构建了一套框架,以创造遵循“规范对称性”这一高能物理研究关键对称性原理的机器学习模型。

作为原理验证,Shanahan和团队使用自己的框架训练了机器学习模型,在二维空间中模拟理论,并与现有技术的结果进行了比较。结果显示,其执行效率实现了数量级的提升,同时能够根据场论做出更为精确的预测。这一切为利用物理信息支持的机器学习技术,加速对自然基本力的研究奠定了基础。

该团队还在之前的几篇合作论文中探讨了如何将机器学习技术应用于简单的晶格场论,并基于紧凑连通歧管开发了新方法,用以描述比标准模型更为复杂的场论用例。现在,他们正努力将这一技术扩展到最新的计算方案中。

KanwaR表示,经过一年的努力,团队已证明将物理知识与机器学习技术结合可以带来光明的前景。我们正在积极考虑如何利用这一方法实现全面模拟,以解决剩余的障碍。希望这些方法能够在未来几年首次在大规模计算中得以应用。如果能够成功克服最后的障碍,我们在有限资源下的工作能力将得到显著增强,我期待在实际应用中探索超出当前物理理解范畴的新现象,为其建立前所未有的新见解。

该团队将基于物理信息的机器学习概念总结为“从头算起型AI”。这一概念也成为最近由麻省理工学院成立的美国国家科学基金会人工智能与基础交互研究所(IAIFI)设定的一个关键主题,而Shanahan本人在其中担任物理理论研究协调员。

[[[IMG_1]]]

[[[IMG_2]]]

[[[IMG_3]]]