randy0 2020-10-06
粒子物理学中的标准模型,已经成功描述了所有已知基本粒子以及控制整个宇宙的全部四大基本力中的三种(除重力以外)。而这三种基本力——电磁力、强相互作用力(简称强电力行业)与弱相互作用力(简称弱力)——不仅控制着粒子的形成,也决定了粒子之间如何相互作用以及如何逐渐衰减。
然而,在这套框架之内研究粒子与核物理仍然非常困难,需要依赖于大规模数值研究。例如,强力中的不少问题都需要在质子大小的十分之一甚至是百分之一晶圆之上,对动力学进行数值模拟,因此回答关于质子、中子以及原子核基本性质的相关问题。
物理学助理教授Piala Shanahan表示,“最终,我们在使用晶格场理论的质子与核结构研究中遭遇到计算能力的限制。对于很多有趣的问题,我们只知道如何在原则上加以解决,但即使是世界上规模最大的超级计算机也不足以提供必要的算力容量。”
为了突破这些限制,Shanahan领导了一支将理论物理学与机器学习模型相结合的小组。在近日发表在《物理评论快报》上的论文《基于等变流的晶格场论采样》(Equivariant flow-based sampling for lattice gage theory)当中,他们展示了如何将物理理论的对称性纳入机器学习与人工智能架构当中,借此为理论物理带来更快的算法。
Shanahan解释道,“我们使用机器学习不是为了分析大量数据,而是希望以不损害方法严格性的方式加速第一原理理论。这项特殊工作表明,我们可以构建内置有粒子与核物理标准模型的某些对称性机器学习架构,并在当前面对的采样问题中实现量级式的计算速度提升。”
Shanahan与麻省理工学院研究生Gurtej Kanwar以及来自纽约大学的Michael Albergo共同发起了这个项目。随着项目扩展,理论物理中心博士后Daniel Hackeet与Denis Boyda、纽约大学教授Kyle Cranmer、谷歌Deep Mind团队精通物理学的机器学习科学家Sébastien Racanière与Danilo Jimenez Rezende也纷纷被吸引进来。
近日发表的论文旨在实现目前在计算层面难以解决的理论物理学研究课题。作为系列文章中的一篇,Kanwar在论文中表示“我们的目标是为理论物理领域的关键数值计算部分开发新的算法。这些计算使我们深入了解到粒子物理学标准模型(即最基础的物质理论)的内部工作原理。相关计算结果能够与粒子物理实验(例如CERN的大型强子对撞机)进行比较以带来至关重要的启示,同时更精确地约束模型,进而发现模型中的哪些部分无法成立、需要向更深层次的基本原理进行扩展等。”
研究非扰动状态下粒子物理学标准模型的唯一已知的系统可控方法,就是基于真空中量子涨落快照的采样。通过测量波动的特性,我们可以推断出粒子特性及其碰撞倾向性。
但Kanwar解释道,这项技术的实施面临着诸多挑战。“相关采样工作非常昂贵,我们正在努力探索,尝试使用受物理学原理启发的机器学习技术提高样本采集效率。机器学习在生成图像方面已经取得了长足的进步。例如,英伟达最近的工作就是通过神经网络生成「想象中的」人脸图像。如果将这些真空快照视为图像,相信其也有望帮助我们以类似的方法解决研究问题。”
Shanahan还补充道,“根据目前的量子快照采样方法,我们优化出一套模型,能够帮助我们由易于采样的空间过渡到目标空间:利用这套经过训练的模型,我们只需要在易于采样的空间中进行独立采样,再由该模型对采样方法进行转换,即可极大提升采样效率。”
具体来讲,该小组引入了一套框架以构建机器学习模型。该模型完全尊重“规范对称性”这一对于研究高能物理至关重要的对称性原理。
作为原理证明,Shanahan及其同事使用自己的框架训练机器学习模型,在二维空间之上模拟理论并与现有技术进行结果比较。可以看到,其执行效率迎来了数量级层面的提升,同时也能根据场论做出更精确的预测。这一切,都为使用物理信息支持下的机器学习技术、大大加速对自然基本力体系的研究工作铺平了道路。
该小组还在之前的几篇合作论文中讨论了如何将机器学习技术应用简单的晶格场论,并以紧凑连通歧管为基础开发出新的方法,可用于描述比标准模型更为复杂的场景论用例。现在,他们正努力将这项技术扩展到最新计算方案当中。