Installment of part of the ATLAS detector. Courtesy of CERN
欧洲核子研究中央的粒子物理学家在2012年创造了希格斯玻色子。现在,人们的任务是进一步理解其性子。 人工智能在个中起着至关主要的浸染。
本日是星期天。 您和我正在公园闲步。 我们的狗冥王星在我们周围蹦蹦跳跳,渴望玩耍。 你扔一根棍子捉住它。
然后你转向我。 '你曾经在希格斯玻色子上事情,对吗?
'好!
那是创造后的四年。'
'如果已经创造,该怎么办?'
'好吧,我们现在知道希格斯玻色子的存在。 但是它的许多特性仍旧未知。 我和我的同事正在研究如何找出希格斯玻色子是否会在粒子对撞机内衰减成暗物质的策略。'
'因此,希格斯玻色子断裂,而残余物是暗物质?'
人工智能可能会揭开希格斯玻色子的奥秘
'那是理论,是的。 我们不愿定这是否真的发生。 但是值得研究。 因此,我和我的同事考虑了如何检测到这些衰变(如果存在)。 而且我们创造人工智能是做到这一点的最佳方法。'
'AI? 怎么样?'
'为此,您首先须要理解我们要办理的问题。
'在CERN,当两个粒子以非常高的能量碰撞时,粒子探测器会捕获发生的情形。 每种类型的粒子(例如夸克或希格斯玻色子)都会在粒子检测器中留下特色性的痕迹。 如果我们将这些痕迹放在一起,就可以重修两个粒子碰撞期间发生的过程。'
Traces of a collision in the CMS detector where a Higgs boson is produced. Courtesy of CERN
'那么您利用AI找出发生了哪些过程?'
'不是那么快!
让我阐明。
'在某些碰撞中,会产生希格斯玻色子。 但是希格斯玻色子的寿命很短,因此会迅速衰减成其他粒子。 这些可能是夸克或其他玻色子,或者可能是暗物质粒子。 后者我们称为旗子暗记事宜-碰撞,个中暗物质位于天生的粒子中。
'当然,我们可以大略地在检测器注册的许多过程中搜索旗子暗记-我们说的是每秒发生十亿次碰撞。
'问题在于,有些事宜看上去确实与旗子暗记相似。 但实际上它们是不同的过程。 这些我们称为背景事宜。 而且我们不肯望那些人歪曲我们的数据。 因此,我们的任务是教检测器区分旗子暗记与背景。'
'人工智能在这里如何发挥浸染?'
'如果没有AI,我们只会查看旗子暗记的不同属性,然后将数据集剪切到险些找不到的位置。
'例如,人们可以利用夸克的数量作为希格斯玻色子向暗物质衰变的副产物而发出。 除暗物质粒子外,根据过程的基本物理事理,我们可能还会产生两次夸克。 有时可能会有更多的夸克,有时会少一些。 可能存在统计差异。
Schematic overview of the signal and background events and their respective number of quarks. If one selects only the events that have one, two or three quarks, one gets a dataset with less background events. Image by the author
'因此,在本示例中,我们可以从没有创造夸克或不超过夸克的数据集中删除碰撞。 我们可以很有把握地说,它们不是旗子暗记事宜。 这样,我们改进了数据集,由于它包含的背景比以前少了。'
'这是AI发挥浸染的地方吗?'
'对,便是这样。 聪明的是,我们可以使AI算法学习旗子暗记事宜的属性。 这使我们的事情变得随意马虎得多,由于这意味着我们不一定须要理解很多根本物理知识。'
'你很
'我称之为高效。'
'好吧。 人工智能如何学习旗子暗记是什么,背景是什么?'
'有很多不同的方法。 在我们的案例中,我们利用了非常大略的算法,称为决策树。 基本事理是,您首先利用伪数据集演习算法。 该数据集来自打算机仿照,仅包含已经精确标记为旗子暗记或背景的事宜。
Machine learning algorithms, such as decision trees, can improve the quality of datasets much faster. Photo by Javier Allegue Barros on Unsplash
'决策树将随机剪切运用于演习集,然后检讨其是否将旗子暗记与背景分离。 然后,它会反复涌现,直到找到最佳的裁切效果为止。'
'但是为什么你不能手动做呢?'
'我们是手动进行的-但须要大量有关根本流程的知识,否则将须要很永劫光。 而且,由于旗子暗记的属性常日相互依赖,因此很快变得繁芜。
'例如,在旗子暗记碰撞中发出的两个夸克可能彼此之间有一定间隔。 但是可能还有其他涉及三个夸克的旗子暗记事宜。 在这种情形下,三个夸克之间的间隔可能会不同。 因此,我们不能只在夸克之间切一段间隔。 决策树非常适宜考虑此类依赖关系。'
'因此,在某种程度上,机器比您更理解!
"'真正!
这有助于我们创造希格斯玻色子的特性。'您再次向冥王星投掷棍子。
"这对希格斯有什么帮助?"
'利用AI,我们可以天生非常好的数据集,个中包含大量旗子暗记和少量背景事宜。 在我们的案例中,旗子暗记事宜是碰撞,此后希格斯玻色子衰减为暗物质。
'现在,我们要做的便是打算创造的旗子暗记事宜的数量。 如果我们创造一定数量,就可以说我们创造了希格斯玻色子对暗物质的衰变!
''你创造了吗?'
'不。 至少-尚未。 我们的论文只是实现这一创造的浩瀚步骤之一。 研究须要韶光!
'希格斯玻色子的未来仍旧令人愉快
'看看您是否会创造它将会很有趣!
还是这些衰变乃至不存在。''等着瞧!
''我肯定会…实际上,我认为AI真的很难明得。 但是现在看来还不算猖獗。'
'公正地说,我们利用了现有的最大略的AI工具之一。 如今,科学家常常利用更繁芜的算法,包括监督式深度学习和GAN。 但是,如果您乐意,我们可以再谈一谈。'
"我很乐意!
"当您试图从我们狗的嘴里摆动棍子时,您大叫。 "拜托冥王星,我们要回家了!
"(本文翻译自Rhea Moutafis的文章《How to use AI on the Higgs boson》,参考:https://towardsdatascience.com/how-to-use-ai-on-the-higgs-boson-e97ef4fb2fb2)