■本报记者 赵宇彤
北京市玉泉路北京正负电子对撞机园区附近的会议室,近两年每月都会召开一场特别的组会。会议桌的两边各坐着一支中国科学院研究团队:一边是从事高能物理研究的实验团队,另一边则是开展人工智能(AI)研究的专业团队。
这是一场高能物理与AI技术的碰撞。会议召集人是中国科学院大学(以下简称国科大)物理科学学院教授吕晓睿、电子电气与通信工程学院教授叶齐祥。
高能物理与AI,两个看似遥远的学科在这里打破边界、紧密结合。在中国科学院与财政部联合启动的“稳定支持基础研究领域青年团队计划”(以下简称“青年团队计划”)支持下,吕晓睿团队开发的数据与智能驱动的新一代科学模型和算法,为解决高能物理领域长期悬而未决的科学难题开启了一扇新窗口。
挑战不可能
从事高能物理研究的数年间,吕晓睿心里始终放不下一道难题:在高能物理实验中进行中子动量重建。
“中子是一种不带电的中性粒子,穿透性极强,无法像带电粒子那样被直接捕捉和追踪。”吕晓睿解释道,“而且,传统数据分析手段难以高效、准确地测量中子能量。”
随着AI技术的广泛应用,吕晓睿有了新的思路——利用先进的AI技术,或许能加速高能物理实验研究的效率提升和范式革新。
他找到“老朋友”、同为中国科学院青年创新促进会会员的叶齐祥。两人一拍即合,决定从AI的视角重新审视这一长期被视作“不可能完成的任务”。
然而,在高能物理与AI的前沿交叉领域,研究周期长、不确定因素多、出成果较慢。短期内能不能发论文?没有成果,靠什么得到项目支持?这些现实问题,光靠两个年轻团队的努力无法解决。吕晓睿一时陷入迷茫。
2021年,中国科学院与财政部联合启动的“青年团队计划”,在申请时不唯“帽子”,也不论资排辈,鼓励青年团队瞄准科学前沿重大问题,开展建制化、定向性基础研究。该计划每年围绕“从0到1”原始创新、关键核心技术的源头科学难题发布问题清单,对申请成功的团队给予持续5年的稳定支持,且没有频繁的考核。
2024年,该计划针对传统科学研究范式难以处理高维复杂系统、海量科学数据利用不充分、现有AI模型可解释性与泛化能力不足等问题,凝练出“数据与智能驱动的新一代科学模型和算法”,旨在构建科学启发与智能学习的新一代科学模型与算法,突破复杂系统高效处理与规律发现瓶颈,推动科研范式向数据与智能双驱动转型,为多领域基础研究提供共性支撑,实现原创性、引领性科学突破。
这让迷茫中的吕晓睿看到了曙光。“如果能申请到这个项目,大家就不必再被迫将精力分散到频繁申请短期经费,或追赶热点、快速发表成果的事务上。”吕晓睿说。
于是,吕晓睿和叶齐祥的两支团队决定联手,从高能物理与AI交叉融合的角度“破题”。“高能物理和AI其实有着天然的‘合作机缘’。”吕晓睿解释说,高能物理实验中会产生海量数据,而对AI大模型而言,数据越多,越能发挥大模型的优势。
更令吕晓睿感到振奋的是,“‘青年团队计划’的评审机制摒弃了以职衔、从业年限或过往头衔为核心的旧有评价体系,不再将资历深浅作为判断依据”。吕晓睿说,他们靠着扎实的基础和清晰的研究思路,在激烈的角逐中最终打动评委,成功入选。
在该计划的稳定支持下,基于中国科学院的高水平科教融合平台,他们大展身手,共同探索搭建“物理规律嵌入的人工智能基础模型”。
他们发现,基于北京正负电子对撞机进行的北京谱仪Ⅲ实验,恰好能成为探索的抓手。“北京谱仪Ⅲ实验在高度受控的对撞环境中积累了海量数据,其中部分物理过程无需直接测量中子,便可反推出其产生时间、能量、飞行方向等信息。”吕晓睿说,“通过该方法,我们标记了上千万个高质量的中子样本。”
“利用这一模型,我们对实验数据进行训练与推理,第一次实现了电磁量能器中反中子的直接重建,显著增强了实验对相关物理过程的解析能力。”吕晓睿说,“AI模型的位置分辨率相对传统方法最高提升96%,动量分辨率在1吉电子伏特处能达到17%,而传统方法对此无能为力。”
跨界“强强联合”
“AI+高能物理”的跨界合作,并不是件容易事。起初,他们也经历了一段磨合期。
“首先要理解对方的‘语言’。”吕晓睿解释说,“高能物理实验里存在许多专有词汇,AI模型的训练也需要对实验数据进行描述和转化,这些都需要我们反复沟通交流。”
此外,双方的工作模式也有“时差”。在高能物理实验中,往往是少则二三百人、多则上千人的大型合作组,需要共同遵循相应规则完成成果研究。而对AI团队来说,可能只需要几个人就能完成一个项目的开发和测试,工作节奏相对更快。
经过半年的磨合,双方团队适应了彼此的节奏。在执行“青年团队计划”的过程中,团队没有了发论文、筹经费的压力,更专注于真正重要的科学问题,甚至主动选择攻克那些前期探索性强但短期难以发表论文的“硬骨头”课题。
在此过程里,吕晓睿发现,不少成员也逐渐萌生了对对方学科的兴趣,决定在“AI+高能物理”前沿交叉领域开展更多探索。
吕晓睿的博士生、国科大物理科学学院特别研究助理孙昊就是其中之一。
“这两年,我深刻感受到AI正在从根本上改变高能物理大装置的整个科研流程。”孙昊告诉记者,大科学装置的建设、运行和科研工作中蕴含丰富的科学和技术课题,包括AI应用在内,众多大科学装置催生的技术和方法有了越来越多的用武之地。
这些在“青年团队计划”中成长的年轻人,逐渐释放出蓬勃的活力与创造力。
“我们也在给AI出难题,比如怎么让AI严格遵循物理定律,怎么让AI直接发现新粒子、新规律等。这些难题也将赋予AI新的能力,催生出突破注意力机制、物理定律启发、具有可解释性的信息基础模型。”孙昊说。
目前,“物理规律嵌入的人工智能基础模型”已取得多项关键进展。依托欧洲核子研究中心大型强子对撞机(LHC)上的底夸克探测器(LHCb)实验,团队将模型底座拓展至底强子味道标记与衰变模式判别,大幅提高宇宙正反物质不对称性研究中的味道标记性能;依托江门中微子实验,开展能量与顶点高精度重建,以及碳14偶然符合本底抑制研究……
“目前,我们已初步打通物理规律驱动的AI方法从底层建模到跨场景应用的创新链条。”吕晓睿说。
敢闯“无人区”
敢闯“无人区”,离不开多方面的支持。
作为基础研究的前沿方向之一,高能物理领域的国际竞争日趋激烈。“一些新的热点方向大家都会去研究,这个时候就需要我们质量更高、更有效率地率先做出成果。”吕晓睿说,大科学装置实验周期长、数据积累慢、成果产出难,是一场需要长期坚持的“马拉松”。
“‘青年团队计划’和中国科学院的建制化科研优势给了我们信心,让我们能放开手脚进行‘从0到1’的尝试。”吕晓睿告诉记者,团队成员有的来自中国科学院近代物理研究所,有的来自中国科学院高能物理研究所,也有其他高校老师,“得益于我院体系化、建制化优势,我们能够和不同大科学装置中的科研人员沟通,共同探索AI与高能物理实验结合的新可能”。
除了产出了一批重大原创科研成果,更让吕晓睿高兴的是,越来越多优秀的硕博生乃至本科生,都开始进入基础研究的前沿交叉领域。
“在‘青年团队计划’的支持下,我们汇聚了多个研究所和高校的师资力量,让学生们能根据自身科研兴趣进行交流与实践。”吕晓睿说,这也为高能物理领域的持续攻坚培育了更多生力军。
对吕晓睿团队来说,这也是他们在“AI+高能物理”交叉领域深入探索的底气。
“不同的高能物理实验场景都不一样,北京正负电子对撞机是利用正电子、负电子对撞湮灭产生新物质,欧洲LHC则是将质子加速对撞。”吕晓睿告诉记者,尽管其遵循的高能物理规律都是统一的,但不同实验的物理目标、数据结构都存在差异。
目前,“物理规律嵌入的人工智能基础模型”仅在部分实验上打通了全流程链条。“未来,我们希望能建造通用的高能物理实验大模型,底层遵循相同的物理原则,但在应用时,能针对不同高能物理实验进行调整。”吕晓睿满怀期待。
但这并不是一件简单的事,需要更多年轻科研人员参与其中,共同迈向基础研究的“无人区”。
“希望年轻人能做一些天马行空的探索。”吕晓睿说,一些看起来“不太靠谱”的想法,也许能带来更多惊喜,要“保持科学研究的想象力,去探索更多未知”。