研究人员介绍了一种新颖的无监督机器学习方法,旨在发现激光干涉引力波天文台(LIGO)辅助通道数据中的新模式。
加州大学河滨分校的科学家们简化了在由引力波探测器LIGO设施产生的庞大且复杂的数据集中定位模式和减少噪音的过程。
在最近的IEEE大数据研讨会上,UCR团队透露了他们关于一种能够自主识别LIGO辅助通道数据中模式的机器学习方法的发现。这项创新技术在大规模粒子加速器研究和复杂工业系统中也可能具有相关性。
LIGO作为一个探测引力波的设施,捕捉由移动的巨大物体引起的时空结构中的短暂波动。它是首个探测到来自相撞黑洞波动的设施,从而确认了爱因斯坦相对论的一个重要元素。LIGO由位于华盛顿州汉福德和路易斯安那州利文斯顿的两个相距4公里的干涉仪组成,利用高功率激光器识别引力波。从这些探测器收集到的信息为宇宙提供了新的洞察,并为对黑洞本质、宇宙学以及存在的最密集物质形式的探究提供了信息。
每个LIGO探测器都从位于观测站的各种环境传感器生成大量的数据流或通道。
“我们的机器学习方法是在与LIGO官员和利益相关者密切合作的基础上开发的,能够自主识别数据中的模式,”加州大学河滨分校物理与天文学助理教授、UCR LIGO小组负责人乔纳森·理查德森表示。“我们发现它能有效捕捉LIGO操作员所知的环境‘状态’,且不需要任何人工干预。这个能力为帮助隔离噪音干扰和指导探测器的增强铺平了道路。”
理查德森指出,LIGO探测器对外部干扰极为敏感。风或海洋波浪等因素引起的振动可以影响实验的精确性和数据的完整性,导致“故障”或噪音增强的时期,他说。
“监测现场的环境情况是一个持续的过程,”他补充道。“LIGO配备了超过100,000个辅助通道,配有震动计和加速度计,用于跟踪干涉仪周围的环境条件。我们开发的工具可以识别出多条精心选择的监测通道中的不同环境状态,如地震、微震和人为噪音。”
计算机科学与工程副教授、罗斯家族计算机科学讲座教授瓦格利斯·帕帕莱克萨基斯在上月华盛顿特区举行的IEEE第五届国际大数据与人工智能工具、模型和创新科学发现用例研讨会上展示了题为“基于多元时间序列聚类的地面引力波探测器环境状态表征”的论文。
“我们的机器学习方法旨在使模型能够自主发现数据集中模式,”帕帕莱克萨基斯说。“该工具成功识别出与LIGO操作员已经确认的重要环境状态密切相关的模式。”
帕帕莱克萨基斯还表示,团队与LIGO科学合作组合作,促成了一项与他们研究相关的重要数据集的发布。这一数据发布使科学界能够验证他们的发现并创建新的用于识别数据模式的算法。
“我们发现环境噪音与特定故障之间存在引人注目的联系,这些故障会降低数据质量,”帕帕莱克萨基斯说。“这一发现可能有助于减轻或防止这种噪音。”
该团队花了一年左右的时间组织和分析LIGO的通道。理查德森指出,数据的发布是一项重大努力。
“我们的团队代表整个LIGO科学合作组主导了这项工作,该合作组约有3200名成员,”他指出。“这是这些特定数据集的首次发布,我们相信这将对机器学习和计算机科学界产生重要影响。”
理查德森澄清说,所开发的工具可以从监测LIGO设施周围不同干扰的各种传感器中获取数据。该工具将这些信息综合成一个单一状态,可以用于追踪在何时发生噪音问题,以及将其与当时的环境条件相关联。
“识别这些模式可能导致对探测器进行物理改造,比如更换组件,”他解释道。“我们希望我们的工具能够揭示物理噪音耦合路径,从而实现LIGO探测器的实际实验调整。最终,我们的目标是使该工具识别出新的关联和与干涉仪中未知噪音挑战相关的未探索环境状态。”
共同作者波扬·古达尔齐是一名与理查德森合作的博士生,他强调了公开该数据集的重要性。
“通常,这类数据是专有的,”他说。“然而,我们成功地发布了一个大规模的数据集,我们希望这将促进数据科学和机器学习领域的更多跨学科研究。”
国家科学基金会通过一个独特的项目“利用人工智能工具推进发现”支持该团队的研究,该项目专注于应用人工智能和机器学习解决物理科学中的挑战。
除了理查德森、帕帕莱克萨基斯和古达尔齐,该研究还涉及与帕帕莱克萨基斯合作的博士生鲁图贾·古拉夫、暑期本科学者伊萨克·凯利、来自LIGO利文斯顿站的安娜玛丽亚·埃夫勒以及加州大学河滨分校的杰出物理与天文学教授巴里·巴里什。