Физики элементарных частиц уже давно первыми внедрили — если не изобретателями — технологий от электронной почты до Интернета. Поэтому неудивительно, что еще в 1997 году исследователи обучали компьютерные модели помечать частицы в грязных струях, образующихся во время столкновений. С тех пор эти модели пыхтели, становясь все более компетентными, хотя и не ко всеобщему удовольствию.
«Я чувствовал, что машинное обучение угрожает мне, — говорит Джесси Талер , физик-теоретик элементарных частиц из Массачусетского технологического института. Сначала, по его словам, он чувствовал, что это ставит под угрозу его человеческий опыт в классификации струй частиц. Но с тех пор Талер принял его, применив машинное обучение к множеству проблем в физике элементарных частиц. «Машинное обучение — это сотрудничество, — говорит он.
За последнее десятилетие в тандеме с более широкимРеволюция глубокого обучения , физики частиц обучили алгоритмы для решения ранее неразрешимых проблем и решения совершенно новых задач.
Даже с эффективным триггером БАК должен хранить 600 петабайт данных в течение следующих нескольких лет сбора данных. Поэтому исследователи изучают стратегии сжатия данных.
Во-первых, данные физики элементарных частиц сильно отличаются от типичных данных, используемых в машинном обучении. Хотя сверточные нейронные сети (CNN) оказались чрезвычайно эффективными при классификации изображений повседневных объектов от деревьев до кошек и еды, они менее подходят для столкновений частиц. Проблема, по словам Хавьера Дуарте , физика частиц из Калифорнийского университета в Сан-Диего, заключается в том, что данные о столкновениях, такие как данные с Большого адронного коллайдера , по своей природе не являются изображением.
Яркие изображения столкновений на БАК могут ввести в заблуждение весь детектор. На самом деле только несколько из миллионов входных данных регистрируют сигнал, например, белый экран с несколькими черными пикселями. Эти редко заполняемые данные создают плохое изображение, но они могут хорошо работать в другой, более новой среде — графовых нейронных сетях (GNN).
Другие проблемы физики элементарных частиц требуют инноваций. «Мы импортируем молотки не только для того, чтобы забивать себе гвозди, — говорит Дэниел Уайтсон , специалист по физике элементарных частиц из Калифорнийского университета в Ирвине. «У нас есть новые странные виды гвоздей, которые требуют изобретения новых молотков». Один странный гвоздь — это огромное количество данных, производимых на БАК — около одного петабайта в секунду. Из этого огромного количества сохраняется лишь небольшая часть высококачественных данных. Чтобы создать лучшую триггерную систему, которая сохраняет как можно больше хороших данных, избавляясь от данных низкого качества, исследователи хотят обучить зоркий алгоритм сортировке лучше, чем тот, который жестко запрограммирован.
Но чтобы быть эффективным, такой алгоритм должен быть невероятно быстрым и выполняться за микросекунды, говорит Дуарте. Чтобы решить эти проблемы, физики элементарных частиц раздвигают пределы машинных методов, таких как обрезка и квантование, чтобы сделать свои алгоритмы еще быстрее. Даже с эффективным триггером БАК должен хранить 600 петабайт в течение следующих нескольких лет сбора данных ( что эквивалентно примерно 660 000 фильмов с разрешением 4K или данным, эквивалентным 30 библиотекам конгрессов), поэтому исследователи изучают стратегии сжатия данных.
«Мы хотели бы, чтобы машина научилась думать больше как физик, [но] нам также просто нужно научиться думать немного больше как машина».
— Джесси Талер, Массачусетский технологический институт
Машинное обучение также позволяет физикам элементарных частиц иначе думать об используемых ими данных. Вместо того, чтобы сосредоточиться на одном событии — скажем, на распаде бозона Хиггса на два фотона — они учатся учитывать десятки других событий, происходящих во время столкновения. Хотя между любыми двумя событиями нет причинно-следственной связи, такие исследователи, как Талер, в настоящее время придерживаются более целостного взгляда на данные, а не только разрозненной точки зрения, которая исходит из анализа взаимодействия событий за взаимодействием.
Более того, машинное обучение также заставило физиков пересмотреть основные концепции. «Я был неточен в своих представлениях о том, что такое симметрия, — говорит Талер. «То, что я заставил себя научить компьютер тому, что такое симметрия, помогло мне понять, что такое симметрия на самом деле». Симметрии требуют системы отсчета — другими словами, действительно ли изображение искаженной сферы в зеркале симметрично? Невозможно узнать, не зная, искажено ли само зеркало.
Машинное обучение в физике элементарных частиц еще только начинается, и исследователи фактически относятся к этой технике как к кухонной раковине. «Возможно, это не подходит для решения каждой отдельной проблемы в физике элементарных частиц», — признает Дуарте.
По мере того, как некоторые физики элементарных частиц все глубже погружаются в машинное обучение, возникает неудобный вопрос: они занимаются физикой или информатикой? Предубеждение против кодирования — иногда не считающееся «настоящей физикой» — уже существует; подобные опасения связаны с машинным обучением. Беспокоит то, что машинное обучение затенит физику, превратив анализ в черный ящик автоматизированных процессов, непрозрачных для человеческого понимания.
«Наша цель не в том, чтобы подключить машину, эксперимент к сети и заставить ее публиковать наши статьи, чтобы мы не в курсе», — говорит Уайтсон. Он и его коллеги работают над тем, чтобы алгоритмы предоставляли обратную связь на языке, понятном людям, но алгоритмы могут быть не единственными, кто несет ответственность за общение.
«С одной стороны, мы бы хотели, чтобы машина научилась думать больше как физик, [но] нам также просто нужно научиться думать немного больше как машина», — говорит Талер. «Нам нужно научиться говорить на языке друг друга».