Доповідач
Опис
У доповіді представлено новий підхід до аналізу даних у фізиці високих енергій, заснований на використанні символьної регресії — методу машинного навчання, який автоматично виводить аналітичні вирази для класифікації фізичних подій. Основною перевагою такого підходу є прозорість та інтерпретованість отриманих результатів, що особливо важливо у контексті аналізу експериментальних даних, пов’язаних із пошуком рідкісних процесів, таких як розпад бозона Хіггса. Порівняння з поширеними моделями, зокрема посиленими деревами рішень, демонструє конкурентну якість класифікації та кращу узагальненість при значно кращій зрозумілості моделі.
На основі відкритого набору даних колаборації ATLAS, було побудовано та порівняно дві моделі: символьної регресії та посилених дерев рішень. Для обох підходів використовували однакові фізичні змінні та метрики якості, зокрема бінарну перехресну ентропію. Символьна регресія показала на 9,2 % кращу ефективність за даною метрикою, водночас забезпечуючи фізично осмислену формулу для розмежування сигнальних і фонових подій. Результати демонструють перспективність використання аналітичних методів машинного навчання для інтерпретованої обробки даних у фундаментальних дослідженнях.