- Indico style
- Indico style - inline minutes
- Indico style - numbered
- Indico style - numbered + minutes
- Indico Weeks View
Данные были сконвертированы из ntuple в CSV.
События взвешены, и веса использовались в обучении.
Подтверждено: использование весов в обучении обязательно.
Был применён простой MLP, но требуется рассмотреть другие нейросети.
Рекомендация:
Начать с DNN,
При желании рассмотреть более современные архитектуры (например, Transformers),
Но приоритет — простые и воспроизводимые модели.
Замечено, что TMVA даёт преимущество в том, что алгоритмы можно использовать методически одинаково.
Обсуждалась статья, в которой сравниваются ML-алгоритмы (https://arxiv.org/pdf/2207.08815).
Вывод из литературы:
Решающие деревья и градиентный бустинг часто показывают лучшую производительность.
Эти результаты нужно подтвердить на своих данных.
Задача: внимательно прочитать статью и попробовать повторить подход.
Обсуждено, что:
При использовании "структурированных" данных (например, графов) сравнение алгоритмов может становиться некорректным.
Нужно следить, чтобы входные данные были представлены единообразно, иначе различия между моделями будут неинтерпретируемыми.
Повторить сравнение алгоритмов из статьи на текущих данных.
Подготовить таблицу сравнения (AUC, accuracy, precision/recall/F1, specificity).
Собрать итоговый набор систематик в формате, совместимом с инструментом фитирования.
Все систематики имеются либо в виде весов, либо в виде отдельных файлов.
Важен единый список систематик и корректная реализация их в workspace.