Analysis group meeting

Asia/Krasnoyarsk
Вадим Костюхин, Ирина Шрaйбер (TSU), Мария Диденко
Description

BDT classification:

  • Данные были сконвертированы из ntuple в CSV.

  • События взвешены, и веса использовались в обучении.

  • Подтверждено: использование весов в обучении обязательно.

1. Вопрос о нейронных сетях

  • Был применён простой MLP, но требуется рассмотреть другие нейросети.

  • Рекомендация:

    • Начать с DNN,

    • При желании рассмотреть более современные архитектуры (например, Transformers),

    • Но приоритет — простые и воспроизводимые модели.

  • Замечено, что TMVA даёт преимущество в том, что алгоритмы можно использовать методически одинаково.

2. Рекомендации по литературе

  • Обсуждалась статья, в которой сравниваются ML-алгоритмы (https://arxiv.org/pdf/2207.08815).

  • Вывод из литературы:

    • Решающие деревья и градиентный бустинг часто показывают лучшую производительность.

    • Эти результаты нужно подтвердить на своих данных.

  • Задача: внимательно прочитать статью и попробовать повторить подход.

3. Структура данных и корректность сравнения моделей

  • Обсуждено, что:

    • При использовании "структурированных" данных (например, графов) сравнение алгоритмов может становиться некорректным.

    • Нужно следить, чтобы входные данные были представлены единообразно, иначе различия между моделями будут неинтерпретируемыми.

4. Следующие шаги по ML-части

  • Повторить сравнение алгоритмов из статьи на текущих данных.

  • Подготовить таблицу сравнения (AUC, accuracy, precision/recall/F1, specificity).

  • Продолжить работу над литературным обзором.

    tt̄ и Z на данных 2015 года

Собрать итоговый набор систематик в формате, совместимом с инструментом фитирования.

  • Все систематики имеются либо в виде весов, либо в виде отдельных файлов.

  • Важен единый список систематик и корректная реализация их в workspace.

 

There are minutes attached to this event. Show them.
    • 1
      Мария Диденко
      Speaker: Мария Диденко
    • 2
      Неда Фироз
      Speaker: Неда Фироз (Tomsk State University)
    • 3
      Дмитрий Старков
      Speaker: Дмитрий Старков