1. Повышение тегов вверху и их интерпретация с использованием значений Шепли (arXiv)

Автор: Биплоб Бхаттачерджи, Камелия Бозе, Амит Чакраборти, Ритая Сенгупта.

Аннотация: Топ-метки стали быстро развивающейся темой из-за значительной роли топ-кварка в исследовании физики за пределами стандартной модели. Для реконструкции верхних самолетов модели машинного обучения показали значительное улучшение производительности маркировки и классификации по сравнению с предыдущими методами. В этой работе мы строим лучшие тегеры, используя коэффициенты N-Subjetness и несколько наблюдаемых функций энергетической корреляции в качестве входных функций для обучения дерева решений eXtreme Gradient BOOST (XGBOOST). Замечено, что производительность тегировщиков зависит от того, насколько хорошо верхние струи согласованы с их партонами уровня истины. Кроме того, мы используем структуру Shapley Additive exPlanation (SHAP) для расчета важности функций обученных моделей. Это помогает нам оценить, насколько каждая характеристика данных способствовала предсказанию модели и какие регионы имеют большее значение для каждой входной переменной. Наконец, мы объединяем все переменные тега, чтобы сформировать гибридный тег, и интерпретируем результаты, используя значения Шепли.

2. Сложность значения Шепли для обычных запросов пути (arXiv)

Автор: Мажд Халил, Бенни Кимельфельд.

Аннотация: запрос пути извлекает кортежи вершин из размеченного графа на основе слов, образованных путями, соединяющими вершины. Мы изучаем вычислительную сложность измерения вклада ребер и вершин в ответ на запрос пути, уделяя особое внимание классу конъюнктивных регулярных запросов пути. Чтобы измерить этот вклад, мы принимаем традиционное значение Шепли из теории кооперативных игр. Это значение было недавно предложено и изучено в контексте запросов к реляционным базам данных и используется во множестве других областей. Сначала мы изучим вклад ребер и покажем, что точное значение Шепли почти всегда трудно вычислить. В частности, #P-сложно вычислить вклад ребра, если хотя бы один (неизбыточный) конъюнкт допускает слово длины три или более. В случае обычных запросов пути (т. е. без конъюнкции) проблема решается, если запрос содержит только слова длиной не более двух; следовательно, это свойство полностью характеризует разрешимость задачи. С другой стороны, если мы допускаем ошибку аппроксимации, то несложно получить эффективную схему (FPRAS) для аддитивной аппроксимации. Тем не менее, мультипликативное приближение получить труднее. Мы установили, что в случае запросов с конъюнктивными регулярными путями мультипликативная аппроксимация значения Шепли ребра может быть вычислена за полиномиальное время тогда и только тогда, когда все атомы запроса являются конечными языками (при условии неизбыточности и обычных ограничений сложности). Мы также изучаем аналогичную ситуацию, когда мы хотим определить вклад вершины, а не ребра, и устанавливаем результаты сложности аналогичного характера.