1. BotTriNet: унифицированное и эффективное встраивание для обнаружения социальных ботов с помощью метрического обучения (arXiv)

Автор: Jun Wu, Xuesong Ye, Man Yan Yuet.

Аннотация: Стойко популярной темой в онлайновых социальных сетях является быстрое и точное обнаружение учетных записей ботов для предотвращения их вторжения и преследования реальных пользователей. Мы предлагаем единую структуру встраивания под названием BOTTRINET, которая использует текстовый контент, публикуемый учетными записями, для обнаружения ботов, исходя из предположения, что контексты естественным образом раскрывают личности и привычки учетных записей. Контент является обильным и ценным, если система эффективно извлекает информацию, связанную с ботами, с помощью методов встраивания. Помимо общей структуры встраивания, которая генерирует вложения слов, предложений и учетных записей, мы разрабатываем триплетную сеть для настройки необработанных вложений (созданных с помощью традиционных методов обработки естественного языка) для повышения производительности классификации. Мы оцениваем точность обнаружения и f1score на реальном наборе данных CRESCI2017, включающем три категории учетных записей ботов и пять наборов образцов ботов. Наша система достигает наивысшей средней точности 98,34% и f1score 97,99% на двух наборах ботов с интенсивным использованием контента, превосходя предыдущую работу и становясь самой современной. Он также совершает прорыв в четырех наборах ботов без контента: среднее повышение точности составляет 11,52%, а средний показатель f1score увеличивается на 16,70%.

2. SC-ML: самоконтролируемое контрфактическое обучение метрике для непредвзятых визуальных ответов на вопросы (arXiv)

Автор: Синьяо Шу, Шиянг Янь, Сюй Ян, Цзыхэн Ву, Чжунфэн Чен, Чжэнью Лу.

Аннотация: визуальные ответы на вопросы (VQA) — это критическая мультимодальная задача, в которой агент должен отвечать на вопросы в соответствии с визуальной подсказкой. К сожалению, языковая предвзятость является распространенной проблемой в VQA, которая относится к тому, что модель генерирует ответы только путем ассоциации с вопросами, игнорируя визуальный контент, что приводит к предвзятым результатам. Мы решаем проблему языковой предвзятости, предлагая метод самоконтролируемого контрфактического метрического обучения (SC-ML), чтобы лучше сфокусировать функции изображения. SC-ML может адаптивно выбирать визуальные функции, относящиеся к вопросу, для ответа на вопрос, уменьшая негативное влияние визуальных функций, не относящихся к вопросу, на вывод ответов. Кроме того, нерелевантные визуальные функции могут быть легко включены в схемы обучения, основанные на вымышленных фактах, для дальнейшего повышения надежности. Обширные эксперименты доказали эффективность нашего метода с улучшенными результатами на наборе данных VQA-CP. Наш код будет общедоступным