1. Quantile LSTM: надежный LSTM для обнаружения аномалий в данных временных рядов (arXiv)

Автор: Снеханшу Саха, Джйотирмой Саркар, Сома Дхавала, Сантону Саркар, Прянк Мота.

Аннотация: Под аномалиями понимают отклонение систем и устройств от их нормального поведения в стандартных условиях эксплуатации. Аномалия в промышленном устройстве может указывать на предстоящий сбой, часто во временном направлении. В этой статье мы делаем два вклада: 1) мы оцениваем условные квантили и рассматриваем три различных способа определения аномалий на основе оцененных квантилей. 2) мы используем новую обучаемую функцию активации в популярной архитектуре сетей долговременной памяти (LSTM) для моделирования временной долгосрочной зависимости. В частности, мы предлагаем параметрическую функцию Эллиота (PEF) в качестве функции активации (AF) внутри LSTM, которая насыщается в последнее время по сравнению с сигмовидной и тангенциальной. Предлагаемые алгоритмы сравниваются с другими известными алгоритмами обнаружения аномалий, такими как Isolation Forest (iForest), Elliptic Envelope, Autoencoder и современными моделями глубокого обучения, такими как модель смеси Gaussian Deep Autoencoding (DAGMM), генеративно-состязательные сети (GAN). Алгоритмы оцениваются с точки зрения различных показателей производительности, таких как точность и полнота. Алгоритмы были протестированы на нескольких промышленных наборах данных временных рядов, таких как Yahoo, AWS, GE и датчики машин. Мы обнаружили, что квантильные алгоритмы на основе LSTM очень эффективны и превосходят существующие алгоритмы при выявлении аномалий.

2. Метод постепенного обнаружения типов финансовых событий на основе обнаружения аномалий (arXiv)

Автор: Дянюэ Гу, Цзысю Ли, Чжэньхай Гуань, Жуй Чжан, Лань Хуан.

Аннотация. Наборы данных о событиях в финансовой сфере часто создаются на основе реальных сценариев приложений, а их типы событий плохо подходят для повторного использования из-за ограничений сценария; в то же время массивные и разнообразные новые большие финансовые данные не могут быть ограничены типами событий, определенными для конкретных сценариев. Это ограничение небольшого количества типов событий не соответствует нашим исследовательским потребностям для более сложных задач, таких как предсказание крупных финансовых событий и анализ волновых эффектов финансовых событий. В этой статье предлагается трехэтапный подход для поэтапного обнаружения типов событий. Для существующего аннотированного набора данных о финансовых событиях трехэтапный подход состоит из: для набора данных о финансовых событиях со смесью исходных и неизвестных типов событий сначала применяется полуконтролируемая модель глубокой кластеризации с обнаружением аномалий для классификации данных. на нормальные и аномальные события, где аномальные события — это события, не принадлежащие к известным типам; затем нормальные события помечаются соответствующими типами событий, а аномальные события разумно группируются. Наконец, метод извлечения ключевых слов кластера используется, чтобы рекомендовать имена типов событий для новых кластеров событий, тем самым постепенно обнаруживая новые типы событий. Предлагаемый метод эффективен при поэтапном обнаружении новых типов событий на реальных наборах данных.