ELKI: отмена нормализации результата

Я использую ELKI MiniGUI для запуска LOF. Я узнал, как нормализовать данные перед запуском с помощью -dbc.filter, но я хотел бы посмотреть на исходные записи данных, а не на нормализованные в выходных данных.

Кажется, есть какой-то флаг с именем -normUndo, который можно установить при использовании командной строки, но я не могу понять, как его использовать в MiniGUI.


person PoulReichhardt    schedule 18.10.2016    source источник


Ответы (1)


Раньше эта функция существовала в ELKI, но фактически была удалена (на данный момент).

  1. только несколько нормализаций когда-либо поддерживали это, большинство из них потерпят неудачу.
  2. больше нет четко определенного «конца» визуализации. Некоторые пользователи захотят визуализировать нормализованные данные, а другие нет.
  3. это требует переноса информации о нормализации, что делает структуры данных более сложными (хотя иерархический подход, который у нас есть сейчас, позволил бы это снова)
  4. из-за числовой неточности математики с плавающей запятой вы часто не получаете те же самые значения, которые вводите
  5. хранение исходных данных в памяти может быть слишком дорогим для некоторых случаев использования, поэтому нам нужно будет добавить еще один параметр «сохранять ненормализованные данные»; кроме того, вам нужно будет выбрать, какой (нормализованный или ненормализованный) использовать для анализа, а какой для визуализации. Это было бы нетрудно с полноценным графическим интерфейсом, но вы смотрите на интерфейс командной строки. (Это легко сделать и с Java...)

Мы, конечно, были бы благодарны исправлениям, которые расширяют функциональность ELKI.

Самый простой способ: Добавить столбец меток (нечисловых), и вы сможете идентифицировать исходные объекты в ваших исходных данных по этой метке.

person Erich Schubert    schedule 19.10.2016