NoSQL как решение для интеллектуального анализа данных?

Каким образом базы данных NoSQL более полезны для интеллектуального анализа данных, чем, скажем, базы данных OLAP, или почему они менее полезны?

Есть ли преимущество в быстром извлечении данных из гигантского объема данных, а также в наличии базы данных без схемы?


person DazedNConfused    schedule 02.02.2016    source источник


Ответы (1)


Речь идет о расширенных возможностях запросов

И здесь обычно базы данных NoSQL довольно бесполезны.

Они предназначены для чрезвычайно примитивных запросов, таких как хранение значений ключа.

Но вы не можете сделать большой анализ с этим.

База данных, подходящая для интеллектуального анализа данных, должна позволять:

  • поиск похожих записей (k ближайших соседей) с функциями сходства, специфичными для предметной области
  • самосоединение с ближайшим соседом, самосоединение с радиусом
  • парные сравнения
  • оптимизация математических уравнений и быстрая векторная математика, желательно с разгрузкой GPU

Как бы то ни было, то, что люди делают при добыче баз данных, — это ETL:

  • извлечь то, что им нужно через SELECT
  • преобразовать его в желаемую схему
  • загрузить его из базы данных в приложение интеллектуального анализа данных

то есть база данных выполняет ETL, но интеллектуальный анализ данных происходит вне.

person Has QUIT--Anony-Mousse    schedule 02.02.2016