ELK с Kafka и Hadoop

Я не эксперт в "больших данных" :)

Мой сценарий — это пара экземпляров EC2, чем создание журналов.

Эти журналы в основном представляют собой системный журнал и события приложений (пользовательские журналы).

Я хотел бы использовать стек ELK для сбора журналов, применения фильтров и отображения данных.

В некоторых случаях я хотел бы отправлять свои пользовательские события в выделенную систему очередей ( rabbitMQ ) для обработки данных (механизм рекомендаций).

Мой вопрос в том, почему я должен использовать такие инструменты, как Kafka и Hadoop, если в основном я хочу просто анализировать журналы с 24-часовым хранением и перемещать их с помощью функции ротации журналов из Debian?

Большое спасибо за твою помощь! и извините за мой плохой английский ^^


person Dario    schedule 25.07.2016    source источник
comment
Не похоже, что вам нужны Kafka или Hadoop для получения данных в часть ELK. Существуют плагины для Logstash для получения данных из системного журнала в ES.   -  person Binary Nerd    schedule 26.07.2016
comment
Извините, возможно, вопрос кажется глупым, но во всех учебниках я видел, что они используют Hadoop или Kafka перед стеком ELK.   -  person Dario    schedule 26.07.2016
comment
Вам не нужна Kafka для двухточечной интеграции, но большинство людей будут использовать ее для подачи нескольких нижестоящих приемников и одновременно заменять им RabbitMQ для подачи механизма рекомендаций.   -  person Hans Jespersen    schedule 26.07.2016


Ответы (1)


Если кому-то интересно, я решил так:

1 - Вместо использования ротации журналов по умолчанию я решил использовать службу Cloud Watch, в основном она берет журналы из EC2 и сохраняет их в облаке.

2. Для передачи данных в Logstash я использовал службу Lambda, в основном это среда, в которой вы можете выполнять код Java, Javascript (Nodejs) или Python. Он берет поток потоковых данных из CloudWatch, я решил хранить журналы на S3 через небольшой скрипт Nodejs.

3 — Экземпляр Logstash потребляет журналы непосредственно из S3, для этой цели есть ввод плагина.

person Dario    schedule 27.07.2016