Статьи по теме flume-ng

Вопросы по теме 'flume-ng'

кафка_2.10-0.8.2.0 лоток 1.6 Это моя конфигурация канала: a1.sources = r1 a1.sinks = k1 a1.channels = c1 a1.sources.r1.type = org.apache.flume.source.kafka.KafkaSource a1.sources.r1.zookeeperConnect = a2:3181...

3258 просмотров

flume-ng

03.01.2024

flume: найти ip/имя хоста отправителя события?

Я пытаюсь настроить конвейер данных, где серверы приложений отправляют (используя ведение журнала log4j) logevents в поток (используя приложение Flume log4j) по сети, в avrosource, который использует агент Flume. Я пробовал с приведенной ниже...

1054 просмотров

flume flume-ng

20.06.2022

Отправка исключения обратно клиенту, брошенному приемником лотка

Я планирую использовать Flume с HTTPSource для загрузки данных в HDFS. Приемник будет настроен на сохранение данных в таблицу Hive/Hbase. Если есть какое-либо исключение/ошибка при записи данных в HDFS, можно ли их вернуть клиенту?...

129 просмотров

hadoop bigdata flume-ng

31.10.2022

Свойство управления частотой обновления файла Flume-ng hdfs .tmp

Я пытаюсь обновить файл .tmp с дополнительными событиями каждые 5 минут, мой источник работает медленно, и для получения файла размером 128 МБ в моем приемнике hdfs требуется 30 минут. Есть ли какое-либо свойство в приемнике hdfs flume, где я могу...

454 просмотров

cloudera hortonworks-data-platform flume flume-twitter flume-ng

26.05.2022

Поток Spark не может читать файлы, созданные из потока в hdfs

Я создал приложение в реальном времени, в котором я записываю потоки данных в hdfs из веб-журналов с помощью flume, а затем обрабатываю эти данные с помощью искрового потока. Но пока flume пишет и создает новые файлы в потоке искры hdfs, не может...

908 просмотров

apache-spark hadoop hdfs spark-streaming flume-ng

20.05.2022

Канал памяти Flume для стока HDFS

У меня возникла проблема с Flume (1.5 на Cloudera CDH 5.3): spoolDir source -> memory channel -> HDFS sink Что я пытаюсь сделать: каждые 5 минут около 20 файлов помещаются в каталог буферизации (захвачены из удаленного хранилища)....

1414 просмотров

cloudera-cdh flume-ng

20.05.2023

Flume не обрабатывает ключевые слова из источника Twitter с помощью flume-ng с Hadoop 2.5 cdh5.3

Я пытаюсь обработать некоторые ключевые слова Twitter с помощью MemChannel и HDFS . Но flume-ng не показывает дальнейшего прогресса после статуса HDFS started на консоли. Вот содержимое /etc/flume-ns/conf/flume-env.sh файла. #...

3709 просмотров

flume-twitter flume-ng

10.06.2022

Необработанная ошибка java.lang.NoSuchMethodError при запуске Flume для загрузки данных из твиттера

Когда я запускаю эту команду hduser@ubuntu:/usr/local/flume$ bin/flume-ng agent --conf ./conf/ -f conf/twitterflume-agent.conf -Dflume.root.logger=DEBUG,console -n TwitterAgent Flume запускается, но через некоторое время выдает мне...

1287 просмотров

java hadoop flume flume-twitter flume-ng

02.05.2023

Apache Flume не работает с Twitter Stream

Попытка получить твиты Apache Flume в HortonWorks. (Используя учебную точку) Flume настроен правильно. Вот flume.conf TwitterAgent.sources = Twitter TwitterAgent.channels = MemChannel TwitterAgent.sinks = HDFS...

121 просмотров

hdfs apache flume flume-twitter flume-ng

24.03.2024

flume hdfs rollSize не работает в многоканальном и многоканальном режимах

Я пытаюсь использовать Flume-ng, чтобы получить 128 МБ информации журнала и поместить ее в файл в HDFS. Но параметры прокатки HDFS не работают. Flume-ng отправляет файл журнала в секунду. Как исправить файл flume.conf? agent01.sources =...

370 просмотров

hdfs flume flume-ng

20.01.2023

Приложение зависает, когда я подключаюсь к PipelinesRDD и RDD из DStream

Я использую Spark 1.6.0 со Spark Streaming и имею одну проблему с широкими операциями. Пример кода: существует RDD под названием «a», который имеет тип: class 'pyspark.rdd.PipelinedRDD'. "а" было получено как: # Load a text file and convert...

375 просмотров

apache-spark pyspark spark-streaming flume-ng spark-dataframe

28.01.2023

Как использовать источник taildir в Flume для добавления только самых новых строк файла .txt?

Недавно я задал вопрос Apache Flume - отправлять только новое содержимое файла Я перефразирую вопрос, чтобы узнать больше и предоставить больше пользы будущим пользователям Flume. Установка: два сервера, один с файлом .txt, к которому...

914 просмотров

apache flume tail flume-ng

17.03.2024

Как фильтровать несколько исходных данных с помощью Apache Flume?

Я использую flume для обработки данных из нескольких источников и храню их в HDFS, но я не мог понять, как фильтровать данные перед сохранением в HDFS.

174 просмотров

hadoop flume flume-twitter flume-ng

14.06.2022

Агент Flume: как агент Flume получает данные с веб-сервера, расположенного на другом физическом сервере.

Я пытаюсь понять Flume и ссылаюсь на официальную страницу Flume по адресу flume.apache.org. В частности, ссылаясь на этот раздел , я немного запутался в этом . Нужно ли нам запускать агент Flume на реальном веб-сервере или мы можем запускать...

243 просмотров

flume flume-ng

21.04.2023

Не удалось загрузить positionFile: при использовании источника TAILDIR в потоке я получаю сообщение об ошибке

Я работаю над Flume, чтобы добавить данные из локального каталога в HDFS, используя Flume Source TAILDIR . Мой вариант использования - выполнить дельта-загрузку. Если новая строка появится в исходном файле в локальном каталоге, она будет добавлена...

591 просмотров

json flume flume-ng

25.04.2023

Запись данных в каталог хранилища улья в две отдельные таблицы с использованием Flume

Я хочу записать данные в каталог хранилища улья, в две отдельные таблицы с именами flumemaleemployee и flumefemaleemployee . Последние 3 records должны быть вставлены в таблицу female , а верхние 3 records должны быть вставлены в таблицу...

114 просмотров

hadoop apache bigdata flume flume-ng

22.07.2023

Как отслеживать статус агентов Apache Flume?

Я знаю способ Enterprise (например, Cloudera), используя CM (через браузер) или Cloudera REST API, можно получить доступ к средствам мониторинга и настройки. Но как запланировать (запустить и перезапустить) жизненный цикл агентов Flume и...

575 просмотров

flume flume-ng

24.03.2023

Flume: назначить ключ для раковины раздела kafka

Я имею дело с проблемой, но я не могу найти ответ на ее решение, ни в документации по Flume. Я хочу взять абсолютный путь к файлу хвоста и сохранить его. После того, как я хочу передать его в приемник kafka в качестве ключа, чтобы все события имели...

198 просмотров

apache-kafka key flume-ng

04.02.2024

Вопросы по теме 'flume-ng'

Похожие вопросы