Вопросы по теме 'flume-twitter'

Свойство управления частотой обновления файла Flume-ng hdfs .tmp
Я пытаюсь обновить файл .tmp с дополнительными событиями каждые 5 минут, мой источник работает медленно, и для получения файла размером 128 МБ в моем приемнике hdfs требуется 30 минут. Есть ли какое-либо свойство в приемнике hdfs flume, где я могу...
454 просмотров

Flume не обрабатывает ключевые слова из источника Twitter с помощью flume-ng с Hadoop 2.5 cdh5.3
Я пытаюсь обработать некоторые ключевые слова Twitter с помощью MemChannel и HDFS . Но flume-ng не показывает дальнейшего прогресса после статуса HDFS started на консоли. Вот содержимое /etc/flume-ns/conf/flume-env.sh файла. #...
3709 просмотров
schedule 10.06.2022

Необработанная ошибка java.lang.NoSuchMethodError при запуске Flume для загрузки данных из твиттера
Когда я запускаю эту команду hduser@ubuntu:/usr/local/flume$ bin/flume-ng agent --conf ./conf/ -f conf/twitterflume-agent.conf -Dflume.root.logger=DEBUG,console -n TwitterAgent Flume запускается, но через некоторое время выдает мне...
1287 просмотров
schedule 02.05.2023

Apache Flume не работает с Twitter Stream
Попытка получить твиты Apache Flume в HortonWorks. (Используя учебную точку) Flume настроен правильно. Вот flume.conf TwitterAgent.sources = Twitter TwitterAgent.channels = MemChannel TwitterAgent.sinks = HDFS...
121 просмотров
schedule 24.03.2024

Как настроить apache flume для потоковой передачи данных Facebook
Не могли бы вы предоставить мне шаги по настройке Flume для потоковой передачи данных Facebook. Мы успешно настроили Flume для извлечения данных из Twitter. Пожалуйста, взгляните на конфигурацию, которую мы создали для извлечения данных из...
1124 просмотров
schedule 15.05.2023

Как фильтровать несколько исходных данных с помощью Apache Flume?
Я использую flume для обработки данных из нескольких источников и храню их в HDFS, но я не мог понять, как фильтровать данные перед сохранением в HDFS.
174 просмотров
schedule 14.06.2022

Данные твитов в формате Avro не могут быть загружены
Я работаю над HDP (Hortonworks) и пытаюсь собирать твиты через Flume и загружать сохраненные данные из Hive. Проблема в том, что select * from tweetsavro limit 1; работает, а select * from tweetsavro limit 2; не работает, потому что Failed...
302 просмотров

Как изменить файл конфигурации Apache flume через код Java?
В настоящее время я работаю над проектом больших данных для анализа настроений по актуальным темам в Твиттере. Я следовал руководству Cloudera и понял, как отправлять твиты в Hadoop через Flume....
479 просмотров