Вопросы по теме 'flume-twitter'
Свойство управления частотой обновления файла Flume-ng hdfs .tmp
Я пытаюсь обновить файл .tmp с дополнительными событиями каждые 5 минут, мой источник работает медленно, и для получения файла размером 128 МБ в моем приемнике hdfs требуется 30 минут.
Есть ли какое-либо свойство в приемнике hdfs flume, где я могу...
454 просмотров
schedule
26.05.2022
Flume не обрабатывает ключевые слова из источника Twitter с помощью flume-ng с Hadoop 2.5 cdh5.3
Я пытаюсь обработать некоторые ключевые слова Twitter с помощью MemChannel и HDFS . Но flume-ng не показывает дальнейшего прогресса после статуса HDFS started на консоли.
Вот содержимое /etc/flume-ns/conf/flume-env.sh файла.
#...
3709 просмотров
schedule
10.06.2022
Необработанная ошибка java.lang.NoSuchMethodError при запуске Flume для загрузки данных из твиттера
Когда я запускаю эту команду
hduser@ubuntu:/usr/local/flume$ bin/flume-ng agent --conf ./conf/ -f conf/twitterflume-agent.conf -Dflume.root.logger=DEBUG,console -n TwitterAgent
Flume запускается, но через некоторое время выдает мне...
1287 просмотров
schedule
02.05.2023
Apache Flume не работает с Twitter Stream
Попытка получить твиты Apache Flume в HortonWorks. (Используя учебную точку)
Flume настроен правильно. Вот flume.conf
TwitterAgent.sources = Twitter
TwitterAgent.channels = MemChannel
TwitterAgent.sinks = HDFS...
121 просмотров
schedule
24.03.2024
Как настроить apache flume для потоковой передачи данных Facebook
Не могли бы вы предоставить мне шаги по настройке Flume для потоковой передачи данных Facebook.
Мы успешно настроили Flume для извлечения данных из Twitter.
Пожалуйста, взгляните на конфигурацию, которую мы создали для извлечения данных из...
1124 просмотров
schedule
15.05.2023
Как фильтровать несколько исходных данных с помощью Apache Flume?
Я использую flume для обработки данных из нескольких источников и храню их в HDFS, но я не мог понять, как фильтровать данные перед сохранением в HDFS.
174 просмотров
schedule
14.06.2022
Данные твитов в формате Avro не могут быть загружены
Я работаю над HDP (Hortonworks) и пытаюсь собирать твиты через Flume и загружать сохраненные данные из Hive.
Проблема в том, что select * from tweetsavro limit 1; работает, а select * from tweetsavro limit 2; не работает, потому что
Failed...
302 просмотров
schedule
23.12.2022
Как изменить файл конфигурации Apache flume через код Java?
В настоящее время я работаю над проектом больших данных для анализа настроений по актуальным темам в Твиттере. Я следовал руководству Cloudera и понял, как отправлять твиты в Hadoop через Flume....
479 просмотров
schedule
10.09.2022