Есть ли способ добавить новые сообщения из Kafka в тот же файл в HDFS с помощью Gobblin? Теперь он создает новый файл каждый раз, когда читает из Kafka. Например, если запускать задание Gobblin каждую минуту, файлов будет много.
Пожалуйста помоги!
Есть ли способ добавить новые сообщения из Kafka в тот же файл в HDFS с помощью Gobblin? Теперь он создает новый файл каждый раз, когда читает из Kafka. Например, если запускать задание Gobblin каждую минуту, файлов будет много.
Пожалуйста помоги!
Не уверен насчет Gobblin, но ИМХО Apache Flume будет для вас лучшим выбором.