У меня есть потоковая программа Flink, которая считывает данные из топика Kafka. В программе auto.offset.reset установлен на «наименьший». При тестировании в IDE / Intellij-IDEA программа всегда могла читать данные с начала темы. Затем я настроил кластер flink / kafka и произвел некоторые данные в тему kafka. В первый раз, когда я запустил задание потоковой передачи, оно могло читать данные с самого начала темы. Но после этого я остановил задание потоковой передачи и запустил его снова, оно не будет читать данные с начала темы. Как сделать так, чтобы программа всегда считывала данные с начала темы?
Properties properties = new Properties();
properties.put("bootstrap.servers", kafkaServers);
properties.put("zookeeper.connect", zkConStr);
properties.put("group.id", group);
properties.put("topic", topics);
properties.put("auto.offset.reset", offset);
DataStream<String> stream = env
.addSource(new FlinkKafkaConsumer082<String>(topics, new SimpleStringSchema(), properties));
auto.offset.reset
используетсяFlinkKafkaConsumer081
, а неFlinkKafkaConsumer082
. Поэтому мне интересно, как вы можете его установить? Кроме того, возможные значения - самые последние или самые ранние (а не самые маленькие. Можете ли вы поделиться своим кодом? - person Matthias J. Sax   schedule 15.12.2015offset
?offset = "smalles"
? Может быть, ваша тема больше не содержит исходных данных из-за того, что вы превысили срок хранения? Не могли бы вы проверить сkafka-console-consumer.sh
, чтобы прочитать тему с самого начала? - person Till Rohrmann   schedule 15.12.2015auto.offset.reset
- самые поздние или самые ранние (наименьшее - недействительно). - person Matthias J. Sax   schedule 15.12.2015