Объединение потоковых данных с помощью потоков Kafka

Я отправляю сообщения Кафке с таким кодом:

Properties props = new Properties();
props.put("bootstrap.servers", "localhost:9092");
props.put("acks", "all");
props.put("retries", 0);
props.put("batch.size", 16384);
props.put("linger.ms", 1);
props.put("buffer.memory", 33554432);
props.put("key.serializer", "org.apache.kafka.common.serialization.StringSerializer");
props.put("value.serializer", "org.apache.kafka.common.serialization.StringSerializer");
props.put(StreamsConfig.APPLICATION_ID_CONFIG, "testo");
props.put(ConsumerConfig.AUTO_OFFSET_RESET_CONFIG, "earliest");

Producer<String, String> producer = new KafkaProducer<>(props);

for (int i = 0; i < 1000; i++) {
  producer.send(new ProducerRecord<>(
    "topico",
    String.format("{\"type\":\"test\", \"t\":%.3f, \"k\":%d}", System.nanoTime() * 1e-9, i)));
}

Я хочу подсчитать общее количество сообщений за последний час с помощью Kafka Streams (0.10.0.1). Я пробовал это:

final KStreamBuilder builder = new KStreamBuilder();
final KStream<String, String> metrics = builder.stream(Serdes.String(), Serdes.String(), "topico");
metrics.countByKey(TimeWindows.of("Hourly", 3600 * 1000)).mapValues(Object::toString).to("output");

Я новичок в Kafka / Streams. Как я могу это сделать?


person kamaci    schedule 19.10.2016    source источник
comment
Было бы полезно, если бы вы могли привести пример данных с вводом, выводом и ожидаемым выводом. Код в порядке. Не уверен, с какими проблемами вы столкнулись.   -  person Matthias J. Sax    schedule 19.10.2016
comment
Кроме того, с какой ошибкой / проблемой вы столкнулись? Это не упоминается в вашем вопросе. Я действительно вижу пару проблем с небольшим фрагментом кода, которым вы поделились, но прежде чем делать преждевременные выводы, это поможет, как сказал Маттиас Дж. Сакс, если вы могли бы поделиться дополнительной информацией, особенно о коде, связанном с Kafka Streams: 1. параметры конфигурации, которые вы определили для Kafka Streams, и 2. полное определение топологии и т. Д., Включая ту часть, где вы фактически запускаете топологию через sth, например KafkaStreams#start().   -  person Michael G. Noll    schedule 20.10.2016


Ответы (3)


Прежде всего .. Вам не хватает этого кода, чтобы начать процесс потоковой передачи.

KafkaStreams streams = new KafkaStreams(builder, config);   
streams.start();    
Runtime.getRuntime().addShutdownHook(new Thread(streams::close)); 
person Gilles Essoki    schedule 18.05.2017

Чтобы объединить два потока, вы можете использовать метод соединения. В kstreams доступны различные объединения.

Например: если вы хотите присоединиться к kstream с ktable:

KStream<String, String> left = builder.stream("topic1");
KTable<String, String> right = builder.table("topic2");

left.leftjoin((right, (leftValue, rightValue) -> Customfunction(rightValue, leftValue))

наконец-то запустите kstream

streams = new KafkaStreams(topology, config);
streams.start();
person Santosh Rachakonda    schedule 22.08.2018

Я также новичок в потоках kafka, я не знаю старый api, но с новым (2.1.x) что-то вроде этого должно работать

 kstream.mapValues((readOnlyKey, value) -> "test")
                    .groupByKey()
                    .windowedBy(TimeWindows.of(1000 * 60))
                    .count()
                    .toStream()
                    .selectKey((key, value) -> Instant.ofEpochMilli(key.window().end())
                            .truncatedTo(ChronoUnit.HOURS).toEpochMilli())
                    .groupByKey(Serialized.with(Serdes.Long(), Serdes.Long())).reduce((reduce, newVal) -> reduce + newVal)
                    .toStream().peek((key, value) -> log.info("{}={}",key,value));
person Nonika    schedule 26.01.2019