Вопросы по теме 'checkpointing'

Проблемы с надежностью контрольных точек / WAL в Spark Streaming 1.6.0
Описание У нас есть приложение Spark Streaming 1.5.2 на Scala, которое считывает события JSON из потока Kinesis, выполняет некоторые преобразования / агрегаты и записывает результаты в разные префиксы S3. Текущий пакетный интервал составляет 60...
2232 просмотров

Что делает контрольная точка в Apache Spark?
Что контрольные точки делают для Apache Spark и требуют ли они каких-либо обращений к ОЗУ или ЦП?
1041 просмотров

Как задать количество документов, обрабатываемых в пакете?
В Spark 2.2.0 контрольные точки работают немного иначе, чем в версиях. Существует папка коммитов, которая создается, и после завершения каждого пакета файл записывается в папку. Я сталкиваюсь со сценарием, в котором у меня около 10 тыс....
181 просмотров

Как сохранить запрашиваемое состояние во Flink?
Я использую FLink v.1.4.0 . Я использую QueryableStateStream , который я каким-то образом набираю, а затем sink для создания Queryable State , например: stream.keyBy(0).asQueryableState("query-name"); Это все хорошо, пока работает моя...
380 просмотров

Обновление контрольной точки смещения раздела EventHub в Azure.Messaging.EventHubs.EventProcessorClient при простое
В моем сценарии у меня будут пакеты событий, поступающих одновременно, а затем длительные периоды времени, когда EventHub будет простаивать. В моем процессорном клиенте я хочу проверять каждые N событий или N минут (в зависимости от того, что...
751 просмотров
schedule 29.01.2023