Вопросы по теме 'checkpointing'
Проблемы с надежностью контрольных точек / WAL в Spark Streaming 1.6.0
Описание
У нас есть приложение Spark Streaming 1.5.2 на Scala, которое считывает события JSON из потока Kinesis, выполняет некоторые преобразования / агрегаты и записывает результаты в разные префиксы S3. Текущий пакетный интервал составляет 60...
2232 просмотров
schedule
17.01.2022
Что делает контрольная точка в Apache Spark?
Что контрольные точки делают для Apache Spark и требуют ли они каких-либо обращений к ОЗУ или ЦП?
1041 просмотров
schedule
15.01.2023
Как задать количество документов, обрабатываемых в пакете?
В Spark 2.2.0 контрольные точки работают немного иначе, чем в версиях. Существует папка коммитов, которая создается, и после завершения каждого пакета файл записывается в папку.
Я сталкиваюсь со сценарием, в котором у меня около 10 тыс....
181 просмотров
schedule
06.12.2022
Как сохранить запрашиваемое состояние во Flink?
Я использую FLink v.1.4.0 . Я использую QueryableStateStream , который я каким-то образом набираю, а затем sink для создания Queryable State , например:
stream.keyBy(0).asQueryableState("query-name");
Это все хорошо, пока работает моя...
380 просмотров
schedule
29.10.2023
Обновление контрольной точки смещения раздела EventHub в Azure.Messaging.EventHubs.EventProcessorClient при простое
В моем сценарии у меня будут пакеты событий, поступающих одновременно, а затем длительные периоды времени, когда EventHub будет простаивать. В моем процессорном клиенте я хочу проверять каждые N событий или N минут (в зависимости от того, что...
751 просмотров
schedule
29.01.2023