Контрольно-пропускной пункт Mesos/Marathon и HA

Mesos и Marathon время от времени упоминают контрольные точки, но я нигде не смог найти хорошего объяснения того, как это работает. Кроме того, что это означает на практике?

1) Is the Task current state continuously being stored, or is only the Task ID stored? Where is it stored and what does it contain?
2) There are two Marathon instances. Marathon has been running Nginx for a week, then goes down. Does that mean that the actual Nginx application state continues running on the second Marathon instance, or does it just restart the task from beginning? If the Task actual state is copied, isn't there a lot of data to be continuously persisted and passed around between slaves? 

person user1340582    schedule 19.03.2015    source источник


Ответы (1)



Восстановление ведомых устройств — это функция Mesos, которая позволяет:

  • Исполнители/задачи, которые должны продолжать работать, когда подчиненный процесс не работает и
  • Позволяет перезапущенному подчиненному процессу восстановить соединение с запущенными исполнителями/задачами на подчиненном устройстве. (Восстановление Mesos Slave).

Итак, что касается ваших вопросов, это означает:

  1. Хранится достаточно информации (чуть больше, чем TaskID), чтобы новый подчиненный процесс мог повторно подключиться к все еще работающему исполнителю/задаче.

  2. Поскольку состояние задачи не имеет контрольной точки, она запустит задачу с самого начала.

Надеюсь, это поможет, Йорг

person js84    schedule 20.03.2015