Восстановить кворум Etcd

У меня есть кластер Kubernetes, распределенный на AWS через Kops, состоящий из 3 главных узлов, каждый в разной зоне доступности. Как хорошо известно, Kops реализует развертывание кластера, в котором Etcd выполняется на каждом главном узле через два модуля, каждый из которых монтирует том EBS для сохранения состояния. Если вы теряете объемы 2 из 3 мастеров, вы автоматически теряете консенсус между мастерами.

Есть ли способ использовать информацию о единственном мастере, который все еще имеет статус кластера, и получить кворум между тремя мастерами в этом состоянии? Я воссоздал этот сценарий, но кластер становится недоступным, и я больше не могу получить доступ к модулям Etcd любого из трех мастеров, потому что эти модули выходят из строя с ошибкой. Более того, Etcd сам становится доступным только для чтения, и невозможно добавлять или удалять элементы кластера, чтобы попытаться выполнить ручное вмешательство.

Подсказки? Всем спасибо


person falberto89    schedule 15.10.2018    source источник


Ответы (1)


Это задокументировано здесь. Здесь также есть еще одно руководство, здесь

По сути, вам нужно сделать резервную копию своего кластера и создать новый.

person Rico    schedule 15.10.2018