У меня есть кластер Kubernetes, распределенный на AWS через Kops, состоящий из 3 главных узлов, каждый в разной зоне доступности. Как хорошо известно, Kops реализует развертывание кластера, в котором Etcd выполняется на каждом главном узле через два модуля, каждый из которых монтирует том EBS для сохранения состояния. Если вы теряете объемы 2 из 3 мастеров, вы автоматически теряете консенсус между мастерами.
Есть ли способ использовать информацию о единственном мастере, который все еще имеет статус кластера, и получить кворум между тремя мастерами в этом состоянии? Я воссоздал этот сценарий, но кластер становится недоступным, и я больше не могу получить доступ к модулям Etcd любого из трех мастеров, потому что эти модули выходят из строя с ошибкой. Более того, Etcd сам становится доступным только для чтения, и невозможно добавлять или удалять элементы кластера, чтобы попытаться выполнить ручное вмешательство.
Подсказки? Всем спасибо