--default-unreachable-терпимости-секунды и --default-not-ready-терпимости-секунды не работают

Я обновил службу kube-apiserver с ограничениями допуска по умолчанию, равными 60 секундам.

--default-unreachable-toleration-seconds=60 
--default-not-ready-toleration-seconds=60

Я остановил кубелет на одном из моих узлов, он перешел в состояние неготовности.

Но проблема, с которой я столкнулся, заключается в том, что поды выселяются только через 5 минут после перехода узла в состояние неготовности. Ожидается, что капсулы должны быть удалены за 60 секунд.

Моя версия Kubernetes - 1.15.

Я перезапустил kube-controller-manager и kube-apiserver после того, как внес это изменение.

Что не так с процедурой?


person Karthik    schedule 06.04.2020    source источник


Ответы (1)


С этими двумя параметрами допуска по умолчанию Kubernetes автоматически добавит конфигурацию допуска для каждого модуля. Поэтому очень важно повторно развернуть все модули, чтобы обеспечить добавление допуска ко всем вашим модулям.

Альтернатива изменению параметров компонентов плоскости управления Kubernetes, что делает его глобальным изменением для всех модулей, вы также можете изменить время допуска для каждого модуля, используя следующую конфигурацию.

tolerations:
  - key: "node.kubernetes.io/unreachable"
    operator: "Exists"
    effect: "NoExecute"
    tolerationSeconds: 60
  - key: "node.kubernetes.io/not-ready"
    operator: "Exists"
    effect: "NoExecute"
    tolerationSeconds: 60

https://kubernetes.io/docs/concepts/configuration/taint-and-toleration/#taint-based-evictions

person Arghya Sadhu    schedule 06.04.2020
comment
Я не знаю, что мне пришлось переделывать свои стручки, сделаю это и проверю. Спасибо, что изучили это. Я ценю это. Я одобряю ответ после его проверки. - person Karthik; 06.04.2020
comment
Я повторно развернул свой модуль, и значение допуска для модулей не изменилось. Tolerations: node.kubernetes.io/not-ready:NoExecute for 300s node.kubernetes.io/unreachable:NoExecute for 300s - person Karthik; 06.04.2020
comment
вы удалили pod и повторно применили yaml? - person Arghya Sadhu; 06.04.2020
comment
У меня есть набор реплик, поэтому я удалил модуль, поэтому они снова создали новый модуль. я должен полностью стереть набор реплик и создать его с нуля? Я так и делаю, скоро обновлю - person Karthik; 06.04.2020
comment
NAME DESIRED CURRENT READY AGE smsgateway-smsgw-bw-staging-fst-20200401-phase-k8s 1 1 1 105s Когда я описываю капсулу, я вижу допуск только 300 с. Следующий вариант, который я собираюсь попробовать, - это добавить этот допуск напрямую к модулям, а не на уровне кластера. - person Karthik; 06.04.2020
comment
есть ли удача с этим? - person Arghya Sadhu; 06.04.2020
comment
С допусками, указанными в объеме модулей, модули удаляются вовремя после того, как узел становится не готовым. - person Karthik; 06.04.2020