Как Standby Resource Manager узнает об узле и соответствующих деталях метки узла, когда получает управление?

Когда резервный диспетчер ресурсов берет на себя управление, как он идентифицирует узлы и информацию об их метках узлов? Я имею в виду, где хранятся все эти метаданные и кто на самом деле отвечает за синхронизацию этих фрагментов информации?

Любая помощь будет оценена.

hadoop yarn resourcemanager

Abhishek Mishra 25.11.2019 источник

comment

Я бы предположил, что это Zookeeper. Вы смотрели на это? - OneCricketeer 28.11.2019

comment

спасибо, @cricket_007 Не в zookeeper, но я попробовал некоторые места в RM, такие как файл include_host внутри /etc/hadoop/conf, но он содержит только общий список хостов в пряже, включая все метки узлов. Любая идея о возможных местах поиска в zookeeper? - Abhishek Mishra 28.11.2019

Ответы (1)

arrow_upward
1
arrow_downward

Метки хранятся в HDFS.

В yarn-site.xml он определяется yarn.node-labels.fs-store.root-dir

https://hadoop.apache.org/docs/current/hadoop-yarn/hadoop-yarn-site/NodeLabel.html

OneCricketeer 28.11.2019

comment

Какие другие флаги и файлы конфигурации поддерживаются для полного аварийного восстановления при выходе из строя диспетчера ресурсов? - Abhishek Mishra; 29.11.2019

comment

Я предполагаю, что вы имеете в виду NodeManagers. Менеджеры ресурсов не имеют резервных копий. Это задокументировано здесь hadoop.apache.org/docs /current/hadoop-yarn/hadoop-yarn-site/ - OneCricketeer; 29.11.2019

comment

Кроме того, кто отвечает за ведение узлов и сведений об их метках узлов в HDFS? - Abhishek Mishra; 29.11.2019

comment

Я предполагаю, что диспетчер ресурсов сообщает свои метки диспетчеру узлов, который затем сохраняет в HDFS. - OneCricketeer; 29.11.2019

comment

На ваш предыдущий вопрос: нет, вся установка находится в HA с 3 узлами для каждого (RM и NM). Но когда активный RM выходит из строя, он теряет информацию об узле и его метке узла и добавляет все узлы в раздел по умолчанию. Вот почему я хотел знать эту метаинформацию, чтобы отладить основную причину. - Abhishek Mishra; 29.11.2019

comment

Насколько я знаю, у вас не может быть более двух RM, одного активного и одного резервного. Я бы проверил yarn-site.xml между всеми машинами на наличие различий - OneCricketeer; 29.11.2019

comment

Согласно документам Apache, в архитектуре RM HA - в любой момент времени один из RM является активным, а один или несколько RM находятся в режиме ожидания, ожидая, когда что-нибудь произойдет с активным. Ссылка [hadoop.apache.org/ документы/r3.0.3/hadoop-yarn/hadoop-yarn-site/ - Abhishek Mishra; 29.11.2019

comment

Как и когда Shutdown Nodes очищают от пряжи? увеличивая это до очень большого значения, увеличивая нагрузку пряжи. - Abhishek Mishra; 03.04.2020

comment

Привет, @cricket_007 извините, если я неясно выразился, но я хотел знать, как я могу удалить узлы отключения из пряжи? Это уже мертвые узлы. - Abhishek Mishra; 03.04.2020

Как Standby Resource Manager узнает об узле и соответствующих деталях метки узла, когда получает управление?

Ответы (1)

Похожие вопросы