То, как я начинаю слёрмить:
mkdir -p /tmp/slurmstate/clustername
sudo slurmd
sudo munged -f
/etc/init.d/munge start
sudo slurmdbd
sudo slurmctld -c
-
sacctmgr list cluster
Cluster ControlHost ControlPort RPC Share GrpJobs GrpTRES GrpSubmit MaxJobs MaxTRES MaxSubmit MaxWall QOS Def QOS
---------- --------------- ------------ ----- --------- ------- ------------- --------- ------- ------------- --------- ----------- -------------------- ---------
cluster 0 7936 1 normal
Запуск slurmctld -cD
дает мне следующую ошибку. Имя кластера возвращает неверную строку, которую я не знаю. Как я могу это исправить?
> slurmctld -cD
slurmctld: fatal: CLUSTER NAME MISMATCH.
slurmctld has been started with "ClusterName=�����", but read "cluster" from the state files in StateSaveLocation.
Running multiple clusters from a shared StateSaveLocation WILL CAUSE CORRUPTION.
Remove /tmp/slurmstate/clustername to override this safety check if this is intentional (e.g., the ClusterName has changed).
Примечание. Когда я пытаюсь запустить slurm от имени пользователя root и переключиться обратно, возникает эта проблема. Мне пришлось переустановить mysql, чтобы исправить это.
Спасибо за ваше драгоценное время и помощь.
ClusterName
вslurm.conf
и убедиться, что кодировка этого файла верна. - person damienfrancois   schedule 12.06.2017slurm.conf file
какClusterName=cluster
. @Дэмиенфрансуа - person alper   schedule 12.06.2017/tmp/slurmstate/clustername
как каталог (из вашего последнего редактирования)? --- 2) Я думаю, что сообщение об ошибке неверно, если я прочитал исходный код корректен, непечатаемые символы были найдены в файле состояния, а не вslurm.conf
(ошибка реальна, но сообщение, к сожалению, переключает значения) - person Hugues M.   schedule 18.06.2017