ожидающие задания slurm не отображаются в sacct

У меня возникла проблема с slurm, когда sacct не показывает ожидающие задания. Ниже вы можете видеть, что задание 110061 не отображается в sacct, но явно находится на рассмотрении в squeue. Любые идеи относительно того, почему это произойдет?

[plcmp14evs:/sim/dev/ash/projects/full-trees] 153% sacct -j 110061
       JobID    JobName  Partition    Account  AllocCPUS      State ExitCode
------------ ---------- ---------- ---------- ---------- ---------- --------
[plcmp14evs:/sim/dev/ash/projects/full-trees] 154% squeue -j 110061
  JOBID PARTITION    STATE     USER       TIME TIMELIMIT  NODES NODELIST(REASON) NAME
 110061  eventual  PENDING    andrew      0:00 UNLIMITED      1   (Priority)    [rf] script.8.R

-- Редактировать --

Это результат scontrol show config | grep Acc

AccountingStorageBackupHost = (null)
AccountingStorageEnforce = none
AccountingStorageHost   = localhost
AccountingStorageLoc    = /disks/linux/tmp/slurm_accounting.txt
AccountingStoragePort   = 0
AccountingStorageType   = accounting_storage/filetxt
AccountingStorageUser   = root
AccountingStoreJobComment = YES
JobAcctGatherFrequency  = 3 sec
JobAcctGatherType       = jobacct_gather/linux

person andrew    schedule 09.09.2014    source источник
comment
Вы уверены, что учет включен? Что scontrol show config говорит о AccountingStorageType ?   -  person damienfrancois    schedule 10.09.2014
comment
Да, учет определенно включен, он работает нормально для всех заданий, кроме тех, которые находятся в состоянии ожидания. Обновленный пост с некоторыми выводами scontrol.   -  person andrew    schedule 10.09.2014
comment
Внезапно ли появляются задания, когда они начинают выполняться или когда они заканчиваются? -- Кроме того, sacct не является псевдонимом с параметрами фильтрации для sacct? (Пытаюсь исключить максимум вариантов..)   -  person damienfrancois    schedule 10.09.2014
comment
Задания внезапно появляются, как только они начинают выполняться. И sacct — это просто старый добрый инструмент командной строки sacct, без псевдонима.   -  person andrew    schedule 10.09.2014
comment
Однако после запуска кажется, что он не будет обновляться снова до следующего изменения состояния, потому что sacct всегда говорит, что прошедшее время равно 00:00:00 во время работы, но при завершении/сбое sacct в то время как имеет правильное прошедшее время . Хотя, если задание переходит из запущенного в приостановленное, прошедшее время по-прежнему равно 00:00:00.   -  person andrew    schedule 10.09.2014
comment
каково значение JobAcctGatherFrequency ?   -  person damienfrancois    schedule 11.09.2014
comment
JobAcctGatherFrequency – 3 сек.   -  person andrew    schedule 11.09.2014
comment
У меня такая же проблема, но только с заданиями с зависимостями... проблема решена?   -  person fransua    schedule 26.07.2019


Ответы (1)


На данный момент нечего записывать, так как работа еще даже не началась.

person Itkovian    schedule 18.05.2018