расширить лимит времени выполнения для задания USUSP

когда я делал расчет на полпути, я просто обнаружил, что ограничение времени выполнения 50:00 может быть недостаточным. Поэтому я использую $bstop 1234, чтобы остановить задание 1234 и попытаться изменить старую среду выполнения с -W 50:00 на -W 100:00. Можете ли вы предложить команду для этого?

Я старался

$ bmod -W 100:00 1234 
Please request for a minimum of 32 cores!
For more information, please contact XXX@XXX.
Request aborted by esub. Job not modified.

$ bmod [-W 100:00| -Wn ]  1234
-bash: -Wn]: command not found
100:00[8217]: Illegal job ID.
. Job not modified.

согласно с

[-W [hour:]minute[/host_name | /host_model] | -Wn]

с http://www.cisl.ucar.edu/docs/LSF/7.0.3/command_reference/bmod.cmdref.html

Я не совсем понимаю синтаксис, -Wn означает время стены новое

Большое спасибо за вашу помощь!


lsf
person F14r3    schedule 25.10.2013    source источник


Ответы (1)


  • Первая команда не выполняется, потому что LSF вызывает обязательный esub, определенный вашим администратором, для выполнения предварительной обработки в командной строке, и это возвращает ошибку. Вот соответствующая цитата со страницы, на которую вы ссылаетесь:

Как и bsub, bmod вызывает главный esub (mesub), который вызывает все обязательные исполняемые файлы esub, настроенные администратором LSF, и любой исполняемый файл с именем esub (без .application), если он существует в LSF_SERVERDIR.

  • Вам придется придумать командную строку bmod, которая проходит проверки esub, но это может вызвать другие проблемы, потому что некоторые параметры (например, -n, я полагаю) не могут быть изменены во время выполнения по умолчанию, поэтому bmod отклонит запрос, если вы его укажете.

  • Параметр -Wn используется для полного удаления лимита выполнения из задания, а не для изменения его на другое значение.

person Squirrel    schedule 25.10.2013
comment
Да, ты прав! За попытку указать неизменный номер ядра (-n 32) меня также отвергают. Спасибо за разъяснения, так что остается только связаться с администратором. Просто любопытно, в следующий раз, если я захочу отправить задание, скажите $ bsub -n 32 -Wn ‹ mpi.lsf , чтобы у него больше не было ограничения на запуск. Это? - person F14r3; 26.10.2013
comment
Нет, опция -Wn доступна только для bmod. Вы можете попробовать что-то вроде «bmod -Wn ‹jobid›», чтобы удалить существующее ограничение времени выполнения из задания, но оно будет подчиняться тем же правилам, которые администратор наложил на вашу предыдущую попытку bmod. - person Squirrel; 24.11.2013
comment
спасибо, сэм. Я получаю ответ от администратора, что только системные ожидающие задания (еще не запущенные) могут выполнять это расширение, а в кластере существует жесткое ограничение по времени, которое я не могу нарушить. - person F14r3; 25.11.2013