Правильный запуск сценария Slurm с большим количеством узлов и меньшим количеством ядер

Каждый отдельный узел hpc имеет максимально возможное количество ядер, равное 24, но они часто не все доступны, поэтому я хотел бы запустить код на 4 узлах с 20 ядрами каждый (вместо 24).

Правильно ли такое использование MPI?

#!/bin/sh
#
# Replace <ACCOUNT> with your account name before submitting.
#
#SBATCH --account=aaa            # The account name for the job.
#SBATCH --job-name=job_name      # The job name.
#SBATCH -N 4                     # The number of nodes to use
                                 # (note there are 24 cores per node)
#SBATCH --exclusive
#SBATCH --time=23:58:00          # The time the job will take to run.

source activate env_python
mpirun -n 80 python script.py

# End of script

person Alex Punkallo    schedule 25.04.2018    source источник
comment
что вы имеете в виду под нечасто все доступно?   -  person Gilles Gouaillardet    schedule 26.04.2018
comment
Ресурсы недоступны, (я полагаю) кто-то использует некоторые ядра узла (ов)   -  person Alex Punkallo    schedule 26.04.2018


Ответы (1)


Это будет делать то, что вы хотите:

#!/bin/sh
#
# Replace <ACCOUNT> with your account name before submitting.
#
#SBATCH --account=aaa            # The account name for the job.
#SBATCH --job-name=job_name      # The job name.
#SBATCH -N 4                     # The number of nodes to use
                                 # (note there are 24 cores per node)
#SBATCH --tasks-per-node=20
#SBATCH --time=23:58:00          # The time the job will take to run.

source activate env_python
mpirun -n 80 python script.py

# End of script

Запрос 4 узлов с 20 задачами каждый, которые будут сопоставлены 80 рангам MPI. Тогда -n 80 не нужен.

person damienfrancois    schedule 26.04.2018