FAQ
Calcul
Si mon job est directement en PENDING
pour Reason=Resources
Attention, une faute dans la syntaxe du fichier de submit peut provoquer cette “erreur”.
Quand je soumet un job, j’ai l’erreur AssocGrpJobsLimit
Cela signifie que le quota de job maximal en simultané pour la partition est atteint, il faut attendre qu’un job dans la partition finisse.
Quand je soumet un job, j’ai l’erreur AssocGrpCPUsLimit
Cela signifie que le quota de CPU pour la partition est atteint, il faut attendre qu’un job dans la partittion finisse.
Stockage
Mon répertoire $HOME est plein
Le quota par défaut est de 100 Go, faites un peu de nettoyage/rangement, ou demandez s’il est possible d’augmenter votre quota.
Combien d’espace je consomme dans mon $HOME ?
Vous pouvez le vérifier avec la commande :
quota -s
CPUs disponibles sur un noeud
J’aimerai savoir combien de CPUs sont alloués sur un noeud ?
Utilisez cette commande :
$ scontrol show node TESTNODE
NodeName=compute-0-4 Arch=x86_64 CoresPerSocket=12
CPUAlloc=20 CPUErr=0 CPUTot=48 CPULoad=10.00 Features=rack-0,48CPUs
Gres=ioperso:1
NodeAddr=10.1.255.245 NodeHostName=compute-0-4 Version=14.11
OS=Linux RealMemory=129180 AllocMem=115000 Sockets=4 Boards=1
State=MIXED ThreadsPerCore=1 TmpDisk=260810 Weight=20528104
BootTime=2015-09-02T11:30:42 SlurmdStartTime=2015-10-06T09:53:03
CurrentWatts=0 LowestJoules=0 ConsumedJoules=0
ExtSensorsJoules=n/s ExtSensorsWatts=0 ExtSensorsTemp=n/s
On peut y avoir 20 cpus alloués sur les 48 de la machine.
Hyperthreading
Je ne peux pas exécuter de job en utilisant l’hyperthreading
Par défaut l’hyperthreading est désactivé, pour l’utiliser :
$SBATCH --ntasks-per-core=2
Compilation
Quelle option mettre pour que mon code sous utilisable sur tout le cluster ?
Ne pas mettre d’option du type -x
comme -xAVX
, ou bien utilisez -axCORE-AVX2,AVX,SSE4.2
Quelle option utiliser en fonction de quel cpu/partition ?
- xeonv1 :
-xAVX
- xeonv2 :
-xAVX
- xeonv3 :
-xCORE-AVX2
- xeonv4 :
-xCORE-AVX2
- moonshot :
-xSSE4.2
Pour avoir plus d’informations sur les flags cpu dans les compilateurs : https://software.intel.com/en-us/articles/performance-tools-for-software-developers-intel-compiler-options-for-sse-generation-and-processor-specific-optimizations
MPI
Je dois utiliser mpirun
ou srun
?
Pour utiliser le mpi avec slurm, il est recommandé d’utiliser srun