FAQ

Calcul

Si mon job est directement en PENDING pour Reason=Resources

Attention, une faute dans la syntaxe du fichier de submit peut provoquer cette “erreur”.

Quand je soumet un job, j’ai l’erreur AssocGrpJobsLimit

Cela signifie que le quota de job maximal en simultané pour la partition est atteint, il faut attendre qu’un job dans la partition finisse.

Quand je soumet un job, j’ai l’erreur AssocGrpCPUsLimit

Cela signifie que le quota de CPU pour la partition est atteint, il faut attendre qu’un job dans la partittion finisse.

Stockage

Mon répertoire $HOME est plein

Le quota par défaut est de 100 Go, faites un peu de nettoyage/rangement, ou demandez s’il est possible d’augmenter votre quota.

Combien d’espace je consomme dans mon $HOME ?

Vous pouvez le vérifier avec la commande :

quota -s

CPUs disponibles sur un noeud

J’aimerai savoir combien de CPUs sont alloués sur un noeud ?

Utilisez cette commande :

$ scontrol show node TESTNODE
NodeName=compute-0-4 Arch=x86_64 CoresPerSocket=12
   CPUAlloc=20 CPUErr=0 CPUTot=48 CPULoad=10.00 Features=rack-0,48CPUs
   Gres=ioperso:1
   NodeAddr=10.1.255.245 NodeHostName=compute-0-4 Version=14.11
   OS=Linux RealMemory=129180 AllocMem=115000 Sockets=4 Boards=1
   State=MIXED ThreadsPerCore=1 TmpDisk=260810 Weight=20528104
   BootTime=2015-09-02T11:30:42 SlurmdStartTime=2015-10-06T09:53:03
   CurrentWatts=0 LowestJoules=0 ConsumedJoules=0
   ExtSensorsJoules=n/s ExtSensorsWatts=0 ExtSensorsTemp=n/s

On peut y avoir 20 cpus alloués sur les 48 de la machine.

Hyperthreading

Je ne peux pas exécuter de job en utilisant l’hyperthreading

Par défaut l’hyperthreading est désactivé, pour l’utiliser :

$SBATCH --ntasks-per-core=2

Compilation

Quelle option mettre pour que mon code sous utilisable sur tout le cluster ?

Ne pas mettre d’option du type -x comme -xAVX, ou bien utilisez -axCORE-AVX2,AVX,SSE4.2

Quelle option utiliser en fonction de quel cpu/partition ?

  • xeonv1 : -xAVX
  • xeonv2 : -xAVX
  • xeonv3 : -xCORE-AVX2
  • xeonv4 : -xCORE-AVX2
  • moonshot : -xSSE4.2

Pour avoir plus d’informations sur les flags cpu dans les compilateurs : https://software.intel.com/en-us/articles/performance-tools-for-software-developers-intel-compiler-options-for-sse-generation-and-processor-specific-optimizations

MPI

Je dois utiliser mpirun ou srun ?

Pour utiliser le mpi avec slurm, il est recommandé d’utiliser srun