Slurm/Task-Affinity

Aus IT Physics
Version vom 18. September 2021, 06:54 Uhr von Brendel (Diskussion | Beiträge) (neu)
(Unterschied) ← Nächstältere Version | Aktuelle Version (Unterschied) | Nächstjüngere Version → (Unterschied)
Zur Navigation springen Zur Suche springen
Die druckbare Version wird nicht mehr unterstützt und kann Darstellungsfehler aufweisen. Bitte aktualisiere deine Browser-Lesezeichen und verwende stattdessen die Standard-Druckfunktion des Browsers.

Cf. https://www.glennklockwood.com/hpc-howtos/process-affinity.html for an explanation.

Slurm is configured with TaskPlugin=task/affinity and can reserve cores for a job. srun's option --cpu-bind provides detailed control for that.

Checking with htop

Following /proc/cpuinfo, the "effective core id" of htop is T*32+S*16+C with

  • T = thread-ID ϵ {0,1} (the two threads on a core)
  • S = socket-ID ϵ {0,1} (the two CPUs with 16 cores)
  • C = core-ID ϵ {0,1,...,15} (the 16 physical cores)

In other words, the 4 columns in "htop" are S0T0 | S1T0 | S0T1 | S1T1, and avoiding hyper threading means to fill only the first two columns.