Die High Performance Compute Cluster

Das ITMZ betreibt ständig ein oder zwei unabhängige HPC Systeme. Ein "Altsystem" welches sich häufig nicht mehr in der Wartung durch den Hersteller befindet, daher nicht mehr erweitert  und "auf Verschleiß" betrieben wird, dazu ein aktuelles System welches noch erweitert werden kann und für das ein Wartungsvertrag mit den Lieferanden besteht.

Aktuell handelt es sich dabei um die Cluster TITAN (Altsystem 2015 mit rund 300 Knoten Intel(R) Xeon(R) CPU E5-2640 v3 ) und HAUMEA (2019 mit rund 190Knoten Intel(R) Xeon(R) Gold 6248 CPU).

Betriebskonzept der Cluster

Die HPC-Systeme werden zentral vom ITMZ beschafft, betrieben und auch administrativ verwaltet. Das ITMZ stellt dabei die Infrastruktur für den Clusterbetrieb wie Stellplatz, Strom, Netzwerk und Kühlung bereit. Einzelne Forschungsbereiche der Universität können eigenständig Gelder einwerben und mit diesen Erweiterungen der Cluster finanzieren. Basierend auf den finanzierten Erweiterungen wird diesen Bereichen und Nutzergruppen eine höhere Priorität bzw besondere oder erweiterte Ressourcen durch den Ressourcenmanager SLURM zugewiesen bzw. bereitgestellt. Temporär von Arbeitsgruppen nicht genutzte Ressourcen werden in einen speziellen Ressourcen-Pool gegeben und können derweil durch andere Clusternutzer verwendet werden. Somit lässt sich eine sehr hohe Auslastung realisieren.

Zeitplan für Cluster-Erweiterungen

Erweiterungen des Clusters durch eingeworbene Gelder sind immer nur an zwei Terminen des Jahres vorgesehen. Aktuell besteht jedoch keine Erweiterungsmöglichkeit, da die von der Rechenzentrums-Infrastruktur vorgegebenen Grenzen erreicht werden. Ein neues HPC System wird spätestens 2025 beschafft und befindet sich zur Zeit in der Planung.

Bitte informieren Sie das ITMZ frühzeitig (mehr als ein halbes Jahr) über geplante Erweiterungen oder Beteiligungen.