Die High Performance Compute Cluster
Das ITMZ betreibt ständig ein oder zwei unabhängige HPC Systeme. Ein "Altsystem" welches sich häufig nicht mehr in der Wartung durch den Hersteller befindet, daher nicht mehr erweitert und "auf Verschleiß" betrieben wird, dazu ein aktuelles System welches noch erweitert werden kann und für das ein Wartungsvertrag mit den Lieferanden besteht.
Aktuell ist nur der HPC TITAN im Betrieb. Ein neues System wird im ersten Quartal 2019 beschafft und spätestens im zweiten Quartal an die Nutzer übergeben.
Der HPC TITAN
Der Cluster-Rechner Titan hat am 1. Mai 2015 seinen Betrieb aufgenommen.
Titan besitzt zwei Login-Knoten:
- titan1.hpc.uni-rostock.de
- titan2.hpc.uni-rostock.de
auf diesen können sich die Nutzer anmelden, ihre Simulationen und Berechnungen konfigurieren sowie die einzelnen Jobs an den Ressourcenmanager SLURM übergeben.
Zusätzlich existieren zwei Post-Processing Knoten
- titan1post.hpc.uni-rostock.de
- titan2post.hpc.uni-rostock.de
Diese sind mit einer grafischen Oberfläche, GPU-Karten und sehr viel Hauptspeicher ausgestattet. Sie ermöglichen den Wissenschaftlern eine grafische Visualisierung und Auswertung der Rechen- und Simulations-Ergebnisse.
Als Rechenknoten stehen 300 Knoten mit je 16 Cores zur Verfügung. Der Hauptspeicherausbau pro Knoten beträgt 64GB. Als Scratchdisk verfügt jeder Knoten über 100GB SSD-Speicher. Die Maximale Jobgröße beträgt somit:
- 4800 CPU-Kerne
- 19 TB RAM
- 30 TB Scratch
Betriebskonzept der Cluster
Die HPC-Systeme werden zentral vom ITMZ beschafft, betrieben und auch administrativ verwaltet. Das ITMZ stellt dabei die Infrastruktur für den Clusterbetrieb wie Stellplatz, Strom, Netzwerk und Kühlung bereit. Einzelne Forschungsbereiche der Universität können eigenständig Gelder einwerben und mit diesen Erweiterungen der Cluster finanzieren. Basierend auf den finanzierten Erweiterungen wird diesen Bereichen und Nutzergruppen eine höhere Priorität bzw besondere oder erweiterte Ressourcen durch den Ressourcenmanager SLURM zugewiesen bzw. bereitgestellt. Temporär von Arbeitsgruppen nicht genutzte Ressourcen werden in einen speziellen Ressourcen-Pool gegeben und können derweil durch andere Clusternutzer verwendet werden. Somit lässt sich eine sehr hohe Auslastung realisieren.
Zeitplan für Cluster-Erweiterungen
Erweiterungen des Clusters durch eingeworbene Gelder sind immer nur an zwei Terminen des Jahres vorgesehen. Dadurch soll ein größeres finanzielles Gesamtvolumen der Erweiterung erreicht werde.
Die nächsten geplanten Termine für Erweiterungen sind:
- 1. November 2019 vor Kassenschluss
- 1. April 2020 nach Mittelzuweisung an die Bereiche
Bitte informieren Sie das ITMZ frühzeitig über geplante Erweiterungen.