Die Shared-Memory-Plattform bietet dem Betreiber wirtschaftliche Vorteile und flexibelste Durchsatzmöglichkeiten; gleichzeitig erhält der Anwender alle Freiheiten für die Wahl seiner Codes, denn er kann auf der Maschine bei höchster Effizienz alle Typen von Parallelverarbeitungsprogrammen fahren, auch solche, die für Cluster geschrieben sind. Das Altix-System wird für 3 Jahre gemietet, nach einer europaweiten Ausschreibung, in der sich die SGI-Lösung gegen Angebote praktisch aller namhaften HPC-Anbieter durchsetzte. Sie lieferte unter Benchmarks mit Programmen der realen Anwendungswelt die beste Performanz. Hauptsächliche Anwender sind die Klimaforschung, Geowissenschaften, Astrophysik und Chemie.
"Ich bin außerordentlich froh über diese neue Maschine", so Dr. Steffen Richter, Kanzler der Universität. "Sie erlaubt uns, in der Forschung nicht nur schneller zu arbeiten, sondern auch neue herausfordernde Problemstellungen anzugehen. Der Service für die Wissenschaftler der Uni und der angegliederten Institute kann in ganz neue Größenordnungen vordringen. Das wird auch bei zukünftigen Berufungsverhandlungen eine Rolle spielen."
Auch für die Studierenden bringt das neue System Gewinn. In Lehrveranstaltungen zu mathematischen Verfahren für Parallelrechner und zum praktischen Umgang mit ihnen sollen Studierende und Wissenschaftler lernen, wie man mit Spitzentechnologie arbeitet, und sich so zusätzlich qualifizieren können.
Produktions-Maschine plus Vorrechner
Außer dem 3700er-System hat SGI noch zwei Altix-3300-Server installiert. Die mit je 8 Prozessoren ausgerüsteten kleineren Systeme sind dem großen Rechner vorgeschaltet und dienen als Login-Server bzw. Development-Server.
Das 128-Prozessor-System lässt sich damit völlig abgeschirmt von direkten, interaktiven Zugriffen betreiben. Im Batch-Betrieb als reine Produktions-Maschine arbeitend, wird es sich ungestört dem ´NumberCrunching´ der vielen diversen Rechenjobs widmen, die die Anwender über den Login-Server in die Job-Schlange einbringen.
Der Produktionsrechner hat einen 512 GB großen Arbeitsspeicher (Memory), zur Massenspeicherung dienen ihm rund 11 TeraByte Plattenkapazität, bereit gestellt von RAID-Array-Technologie SGI®InfiniteStorage. Die Itanium2-CPUs sind mit 1.3 GHz getaktet.
Aufgrund der Shared-Memory-Architektur können alle 128 Prozessoren den kompletten 512 GB großen Arbeitsspeicher in zusammenhängender Weise adressieren. Im Gegensatz zu weit verbreiteten Cluster-Lösungen ist es nicht erforderlich, dass Anwender ihre Rechenprobleme in kleine Einzelteile zerlegen. In das 512 GB große Shared-Memory der Altix 3700 lassen sich größte Simulationsmodelle auch in unzerstückelter Form hineinladen. Und wenn sich die CPUs an die gemeinschaftliche Parallelverarbeitung machen, können sie dies mit beispielhafter Effizienz tun. Die mehrfach ausgezeichnete Systemarchitektur SGI®NUMAflex™ organisiert die Kommunikation zwischen den parallel arbeitenden Einheiten so intelligent, dass sie die Zeit nicht mit Abstimmungsaufwand, sondern mit produktivem Rechnen verbringen.
Flexibilität, Performanz, Wirtschaftlichkeit
Ralf Bröck, Director des zentralen Rechenzentrums der Universität Kiel: "Egal ob die Parallelcodes nach dem Shared-Memory- oder nach dem Distributed-Memory-Programmiermodell geschrieben sind, ob sie auf OpenMP oder auf MPI basieren - die Altix-Architektur stellt den beteiligten Prozessoren bei der Parallelverarbeitung industrieführende Bandbreite zur Verfügung. Die Maschine unterstützt Jobs, die viele Prozessoren beanspruchen, ebenso wie solche, die sehr viel Arbeitsspeicher für relativ wenige CPUs benötigen. Das alles gibt uns die Flexibilität, um der HPC-Plattform sehr heterogene Workflows mit variierenden Job-Mixes aufzuladen."
"SGI hat im vorgegebenen Budget-Rahmen die Leistungsanforderungen am besten erfüllt," erklärt Bröck. "Dabei zählte in erster Linie die Performanz und Skalierbarkeit. Wir haben drei der wichtigsten Real-Life-Anwendungen benchen lassen - Codes die unsere rechenintensivsten Anwender in der Ozeanographie, Geophysik und Quantenchemie in der tagtäglichen Praxis einsetzen. Das Altix-System hat Topergebnisse geliefert, ein Bild, das durch einen synthetischen Benchmark noch abgerundet wurde."
Erfüllt wurden ebenso Zuverlässigkeitsaspekte, die Frage, über welches KnowHow der Anbieter in Sachen HPC verfügt, sowie Wirtschaftlichkeitsaspekte. Bröck: "Altix erlaubt, alle 128 CPUs unter einer einzigen Linux-Partition zu betreiben. Das ist einzigartig in der Branche und vereinfacht die Administration. Linux bedeutet für uns auch weniger Aufwand, weil wir mit OpenSource-Produkten vertraut sind und sie auf PCs und Servern einsetzen. Das Gleiche gilt für Anwender. Linux ist beim Pre- und Post-Processing eine verbreitete Umgebung, und für die, die an ihren Workstations eigene Linux-basierte Codes entwickeln, ist die Altix eine Plattform mit direktem Migrationsweg."
Studenten und Programme - fit machen für Höchstleistungs-Tools
Bevor solche Codes jemals die Chance erhalten, auf die Produktionsmaschine zu gelangen, werden sie zunächst auf dem Development-Server fit gemacht. Hier können Programme, die von der Single-CPU-Workstation kommen und parallelisiert werden sollen, zunächst im kleineren Rahmen auf befriedigende Performanz und Skalierbarkeit hin angestestet werden und bis zur Altix-3700-"Reife" weiterentwickelt werden.
Einer der Hauptnutzer der Development-Plattform wird der Bereich Praktische Mathematik der Informatik sein, mit speziellen Forschungsprojekten aus der Numerik. Auf dem Server soll gezielt numerische Methodenentwicklung stattfinden, sollen neue und optimierte Parallelisierungs-Algorithmen erprobt werden. Auf der isoliert vom Produktionsbetrieb arbeitenden Development-Plattform hat man die Möglichkeit, Test-Runs und sensible Skalierbarkeits-Messungen ohne Störeinflüsse durchzuführen.
Nicht zuletzt wird der Development-Server die Ausbildung unterstützen. In Kooperation mit der Praktischen Mathematik sollen Studenten mit dem Thema Methoden-Entwicklung und Parallel-Algorithmen konkret vertraut gemacht und trainiert werden. So so dass sie eine Produktiv-Maschine wie die Altix 3700 mit allen ihren dazugehörenden Tools und Utilities zu nutzen lernen und sie in der Lage sind, bei späteren eigenen Forschungsprojekte auf modernste Supercomputing-Technologie zurückzugreifen.
Die SGI-Lösung ersetzt im Kieler Rechenzentrum als neuer Parallelrechner ein früheres Cray-T3E-System, das jedoch nur unter MPI-Codes (Message-Passing-Codes) zu nutzen war. Neben dem Parallelrechner SGI Altix betreibt das Rechenzentrum noch eine Vektor-Maschine NEC-SX5 mit 16 Prozessoren.
Realistischere Modelle, höhere Auflösungen, alternative Szenarien
Mit dem neuen Parallelrechner an Bord, werden Anwender Projekte schneller durchziehen und die Qualität ihrer Simulationen weiter vorantreiben können. Ziele und Herausforderungen sind klar: Die Modelle sollen realistischer werden, indem man mehr der tatsächlich relevanten, oft sehr komplexen Prozesse mit abbildet; man möchte genauer rechnen, indem man die Auflösung erhöht; und man möchte mehr Varianten, mehr alternative Szenarien durcharbeiten. Das gilt gleichermaßen für die Grundlagenforschung wie für die angewandte Forschung.
Im Anhang ( www.sgi.de/newsroom) finden sich Beispiele mit Bildern aus drei Anwenderbereichen (Klima Geophysik/Marine Astrophysik).