Digitale Pressemappe RAMSES
Neuer High-Perfomance Computing Cluster an der Universität zu Köln
Am 06.09.2024 um 14 Uhr wird RAMSES, der neue High-Perfomance Computing Cluster der Universität zu Köln mit einem Festakt in Betrieb genommen.
RAMSES steht für Research Accelerator for Modeling and Simulation with Enhanced Security.
Mit einer 48-fach erhöhten Leistung im Vergleich zu seinem Vorgängersystem CHEOPS setzt RAMSES neue Maßstäbe für die Forschungsinfrastruktur an der Universität zu Köln. Auf dieser Seite beleuchten wir die verschiedenen Aspekte des Systems:
- Konzeption
- Zahlen, Daten, Fakten zu RAMSES
- Research: Die Kernforschungsbereiche
- Modeling and Simulation
- Kontaktdaten
Konzeption
Starke Infrastruktur am Forschungsstandort Köln
Der Supercomputer RAMSES ist das Ergebnis jahrelanger Forschung im Rahmen von fachübergreifender Kooperationen. In seine Konzeption sind insbesondere die Anforderungen aus den Lebenswissenschaften und der Medizin eingeflossen, die sich aus zahlreichen Drittmittelprojekten wie NGSgoesHPC, Smoose und dem SFB 1399 ergeben haben. RAMSES stellt somit ein System dar, das durch seine konzeptionelle Ausrichtung von der Planung bis zur Inbetriebnahme auf die Unterstützung dieser Forschungsbereiche ausgerichtet ist.
Für andere Fachbereiche bietet der Nachfolger von CHEOPS ebenfalls erhebliche Verbesserungen. Vor allem Forschungsgebiete, die auf rechenintensiven Simulationen basieren, werden von RAMSES profitieren: von der theoretischen Astronomie bis hin zu den Digital Humanities.
Innovatives High-Performance Computing mit sicheren Daten für exzellente Forschung
Das HPC-System RAMSES ist ein integraler Bestandteil der Forschungsinfrastruktur an der Universität zu Köln. Als Nachfolgesystem von CHEOPS übernimmt es nicht nur Rechenaufgaben in bestehenden Exzellenzclustern, wie dem CECAD oder dem ML4Q, sondern bietet auch dem geplanten Exzellenzcluster Our Dynamic Universe von Anfang an eine starke Basis für komplexe numerische Simulationen zur Erforschung des Universums.
Von Beginn an wurde das System so konzipiert, dass es auch höchsten Sicherheitsansprüchen in der genomischen Forschung entspricht, in der mit hochsensiblen Daten beispielsweise nach Ansätzen zur Heilung seltener Krankheiten gesucht wird. Die Rechenleistung von RAMSES, gepaart mit seiner Sicherheitsarchitektur und der Zertifizierung des ITCC als Genomrechenzentrum, bildet eine starke Grundlage für die Erforschung der komplexesten medizinischen und lebenswissenschaftlichen Problemstellungen.
Auch in neuen Forschungsfeldern, wie der ökologischen Genetik aus dem Bereich der Lebenswissenschaften (v.a. Botanik & Zoologie), bietet die Leistung von RAMSES fortschrittliche neue Möglichkeiten. So können mit seiner Hilfe bspw. Auswirkungen des Klimawandels auf die Adaptionsfähigkeit von Organismen effizienter studiert werden.
Die Analyse klinischer Genomdaten gehörte bisher nicht zum klassischen Nutzungsfeld von HPC-Systemen. RAMSES ändert das — mit durchgehender Verschlüsselung im gesamten Berechnungsprozess und einer darauf abgestimmten Systemarchitektur, die derzeit bundesweit einzigartig ist. Die Systemarchitektur und das Betriebsmodell wurden in Forschungskooperationen maßgeschneidert für diesen Anwendungsbereich entwickelt, und wir passen beides in enger Zusammenarbeit mit unseren Partnern aus Forschung und Industrie kontinuierlich an.
Zahlen, Daten, Fakten
- 164 Rechenknoten, 10 Kubernetes Knoten
- 348 CPUs = 31576 Cores
- Beschleuniger
- 40 NVIDIA Hopper H100 GPUs
- 32 NVIDIA A30 GPUs
- 2 AMD Instinct GPUs
- 2 NEC Vector Engines
- Performance
- CPU Performance: 1,7 PFLOP/s
- GPGPU Performance: 3,1 PFLOP/s
- Gesamtperformance: 4,8 PFLOP/s
- Hauptspeicher
- 167 TB
- Storage
- 15 PB HDD Speicherplatz
- 940 TB SSD NVMe Speicherplatz
- Hochleistungsnetzwerk
- HDR100 InfiniBand
Investitionsvolumen
Gesamtinvestitionsvolumen: Circa 12 Millionen Euro
RAMSES am ITCC
Die Kernforschungsbereiche
RAMSES ist für vier und mit vier Kernforschungsbereichen entwickelt worden, die als Teil der Exzellenzstrategie der Universität zu Köln besonders im Fokus stehen und rechenintensive Forschung auf der Infrastruktur der Universtiät betreiben: Astophysik, Lebenswissenschaften, Medizin und Quantenphysik.
Inspiriert von der Tradition, altägyptische Namen für die HPC-Cluster der Universität zu vergeben, sind diese Bereiche auch auf der Verkleidung des Clusters in der Serverhalle des ITCC abgebildet worden.
In Zusammenarbeit mit dem Systemhersteller NEC sowie Frau Dr. Kootz vom Institut für Afrikanistik und Ägyptologie der Universität sind Grafiken entstanden, die die o.g. Forschungsbereiche illustrieren und ihre Namen in altägyptischen Hieroglyphen wiedergeben.
Astrophysik
Im Fachbereich Astrophysik wird RAMSES einen maßgeblichen Teil der Forschungsinfrastruktur stellen, ganz besonders im Teilbereich der Simulation. Beobachtete astrophysikalische Prozesse können mit der Rechenkraft des Systems unter Anwendung physikalischer Gesetze auf RAMSES simuliert werden.
Die Untersuchung dieser Simulationssysteme und deren Ergebnisse lassen sodann Rückschlüsse auf die ursprünglichen Beobachtungen im All zu, die als weitere Forschungsgrundlage dienen.
Derartige Simulationen sind sehr rechenintensiv, weshalb insb. die um ein Vielfaches erhöhte Leistung des Systems eine signifikante Verbesserung der Forschungsinfrastruktur für diesen Bereich ausmacht.
Simulationen sind die Experimente der Astrophysiker, mit denen langwierige Prozesse wie die Entstehung von neuen Sternen oder die Entwicklung von Galaxien im engen Austausch mit astronomischen Beobachtungen studiert werden können. Unsere Simulationen sind sehr rechenzeitintensiv, da viele physikalische Prozesse sowie die unterschiedlichsten Größen- und Zeitskalen miteinander verknüpft werden müssen. Dies bedarf der Entwicklung neuartiger numerischer Methoden auf parallelen HPC-Systemen. Die Simulationen können nur mit Höchstleistungsrechnern durchgeführt werden. RAMSES ist für unsere Forschung daher unverzichtbar und wird mit Spannung und Vorfreude erwartet.
Medizin
Das in Zusammenarbeit mit Partnern aus der genombasierten Forschung und dem Cologne Center for Genomics (CCG) entwickelte, innovative Systemkonzept von RAMSES eröffnet zusätzlich zur Nutzung in den Naturwissenschaften für die Lebenswissenschaften und die Genomdatenanalyse neue und vielfältige Möglichkeiten.
In diesem Bereich besitzt das ITCC seit Juli 2024 ein besonderes Profil: Als eines von wenigen zugelassenen Genomrechenzentren in Deutschland wird es im Modellvorhaben „Genomsequenzierung“ mit der Verarbeitung von Genomdaten beauftragt sein, die zur Erforschung von Heilungsperspektiven für erblich bedingte Krankheiten und Krebs beitragen werden.
Unsere Forschung basiert auf Hochdurchsatzanalysen von genomischen Daten, um die genetischen Grundlagen erblich bedingter Tumorerkrankungen noch besser zu verstehen. Mit seinen durchdachten Konzepten zur Datensicherheit und seiner enormen CPU- wie GPU-basierten Rechenkapzität, aber ebenso als Teil der nationalen Infrastruktur des Deutschen Humangenom-Phänomarchivs GHGA und des Modellvorhabens Genomsequenzierung, wird uns der Hochleistungsrechner RAMSES exzellente Voraussetzungen für unsere zukünftige Arbeit bieten.
Lebenswissenschaften
Während der Fachbereich Medizin hauptsächlich Forschungen an menschlichen Probanden betreibt, weiten die Lebenswissenschaften den Fokus und beleuchten Menschen, Tiere und Pflanzen. Allen Bereichen ist gemein, dass mittels modernster Methoden immer größere Datenmengen gewonnen werden.
HPC ermöglicht es den Forschenden, die gewonnenen Daten zu verarbeiten oder komplexe Simulationen durchzuführen. So können zum Beispiel aus genetischen Sequenzierdaten vollständige Genome von Lebewesen berechnet oder Hinweise erhalten werden, welche Gene unter welchen Umständen besonders aktiv sind. Wichtig ist dies in der Krebsforschung oder im Bereich der ökologischen Genetik von Pflanzen, in der man Zusammenhänge zwischen der Adaption an Umweltveränderungen und genetischer Veränderung zu verstehen versucht.
Weil Krebsgenomforschung sehr rechenintensiv ist und sensible Daten verarbeitet werden, wird RAMSES unsere Forschung sowohl erheblich beschleunigen als auch sicherer machen. Darüber hinaus können wir durch unsere langjährige Zusammenarbeit mit der HPC-Abteilung des ITCC unsere Algorithmen passgenau auf die jeweilige Recheninfrastruktur anpassen und optimieren.
Quantenphysik
ML4Q will so bspw. neue Computer- und Netzwerkarchitekturen schaffen, die auf den Prinzipien der Quantenmechanik beruhen. Quantencomputer versprechen revolutionäre Rechenleistung, die technologische Anwendungen weit jenseits des Horizonts klassischer Informationstechnologie in Reichweite bringt.
Die numerische Simulation von Quantenprozessoren auf RAMSES ist ein integraler Bestandteil unseres Exzellenzclusters ML4Q, und damit auch der Entwicklung von Rechen- und Netzwerkleistungen, die die Möglichkeiten klassischer Computer weit übersteigen.
Mathematik
Im Center for Data and Simulation Science (CDS) der UzK forschen Wissenschaftler:innen an anwendungs- und methodenwissenschaftlichen Fragestellungen. Für die Simulation der dabei betrachteten komplexen Modelle sind parallel skalierende Algorithmen und die Verarbeitung großer Datenmengen oft unabdingbar. In Kombination mit modernen, datenwissenschaftlichen Methoden und Verfahren des maschinellen Lernens ergeben sich sehr hohe Anforderungen an die hierfür benötigte Hardware.
Durch seine Größe und spezifische Architektur wird RAMSES gerade im Bereich der Simulations- und Datenwissenschaften ein Katalysator an der Universität zu Köln sein und die lokale Expertise in diesem wichtigen Bereich der IT-Infrastruktur erheblich stärken.
Modeling And Simulation
Daten, Simulationen und Modellierung an der UzK
Die Modellierung und Simulation realer Prozesse ist ein integraler Bestandteil aktueller Forschung an der Universität zu Köln. RAMSES stellt hierzu eine Kernressource für das Center for Data and Simulation Science (CDS) bereit, indem Datenwissenschaften, Datenverarbeitung und Fachwissenschaften gemeinsam neue Anwendungsbereiche für High-Perfomance Computing erschließen.
Simulationen sind in vielen Fachbereichen für verschiedene Szenarien ein wichtiges Forschungsmittel: In den Lebenswissenschaften können Veränderungsprozesse simuliert werden; in den Digital Humanities und der Tumorforschung können mit Hilfe von Machine Learning Prozesse modelliert werden; und Flüssigkeitssimulationen in der Physik bzw. Mathematik können so Erkenntnisse bspw. zur Prävention von und Reaktionen auf Naturkatastrophen produzieren. Insbesondere das Zusammenspiel hoher Rechenleistung (RAMSES) mit der Visualisierungs-Infrastruktur des ITCC (CAVE) ist eine mächtige Ressource für die Weiterentwicklung von Forschung, Studium und Lehre an unserer Universität.
On-Premise Visualsierung in der CAVE
In der CAVE (Cave Automatic Virtual Environment), einem mehrdimensionalen Projektionsraum, werden die menschlichen Fähigkeiten genutzt, sich durch komplexe räumliche Strukturen zu bewegen, sowie Abstände, Proportionen und zeitliche Veränderungen zu beurteilen. Die CAVE bietet darüber hinaus die Möglichkeit, das Fortschreiten besonders zeitintensiver Rechenjobs zu beobachten und unter Umständen interaktiv zu steuern (Simulation Steering). Um die Anforderungen an die Übertragungsgeschwindigkeit und Sicherheit der Forschungsergebnisse einhalten zu können, ist es dabei sinnvoll, die CAVE auch räumlich nah an Großrechenanlagen zu positionieren.
Enhanced Security
Sicherer Systemzugriff
Der Zugang zum System wird über Mehrfaktor-Authentifizierung ermöglicht, sodass sichergestellt ist, dass nur berechtigte Nutzer:innen Zugriff erhalten. Dabei sind personengebundene SSH-Schlüssel die Basis, um auf RAMSES zu arbeiten. Die Anmeldung im System anhand eines Passworts entspricht nicht heutigen Sicherheitsstandards und ist daher ausgeschlossen.
Verschlüsselung von Datentransfer bis Lagerung
Die Sicherheitsarchitektur von RAMSES ist darauf ausgelegt, Daten in allen Verarbeitungsstadien stets zu verschlüsseln. Sie orientiert sich dabei an den Prinzipien der Verschlüsselung bei Gebrauch (Encryption in Use), während des Lagerns (Encryption at Rest) und während des Datentransfers (Encryption in Motion). Sowohl das verteilte, parallele Dateisystem als auch der hochperformante Arbeitsspeicher nutzen Verschlüsselungsmechanismen, die von der genutzten Prozessortechnologie zu Verfügung gestellt werden. Vom Datentransfer über einen sicheren Tunnel bei der Kopie zum Cluster bis hin zur Lagerung.
Kontakt
Fachlicher Ansprechpartner RRZK/ITCC
Herr Dipl.-Wirt.-Inf. Viktor Achter
Abteilungsleitung HPC
Allgemeiner Kontakt RRZK/ITCC
Öffentlichkeitsarbeit
wansart@uni-koeln.de
itcc-pr@uni-koeln.de
Allgemeiner Kontakt Universität zu Köln
Redakteur
Aktuell:
Informationen zu Tools für kollaboratives Arbeiten im Homeoffice
Kontakt
Bei Fragen und für individuellen Support wenden Sie sich bitte an den
RRZK-Helpdesk