Anzeige

Dell Poweredge XE8812 bringt Vera Rubin ins Rack

Dell Poweredge XE8812 bringt Vera Rubin ins RackHPC- und KI-Workloads wachsen in Rechenzentren zunehmend zusammen. Dell erweitert dafür die »AI Factory with NVIDIA« um den »PowerEdge XE8812«. Der direkt flüssigkeitsgekühlte Server nutzt »NVIDIAs Vera-Rubin-NVL4«-Architektur und soll im »PowerRack 9100« auf bis zu 144 GPUs pro Rack skalieren.

Rechenintensive KI-Anwendungen und klassische HPC-Simulationen stellen ähnliche Anforderungen an Speicher, Rechendichte, Kühlung und Systemintegration. Besonders bei molekularen Simulationen, multiphysikalischen Modellen oder großen KI-Modellen reichen schrittweise Infrastruktur-Upgrades oft nicht mehr aus. Mit dem neuen Server adressiert Dell Umgebungen, die solche Workloads dichter und stärker integriert betreiben wollen.

Dell Technologies erweitert die Dell PowerEdge XE8812 Server-Familie im Rahmen der Dell AI Factory with NVIDIA. Das System wurde auf der Supercomputing-Konferenz ISC in Hamburg vorgestellt und basiert auf der Nvidia-Vera-Rubin-NVL4-Architektur. Der Server ist lüfterlos ausgelegt und setzt auf direkte Flüssigkeitskühlung für CPUs und GPUs.

Im Zusammenspiel mit dem Dell PowerRack 9100 soll sich die Plattform auf bis zu 144 GPUs pro Rack skalieren lassen. Die Leistungsaufnahme kann laut Anbieter bei mehr als 300 kW pro Rack liegen. Dell positioniert das System für HPC- und KI-Workloads, bei denen hohe Rechendichte, großer Speicher und kurze Datenwege entscheidend sind.

Anzeige

Mehr Host- und GPU-Speicher für größere Modelle

Der Wechsel von Nvidia GB200 NVL4 auf Vera Rubin NVL4 bringt laut Dell mehr Host-Speicher, mehr CPU-Kerne und mehr GPU-Speicher. Genannt werden 176 statt bisher 144 CPU-Kerne sowie 50 Prozent mehr Speicher pro Sockel gegenüber der Vorgängergeneration. Dadurch sollen größere Modelle und Simulationen vollständig im Arbeitsspeicher ausgeführt werden können.

Das ist vor allem dort relevant, wo Staging oder Swapping die Laufzeit spürbar beeinflussen. Werden Daten zwischen Speicherstufen verschoben oder auf langsamere Ebenen ausgelagert, entstehen Latenzen im Mikro- bis Millisekunden-Bereich. Bei großen KI- und HPC-Workloads kann dies die Ausführung deutlich bremsen. In Verbindung mit Nvidia CUDA X-Bibliotheken soll der XE8812 darauf ausgelegt sein, große Modelle und Simulationen stärker im direkten Speicherzugriff zu halten.

ORv3-Design setzt auf offene Rack-Architektur

Das Server- und Rack-Design basiert auf dem offenen ORv3-Standard. Damit soll die Plattform modular aufgebaut und auf Rack-Ebene effizienter integriert werden können. Für den Betrieb verweist Dell auf mehrere Management-Komponenten. Der Integrated Dell Remote Access Controller (iDRAC) ermöglicht die Bereitstellung, Aktualisierung und Überwachung von PowerEdge-Servern. Ergänzend sollen der Dell Integrated Rack Controller und OpenManage Enterprise Transparenz auf Rack-Ebene schaffen.

Zum Betriebsmodell gehören außerdem Echtzeit-Telemetrie und automatische Leckerkennung. Diese Funktionen sollen helfen, Störungen frühzeitig zu erkennen und Risiken im Flüssigkeitskühlkreislauf zu reduzieren. Gerade bei dicht bestückten Racks ist die Überwachung der Infrastruktur kein Beiwerk, sondern Teil der Betriebsarchitektur.

Vorintegrierte Racks sollen Implementierung vereinfachen

Für größere HPC- und KI-Installationen bietet Dell den XE8812 im Powerrack-Konzept an. Die Racks werden werkseitig integriert und validiert. Dadurch sollen manuelle Integrationsschritte im Rechenzentrum reduziert werden. Dell nennt für produktionsfertige Racks eine Bereitstellungszeit von etwas mehr als sechs Stunden, bis Live-Workloads ausgeführt werden können.

Der Ansatz richtet sich an Unternehmen, Forschungseinrichtungen und Organisationen, die sehr große Rechenumgebungen aufbauen, aber die Komplexität der Integration begrenzen wollen. Für klassische Unternehmens-IT ist ein Rack mit mehr als 300 kW Leistungsaufnahme kein Standardbetrieb. Für KI-Cluster, Forschungsrechenzentren und spezialisierte HPC-Umgebungen kann eine vorvalidierte Rack-Scale-Architektur jedoch ein relevanter Faktor sein.

»Einrichtungen weltweit arbeiten an den wichtigsten Forschungsprojekten unserer Zeit, von der Genomforschung über die Modellierung zukünftiger Energiesysteme bis hin zum Aufbau souveräner KI-Infrastrukturen«, erklärt Arun Narayanan, Senior Vice President Compute and Networking bei Dell. »Sie verdienen eine Infrastruktur, die sie bei ihrer Arbeit optimal unterstützt. Der Dell Poweredge XE8812 steht für unseren Anspruch, die Grenzen des technisch Machbaren zu verschieben. Mit seiner hohen Rechendichte, großen Speicherkapazität und offenen Architektur schafft er die Voraussetzungen für Workloads, die bisher kaum denkbar waren.«

»Die Konvergenz von KI und HPC schraubt die Erwartungen von Unternehmen und Forschungseinrichtungen an ihre Infrastruktur nach oben«, ergänzt Chris Marriott, Vice President Enterprise Platforms bei Nvidia. Die Zusammenarbeit der beiden Hersteller soll Leistung, Effizienz und Offenheit bereitstellen, die für die anspruchsvollsten KI-Workloads und wissenschaftlichen Rechenlasten der Welt erforderlich sind.

Auf die Auslieferung der neuen Server müssen Interessenten allerdings noch warten: Dells XE8812 soll erst ab Anfang 2027 weltweit verfügbar sein.