Kaytus bringt All-QLC-Flash-Speicher für KI-Cluster

27.05.2026 Uli Neiss

Kaytus bringt All-QLC-Flash-Speicher für KI-Cluster

Kaytus stellt eine All-QLC-Flash-Speicherlösung für große KI-Cluster vor. Die Architektur basiert auf den Serverplattformen KR2280 und KR1180 und soll leseintensive Trainings-Workloads mit hoher Bandbreite, niedriger Latenz und geringeren Betriebskosten unterstützen.

Eine Speicherlösung für große KI-Trainingsumgebungen stellt KAYTUS mit neuen All-QLC-Flash-Systemen vor. Sie richtet sich an KI-Cloud-Anbieter, größere Rechenzentren und Organisationen, die GPU-Cluster mit hohen Anforderungen an Durchsatz, parallele Lesezugriffe und Skalierbarkeit betreiben. Im Mittelpunkt steht eine Flash-Architektur für leseintensive KI-Workloads, nicht maximale Schreibleistung.

Die Systeme basieren auf den Server-Plattformen KR2280 und KR1180 und sind laut Anbieter in KI-orientierte parallele Dateisysteme integriert. Ziel ist es, Datensilos zwischen Objekt-, Datei-Speicher und Trainingsumgebung zu reduzieren. Daten sollen über einen einheitlichen Namensraum ohne zusätzliche Migration an GPU-Knoten bereitgestellt werden können. Für große KI-Umgebungen ist das relevant, weil Speicher-I/O schnell zum limitierenden Faktor wird. GPUs lassen sich nur effizient auslasten, wenn Trainingsdaten kontinuierlich und mit geringer Latenz verfügbar sind.#

Zum QLC-Portfolio gehören mehrere Systeme für unterschiedliche Dichte- und Kapazitätsanforderungen. KR1180 ist als 1U-System mit zehn Laufwerken ausgelegt und soll bis zu 1 PByte Kapazität sowie 140 GByte/s Bandbreite bieten. KR2280 ist ein 2U-System mit 24 QLC-Laufwerken, sieben PCIe-5.0-Steckplätzen und Unterstützung für Intel- sowie AMD-Plattformen. Für besonders kapazitätsorientierte Umgebungen ist das KR4266 als 4U-System mit 60 Laufwerken und bis zu 7 PByte pro Einheit konzipiert.

QLC passt zu leseintensiven Trainingsdaten

Der Einsatz von QLC-Flash ist Kaytus zufolge vor allem eine Kosten- und Dichtefrage. QLC speichert vier Bit pro Speicherzelle und bietet dadurch mehr Kapazität pro Laufwerk als TLC-Flash. Die üblicherweise geringere Schreiblebensdauer kann bei vielen KI-Trainingsszenarien akzeptabel sein, weil große Datenbestände häufig gelesen, aber deutlich seltener neu geschrieben werden.

Der Hersteller positioniert seinen All-Flash-Speicher deshalb für leseintensive Workloads. Gegenüber TLC-basierten All-Flash-Konfigurationen sollen über fünf Jahre niedrigere Gesamtbetriebskosten möglich sein. Als Gründe nennt Kaytus höhere Laufwerkskapazitäten, weniger benötigte Laufwerke sowie geringeren Strom- und Kühlbedarf. Technisch setzt der Anbieter auf NVMe-over-Fabrics, PCIe 5.0, eine NUMA-optimierte Plattformauslegung, NFS über RDMA sowie GPU-Direct-Storage-Technologie. Damit sollen Datenpfade vom QLC-Flash bis zum GPU-Speicher verkürzt und CPU-Overhead reduziert werden.

Kaytus nennt als Zielgröße Cluster mit bis zu 10.000 GPUs. KR2280- und KR1180-Knoten sollen dafür eine Speicherbasis bilden, die sich vom Petabyte- bis in den Exabyte-Bereich erweitern lässt. Der Anbieter verweist auf Testdaten mit 10 TByte/s aggregierter Lesebandbreite und 100 Millionen IOPS bei zufälligen Lesezugriffen. Solche Werte dienen vor allem der Einordnung der Zielklasse, da reale Ergebnisse stark von Workload, Dateisystem, Netzwerkdesign und Datenlayout abhängen.

Weiterführende Links: