Kaytus bringt All-QLC-Flash-Speicher für KI-Cluster
Kaytus stellt eine All-QLC-Flash-Speicherlösung für große KI-Cluster vor. Die Architektur basiert auf den Serverplattformen KR2280 und KR1180 und soll leseintensive Trainings-Workloads mit hoher Bandbreite, niedriger Latenz und geringeren Betriebskosten unterstützen.
Eine Speicherlösung für große KI-Trainingsumgebungen stellt KAYTUS mit neuen All-QLC-Flash-Systemen vor. Sie richtet sich an KI-Cloud-Anbieter, größere Rechenzentren und Organisationen, die GPU-Cluster mit hohen Anforderungen an Durchsatz, parallele Lesezugriffe und Skalierbarkeit betreiben. Im Mittelpunkt steht eine Flash-Architektur für leseintensive KI-Workloads, nicht maximale Schreibleistung.
Die Systeme basieren auf den Server-Plattformen KR2280 und KR1180 und sind laut Anbieter in KI-orientierte parallele Dateisysteme integriert. Ziel ist es, Datensilos zwischen Objekt-, Datei-Speicher und Trainingsumgebung zu reduzieren. Daten sollen über einen einheitlichen Namensraum ohne zusätzliche Migration an GPU-Knoten bereitgestellt werden können. Für große KI-Umgebungen ist das relevant, weil Speicher-I/O schnell zum limitierenden Faktor wird. GPUs lassen sich nur effizient auslasten, wenn Trainingsdaten kontinuierlich und mit geringer Latenz verfügbar sind.#
Zum QLC-Portfolio gehören mehrere Systeme für unterschiedliche Dichte- und Kapazitätsanforderungen. KR1180 ist als 1U-System mit zehn Laufwerken ausgelegt und soll bis zu 1 PByte Kapazität sowie 140 GByte/s Bandbreite bieten. KR2280 ist ein 2U-System mit 24 QLC-Laufwerken, sieben PCIe-5.0-Steckplätzen und Unterstützung für Intel- sowie AMD-Plattformen. Für besonders kapazitätsorientierte Umgebungen ist das KR4266 als 4U-System mit 60 Laufwerken und bis zu 7 PByte pro Einheit konzipiert.
QLC passt zu leseintensiven Trainingsdaten
Der Einsatz von QLC-Flash ist Kaytus zufolge vor allem eine Kosten- und Dichtefrage. QLC speichert vier Bit pro Speicherzelle und bietet dadurch mehr Kapazität pro Laufwerk als TLC-Flash. Die üblicherweise geringere Schreiblebensdauer kann bei vielen KI-Trainingsszenarien akzeptabel sein, weil große Datenbestände häufig gelesen, aber deutlich seltener neu geschrieben werden.
Der Hersteller positioniert seinen All-Flash-Speicher deshalb für leseintensive Workloads. Gegenüber TLC-basierten All-Flash-Konfigurationen sollen über fünf Jahre niedrigere Gesamtbetriebskosten möglich sein. Als Gründe nennt Kaytus höhere Laufwerkskapazitäten, weniger benötigte Laufwerke sowie geringeren Strom- und Kühlbedarf. Technisch setzt der Anbieter auf NVMe-over-Fabrics, PCIe 5.0, eine NUMA-optimierte Plattformauslegung, NFS über RDMA sowie GPU-Direct-Storage-Technologie. Damit sollen Datenpfade vom QLC-Flash bis zum GPU-Speicher verkürzt und CPU-Overhead reduziert werden.
Kaytus nennt als Zielgröße Cluster mit bis zu 10.000 GPUs. KR2280- und KR1180-Knoten sollen dafür eine Speicherbasis bilden, die sich vom Petabyte- bis in den Exabyte-Bereich erweitern lässt. Der Anbieter verweist auf Testdaten mit 10 TByte/s aggregierter Lesebandbreite und 100 Millionen IOPS bei zufälligen Lesezugriffen. Solche Werte dienen vor allem der Einordnung der Zielklasse, da reale Ergebnisse stark von Workload, Dateisystem, Netzwerkdesign und Datenlayout abhängen.