Kioxia entwickelt 100-Millionen-IOPS-SSD für Nvidia
Kioxia entwickelt auf Anfrage von Nvidia eine SSD mit 100 Millionen IOPS, die GPUs direkt anbinden und teilweise hochpreisigen HBM-Speicher ersetzen soll. Die Markteinführung ist ab 2027 vorgesehen.
Kioxia arbeitet nach eigenen Angaben gemeinsam mit Nvidia an einer neuartigen SSD, die speziell für KI-Server konzipiert ist. Ziel ist es, extrem hohe I/O-Leistungen zu erzielen und zugleich den kostspieligen High-Bandwidth-Memory (HBM) teilweise zu ersetzen.
Geplant ist eine SSD mit 100 Millionen IOPS, die direkt an eine GPU angebunden wird. Zwei Geräte sollen gemeinsam 200 Millionen IOPS bereitstellen können. Zudem ist Unterstützung für PCIe 7.0 vorgesehen.
Kioxia verfolgt zwei Flash-Entwicklungslinien
Bislang verfolgt Kioxia zwei Entwicklungslinien: TLC- und QLC-NAND (3 bzw. 4 Bit/Zelle) für hohe Kapazitäten sowie Storage-Class Memory (SCM). Dazu zählen XL-Flash (SLC-NAND, 1 Bit/Zelle) für extrem niedrige Latenzen, die unter anderem in FL6-Speichermodulen verbaut werden.
Bereits 2023 stellte Kioxia mit der FL6-SSD eine Lösung mit 1,5 Millionen zufälligen Lese-IOPS und 6,2 GByte/s sequentiellem Durchsatz vor. Ein Referenzdesign aus 2025 auf Basis von InnoGrit erreichte mit Gen2-XL-Flash in SLC-Modus 3,5 Millionen Lese-IOPS und bis zu 14 GByte/s sequenziellen Durchsatz. Damit liegt die Technologie deutlich unter den angestrebten 100 Millionen IOPS.
Die neuen KI-SSD könnten in unterschiedlichen Szenarien zum Einsatz kommen:
- CXL-gebundene XL-Flash-Laufwerke – als Speichererweiterung für GPUs, mit Latenzen unter 10 µs
- Daisy-Chained-XL-Flash-Module – bereits in einem Prototyp mit PCIe 6 und 64 GByte/s Durchsatz gezeigt
- High-Bandwidth-Flash (HBF) mit TSV-Stacks – ähnlich wie bei den von Sandisk und SK hynix entwickelten Interposer-basierten Multi-Stack-Lösungen
Zeitplan der AI-SSDs
Kioxia plant die Markteinführung der extrem schnellen AI-SSDs für das Jahr 2027, parallel zu neuen HBF-Speicherlösungen von Sandisk. Zielgruppe sind KI-Rechenzentren, die große Datenmengen mit höchster Geschwindigkeit verarbeiten müssen und zugleich kostspieligen HBM-Speicher entlasten wollen.