Skalierbarkeit, Flexibilität, Effizienz, Zuverlässigkeit und einfaches Management sind die wichtigsten Kaufkriterien. Bei künftigen RAID-Generationen achten IT-Entscheider zudem auf Transparenz und Automatisierung. Disk-Subsysteme der Zukunft agieren in hohem Maße selbstständig und besitzen intern eine virtuelle Grid-Architektur.
Große Rechenzentren kalkulieren ihr Speichervolumen längst in PByte und bereiten sich bereits auf die EByte-Zeit (Exabyte) vor. Mit steigenden Festplattenkapazitäten stößt die RAID-Architektur herkömmlicher Disk-Subsysteme aber zunehmend an ihre Grenzen. Beispielsweise dauert die Rekonstruktion einer (vollen) 1-TByte-SATA-Disk unter RAID 5 zirka einen Tag. Die Ergebnisse für 1,5- und gar 2-TByte-Laufwerke sind entsprechend dramatischer: Administratoren müssen sich auf eine Wartezeit von fast zwei Tage einstellen (siehe Fachartikel).
Das RAID-System der Zukunft muss daher andere Wege gehen, Stillstandzeiten zu vermeiden und vor Datenverlust zu schützen. Die ersten Ansätze sind bereits sichtbar. Gleichzeitig darf man den Entwicklern zugute halten, dass mittlerweile speziell in Einsteiger- und Midrange-Produkten eine wahre Funktionsvielfalt Einzug gehalten hat. Snapshots, Replikation und Online-Kapazitätserweiterung dürfen durchaus als Standard bezeichnet werden. Allerdings dürfen Unternehmen von einem 3.000- bis 4.000-Euro-Array keine Wunderdinge erwarten. Gerade in den Bereichen Snapshots und Replikation gibt es signifikante Unterschiede. Ein Storage-Bolide von Hitachi Data Systems oder Fujitsu Technology Solutions arbeitet in weit schnelleren Regionen.
Zudem ist es mit der bloßen Unterstützung einer Funktion nicht getan. »Die eigentliche Herausforderung an ein Storage-System hat sich in den letzten Jahren verändert«, meint Harald Will, Consultant beim Wiesbadener Storage-Distributor TIM. »Weil heutige SLAs (Service-Level-Agreements) keinen Platz mehr für Stillstandzeiten lassen, ist eine Online-Sicherung in den meisten Fällen unumgänglich. Bei vielen Applikationen muss man eine Integration zwischen Storage-Funktionalität und Applikation schaffen, die sicherstellt, dass die Daten während eines Snapshots oder einer asynchronen Replikation in einem konsistenten und wieder verwertbaren Zustand sind.« Diese Integration benötige eine zusätzliche Intelligenz, die es für viele Einsteiger-RAIDs entweder nur in eingeschränkter Form oder überhaupt nicht gebe.
Künftige RAIDs mit mehr Intelligenz und Automatismen
»Bei künftigen Disk-Subsystemen werden weiter Kapazität, Performance und Konnektivität die treibenden Kräfte sein«, erklärt Robert Guzek, Produkt Marketing Manager Eternus bei Fujitsu Technology Solutions. »Daneben wären Deduplikation und Kompression im Mix aus heutiger Sicht sinnvolle Funktionalitäten, welche auch eine optimale reduzierte Datenspiegelung ermöglichen könnten.« Hilfreich sei auch eine Eingangsdatenklassifizierung, die festlegt, welche Daten wie lange aufzubewahren sind und welche Daten automatisch nach Ablauf entfernt oder verdrängt werden können.
So sieht es auch Ralf Colbus, Certified Storage Professional bei IBM Deutschland: »Heutigen Storage-Systemen fehlt ein integriertes Information-Lifecycle-Management (ILM) mit einer dynamischen und transparenten Verlagerung der Daten je nach ihrer Wertigkeit und ihrer Zugriffszahlen auf die verschiedenen Tiering-Stufen. Alternativ kommt auch die Beschränkung auf eine einzige Tiering-Stufe im System in Frage, die dafür sehr günstig ist (z.B. SATA-Drives). Idealerweise werden Daten gemäß der Policys automatisch gelöscht. Wünschenswert für Disk-Subsysteme wäre auch eine lineare Skalierbarkeit, ohne dass Hardware-Unterbrechungen auftreten (d.h. gegebenenfalls Scale-Out-fähig) und es nötig ist, Daten zu migrieren.« Die Systeme sollten so optimiert sein, dass sich IT-Verwalter nicht mehr um RAID-Level, Performance oder Datenverteilung kümmern müssen. Das erfordert ein sehr einfaches Management und hohe Automatisierbarkeit. Die Systeme der Zukunft werden aus Common Parts (CoP) bestehen. Das heißt aus Komponenten, die nicht speziell für Storage entwickelt werden. Die gesamte Intelligenz wird in der Software und den Betriebs-Funktionen liegen, sie werden deswegen immer wichtiger. So sind niedrigere Gesamtkosten möglich.«
»Enterprise- und Midrange-Systeme gleichen sich immer mehr an«, sagt Dr. Georgios Rimikis, Manager Solutions Strategy bei HDS. »Die Abgrenzungen verschwimmen zunehmend. Bezüglich der vorhandenen Funktionalitäten haben Disk-Subsysteme einen hohen Reifegrad erreicht. Die Forderungen von Unternehmen sind dabei immer gleich: Sowohl bei Enterprise-Systemen als auch bei den Einsteiger-RAIDs stehen Leistung, Qualität, Zuverlässigkeit und Zukunftstauglichkeit an erster Stelle – das wird sich auch in Zukunft nicht ändern.«
Die klassische Festplatte wird uns noch lange als Speichermedium Nummer eins begleiten. Laufwerke mit zehn oder 20 TByte sind in Entwicklungslabors bereits im Einsatz. Allerdings hat dieses Verfahren eine Obergrenze. »Die physikalischen Gesetze kann man nicht überlisten«, stellt Rimikis klar. »Die Flash-Disk gewinnt als neues Medium an Boden. Sobald die Preise und die Stabilität dieses Verfahrens ein akzeptables Level erreichen, stellt sich die Frage, welche Daten darauf gespeichert werden.« Ein ideales System soll in der Lage sein selbst zu »entscheiden«, welcher Art diese Daten sind. Diese Datenmengen sollten in sehr kleine Portionen unterteilt sein, um ein unnötiges Migrieren von Daten zu vermeiden. Die nächste Stufe wäre, Speichersysteme in diesem Verfahren zu integrieren, die durch Speichervirtualisierung extern angeschlossen sind. Darüber hinaus geht es neben effizienten Speichern auch um einen geringen Stromverbrauch und die optimale Ausnutzung der verfügbaren Stellfläche. Und das nicht nur für blockbasierte Daten, sondern auch für Files und für archivierte Daten.
RAID-Level vom Einsatzzweck abhängig
Sollte eine Festplatte ausfallen, bewahrt der RAID-Verbund Unternehmen vor einem Datenverlust. Die Wahl des richtigen RAID-Levels ist wie vieles im Speicherbereich ein Kompromiss. Den Ausschlag geben das Schreib- und Leseverhalten der Anwendung. Dies beeinflusst entscheidend die Leistungsfähigkeit der Disk-Arrays im Live-Betrieb. Für vornehmlich schreibende Applikationen ist RAID 1 ideal. Diese Spiegelung belastet weder Prozessoren mit der Berechnung von Paritäten noch das Backend und die Platten mit dem vermehrten I/O-Aufkommen. Eher lesende Anwendungen profitieren dagegen von der breiten Verteilung der Daten auf vielen physikalischen Laufwerken (mehr im Blog Doc Storage).
Ein allgemein ungelöstes Problem ist die lange Rebuild-Dauer, sollte ein Laufwerk ausfallen. Während RAID 1 eine neue Platte im Hintergrund rekonstruiert, ohne große Beeinträchtigung der Produktionsleistung, dauert dieser Vorgang unter RAID 5 wesentlich länger. Zunächst liest das System alle noch vorhandenen Laufwerke ein, um dann mittels einer Prüfsumme die fehlenden Informationen wiederherzustellen. Fällt während dieser Phase ein weiteres Laufwerk derselben RAID-Gruppe aus, ist ein Datenverlust unvermeidlich. Die Lösung lautet RAID 6. Dieser Schutzmechanismus erlaubt den gleichzeitigen Ausfall von zwei Platten. Da aber nun zwei Kontrollsummen errechnet und geschrieben werden müssen, geht dies zu Lasten der Schreibleistung. Die Rebuild-Zeit einer 2-TByte-Disk kann in einem RAID-6-Verbund bis zu 32 Stunden dauern (speicherguide.de berichtete).
Risikofaktor Rebuild-Zeit: Prävention als Alternative
»Das ist natürlich der Preis der hohen Kapazitäten«, sagt Hans Schramm, Field Product Manager Enterprise bei Dell. »Wenn man viel speichert, kann auch viel ausfallen und dann müssen große Datenmengen wiederhergestellt werden. Andererseits könnte diese Problematik aber auch den Blick der Anwender auf zusätzliche Mechanismen wie Deduplizierung, Tiered-Storage oder den Einsatz von Archivierungslösungen lenken.«
»Die Alternative sehen wir in der Verwendung von 2,5-Zoll-Festplatten ergänzt Wolfgang Bauer, Technischer Leiter bei EUROstor. »Da hier die Kapazität auf mehr Laufwerke verteilt wird (ohne mehr Raum zu verwenden und bei geringerem Stromverbrauch/TByte), verringert sich auch die Rebuild-Zeit einer einzelnen Platte. Viel schneller geht das Rebuild auch bei SSDs – das hat allerdings seinen Preis, auch wenn der in letzter Zeit deutlich attraktiver geworden ist.«
»Heutige Disksysteme können nicht erst warten, bis Festplatten ausfallen«, meint Fujitsu-Manager Guzek. »Auf Grund der sich kapazitiv verändernden Laufwerke ist ein schneller Rebuild nicht mehr wie vor noch einigen Jahren möglich.« Die Lösung von Fujitsu lautet redundante Kopie: Die Überwachung eines Fehlerschwellwertes soll die Grundlage für einen vorbeugenden Laufwerksaustausch bilden und die Datenredundanz sicherstellen. Der Hersteller implementiert diese Funktion von den Einstiegsgeräten der »ETERNUS DX« bis zum Enterprise-Array.
Storage-Grid-Architektur eliminiert lange Rebuild-Zeiten
»Lange Rebuild-Zeiten sind nicht mehr zeitgemäß«, argumentiert IBM-Manager Colbus und verweist auf das »XIV«-System (siehe Produkt-Review). »XIV ist in der Lage, beim Ausfall eines 1-TByte-Drives in wenigen Minuten die Datensicherheit wiederherzustellen. Die Architektur verwendet keine klassischen RAID-Level, sondern verteilt die Daten in Chunks gleichmäßig über alle Platten. Dadurch entstehen auch keine Hot-Spots mehr, weil alle Disks an derselben Workload arbeiten.« Vereinfacht ausgedrückt, »zerlegt« die IBM-Maschine zu schreibende Daten in kleinere Portionen und schreibt diese zweifach über unterschiedliche Wege auf physikalisch getrennte Platten. Dies hat zudem einen Vorteil beim Schreiben, da immer mehr als ein Controller mit einer Vielzahl von Platten genutzt wird. Zudem soll sich die Zugriffszeit verringern lassen, weil die Daten an zwei Stellen im System zum Lesen zur Verfügung stehen. Der RAID-Schutz geht allerdings stark zu Lasten der Kapazität. Von den installierten 180 TByte bleiben letztlich »nur« 79 TByte nutzbarer Speicher.
Einstiegskosten von über eine halbe Million Euro für 27 TByte Nutzkapazität erscheinen für die meisten Mittelständler heute natürlich als unerschwinglich. Aber es ist noch gar nicht so lange her, da gab es Snapshots und Co. nur in den teuren Boliden der großen Storage-Hersteller. Heute sind Snapshots selbst für Einsteiger-NAS-Systeme ab 400 Euro keine Schwierigkeit. Ab wann interne Storage-Grid-Architekturen, wie sie die XIV heute nutzt, in Midrange-Arrays zum Einsatz kommen, darauf mag sich heute noch keiner festlegen. Länger als zwei bis drei Jahre sollte es aber nicht dauern.
Empfehlung für einen perfekten Primary- und Secondary-Speicher
»Ein perfektes System sollte sich variabel und performant ausbauen lassen, über ein leistungsfähiges, aber auch übersichtliches Storage-Management verfügen und unterschiedliche Plattentechnologien verarbeiten können«, meint Dell-Manager Schramm. »Gerade ein variabel wachsendes System spricht dann auch unterschiedliche Geldbeutel an. Das heißt, das Unternehmen muss jeweils nur die Kapazitäten kaufen, die es aktuell auch wirklich benötigt.«
»Speicher für Primärdaten sollten schnell, ausbaubar, einfach zu verwalten, ausfallsicher, virtualisiert und gegebenenfalls automatisierbar sein«, umreißt IBM-Manager Colbus die Anforderungen an ein RAID. »Sekundär-Systeme müssen preiswert sein, hochkapazitiv und skalierbar. Wenn die Performance es hergibt, empfiehlt sich auch Daten-Deduplizierung.«
»Der Investitionsschutz muss beim Kauf eines Storage-Systems an oberster Stelle stehen«, unterstreicht TIM-Manager Will. »Deshalb ist die Flexibilität, insbesondere die mögliche Verwendung unterschiedlicher Protokolle, das wichtigste Kriterium bei der Auswahl eines RAID-Systems.« In Zukunft gewinnen Funktionalitäten wie Deduplizierung und automatisches Tiering der Daten (Blöcke werden im Hintergrund je nach Anforderung auf unterschiedliche Plattentypen wie SATA, SAS oder SSD verschoben) sowohl für Primär- als auch für Sekundär-Systeme an Bedeutung. Weiterhin wird Storage den Anforderungen an Cloud-Computing, soweit diese Funktionalitäten nicht schon vorhanden sind, gerecht werden müssen.
»Ein Storage-System muss mit den Ansprüchen des Unternehmens einfach und unkompliziert mitwachsen können, ohne dass IT-Abteilungen zu einem umständlichen und teuren Plattformwechsel gezwungen sind«, meint auch Netapp-Manager Wüst. »Dies bedingt aber, dass alle aktuellen und zukünftigen Storage-Protokolle wie FC, FCoE, iSCSI, NFS und CIFS gleichzeitig unterstützt werden.« Nur so könnten Systeme wirklich transparent mitwachsen.
Disk-Systeme der Zukunft – effizient, selbstständig und virtuell
Spricht man vom Disk-Array der Zukunft, setzt dieses laut Netapp auf einer »Scale-Out«-Architektur auf. Das heißt, die Arrays werden komplett virtualisierbar sein. »Dies ist der nächste logische Schritt nach der Storage-Virtualisierung, die innerhalb eines Arrays abläuft«, konstatiert Netapp-Manager Wüst. »Die Virtualisierung in einer Scale-Out-Architektur überschreitet die Grenzen eines Storage-Controllers und sprengt jedes Limit hinsichtlich Kapazität, Performance und Skalierbarkeit. Das gilt dann auch für die Performance.« Damit Scale-Out-Architekturen so effizient wie möglich arbeiten, müssen Technologien wie Deduplizierung, Kompression und Thin-Provisioning standardmäßig und transparent integriert sein.
»Eine optimale Speichereinheit muss mit den Anforderungen der Unternehmen mitwachsen – für die Betriebskosten gilt dabei allerdings das Gegenteil«, merkt HDS-Spezialist Rimikis an. »Es ist zielführend, ein System zu entwickeln, das automatisiert Business-Prozesse optimiert und darüber hinaus dabei unterstützt, die IT-Kosten zu senken. Ein solcher Ansatz enthält eine vollautomatische ILM-Funktion und verschiebt zum Beispiel ältere Daten granular und selbstständig auf preisgünstigere Systeme.« Die Lösung entscheidet selbst, welcher Ort, welche Klasse und welches Medium, welche Leistung zur Speicherung der jeweiligen Daten optimal ist. Eine Automatisierung müsse auf Inhalten basieren und die Applikationen berücksichtigen. Auf Grund von Metadaten entscheidet die Anwendung selbst, welche Speicherklasse für sie die passende ist, um die Unternehmens-SLAs optimal und effizient zu erfüllen. Das Ganze ist selbstheilend, selbstoptimierend und vollautomatisch. Datenmobilität bekommt einen neuen Wert und neue Dimensionen, geclusterte Architektur mehrerer virtualisierter Systeme maximiert Verfügbarkeit und Redundanz.
Kommentar schreiben