Anzeige
Anzeige

Unterschiede RAID 5 + Hotspare, RAID 5EE und RAID 6

Leserfrage: Ich plane ein RAID-System mit sechs TByte (verfügbarem Speicher) aus sechs Western Digital »RE4 WD1503FYYS«-Platten mit je 1,5 TByte aufzubauen. Mal sehen, ob ich alles richtig verstanden habe:

Bei RAID 5 + Hotspare wird nach einem Ausfall einer Platte sofort mit der Wiederherstellung auf die Hotspare-Disk begonnen. Der Kapazitätsverlust beträgt zwei Laufwerke (eine für RAID 5, eine für Hotspare).

Bei RAID 5EE gibt es keine separate Hotspare-Platte. Diese ist durch Verteilung der Wiederherstellungsinformationen auf allen Drives sozusagen eingebaut. Alle Laufwerke werden verwendet, damit ist die Performance etwas besser als bei RAID 5 + Hotspare und es entsteht ebenfalls ein Kapazitätsverlust von zwei Platten.

Bei RAID 6 gibt es keine Hotspare-Disk aber dafür Wiederherstellungsinformationen auf zwei Drives und damit eine Absicherung gegen den Ausfall von zwei Platten. Klar, dass der Kapazitätsverlust auch zwei Laufwerke beträgt. Bei RAID 6 beginnt die Herstellung erst nach Austausch der defekten Platte(n).

Was ich nicht verstanden habe:
1. Wann läuft die Wiederherstellung bei RAID 5EE los: sofort oder erst nach Austausch der defekten Platte? Bei sofortiger Wiederherstellung müsste ja in RAID 5 überführt werden und dann sollte wohl nach Austausch der defekten Platte zur Wiederherstellung des RAID 5EE Modus noch mal alles umgeschaufelt werden?

2. Bei RAID 6 heißt es immer, dass die Performance deutlich schlechter sei als bei RAID 5, da doppelte Wiederherstellungsinformationen berechnet und geschrieben werden müssen. Kann dies ein geeigneter Controller nicht nahezu ausgleichen?

3. Die Berechnung der doppelten Wiederherstellungsinformationen sollte bei einem adäquaten Controller-Chip keinen Engpass darstellen und da alle sechs Platten genutzt werden, müsste der Malus des doppelten Schreibens damit auch ausgeglichen werden. Oder liege ich falsch?

4. Ich habe zum Beispiel den Adaptec »RAID 5805« oder den noch teureren »RAID 5805Z« ins Auge gefasst. Platten und Controller würden nach aktueller Erhebung so zirka zwischen 1.500 und 1.800 Euro liegen. Hier die Frage an die Erfahrenen: Was für ein Controller macht Sinn? Bringt der 5805Z in der Praxis wirklich was gegenüber dem 5805? Oder ein anderer Hersteller?

5. Gibt es, obwohl ich aus Gründen maximaler Sicherheit zu RAID 6 tendiere, andere Empfehlungen?

6. Zudem muss man ja noch an die Datensicherung denken. Gibt es preislich vernünftige Datensicherungslösungen für sechs TByte Kapazität?

Anzeige

Antwort Doc Storage:

Zunächst einmal müssen wir die statistischen Grundlagen besprechen. Im Gegensatz zu den ersten in Arrays verwendeten SATA-Platten (bis ~2005) geben die Hersteller heute die gleichen Laufzeiten und damit dieselbe Zuverlässigkeit für die weit verbreiteten 1- bis 2-TByte-Laufwerke an (ca. 1,5 bis 1,7 Millionen Stunden). Damit sind diese genauso zuverlässig wie die in Enterprise-Systemen verwendeten Fibre-Channel-Platten. Statistisch leicht überholt wurden die FC-Disks sogar durch die SATA-Medien beim Thema »sudden death«, also beim plötzlichen Ausfall. Während bei FC zirka 1,2 bis 1,4 Prozent pro Jahr »sterben«, sind es bei modernen SATA nur noch 0,8 bis 0,9 Prozent.

Rundet man diesen Wert der Einfachheit halber auf ein Prozent auf, ist bei einem kleinen Array mit fünf SATA-Laufwerken im Dauerbetrieb nur alle 20 Jahre mit einem plötzlichen Ausfall einer Platte zu rechnen. In den überwiegenden Fällen wird das System schon weit vor dem Ausfall des Mediums mit der »Evakuation« der Daten auf ein Ersatzlaufwerk während des laufenden Betriebes beginnen. Das heißt, deren Verfügbarkeit wird zu keiner Zeit beeinträchtigt. Dass dieser Vorgang natürlich wesentlich länger dauert als bei den schneller drehenden FC-Platten mit einem Gbit mehr Bandbreite und nur einem Bruchteil der Kapazität, fällt wegen der selten auftretenden plötzlichen Ausfälle kaum noch ins Gewicht.

1. Bei den mir bekannten Herstellern läuft die Rekonstruktion bei RAID 5EE sofort nach Ausfall eines Mediums an. Alles andere würde bei diesem Konzept auch wenig Sinn machen. Und es ist korrekt, zunächst müssen die Daten rekonstruiert und dann auf das neue Medium kopiert werden. Allerdings geben die Hersteller an, dieser Vorgang sei gegenüber der Produktion »transparent«, also ohne Einfluss. Diesem ist kaum Glauben zu schenken, da alle Daten über dieselben Busse müssen und sich die Bandbreite für die Rekonstruktions- und Kopiervorgänge nicht verbreitern lässt. Hier hilft nur eine vernünftige Priorisierung der Datenflüsse, die allerdings nicht von allen Anbietern implementiert ist.

2. Die Performance ist nicht deutlich, sondern nur merklich schlechter. Und ja, durch den Einsatz entsprechender Controller mit passender Priorisierung kann dieser Effekt nahezu eliminiert werden. Diese Controller sind allerdings deutlich teurer als die Standardkomponenten.

3. Ja, das ist korrekt. Ein adäquate Controller-Chip kann bei RAID 6 den Aufwand des Schreibens ausgleichen.

4. Der 5805Z bringt nur etwas in Richtung Datensicherheit, nämlich der noch nicht auf die Platte geschriebenen »Pending I/Os«. In einer Produktionsumgebung mit sensiblen Daten würde ich diese Eigenschaft auf jeden Fall ins Lastenheft aufnehmen. Die Frage ist nicht, wie viel man für den Controller mehr ausgeben müsste, sondern doch eher, was es kostet, die dann fehlenden Blöcke zu rekonstruieren. Das müssen Sie in einer Kostenrechnung feststellen.

5. Obwohl aus den oben genannten Gründen RAID 6 kaum noch notwendig ist, gibt es zu dieser Konfiguration keine technische Alternative.

6. Datensicherungslösungen für sechs TByte: Es empfiehlt sich ein kleines Array mit vier oder fünf 2-TByte-Platten. Hier spart man sich teure Sicherungs-Software und vor allem den Ärger mit Bändern.

Gruß
Doc Storage