High-Capacity-HDDs und RAID-Rebuild

20.10.2017 Doc Storage

High-Capacity-HDDs und RAID-Rebuild

Leserfrage: Die Festplattenkapazität überschreitet die 10-TByte-Marke, siehe die jüngsten Neuvorstellungen mit zwölf und 14 TByte. Mit acht Laufwerken lassen sich damit bereits über 100 TByte in einem Array darstellen. Die Frage, wer braucht's, stellt sich nicht, wir haben den Speicherplatz bisher immer voll bekommen. Was ist aber, wenn eine Platte ausfällt? Wir werden viele der High-Capacity-HDDs mit +10 TByte in »normalen« Disk-Subsystemen finden. Kommt es zu einem Plattenausfall und es ist ein Rebuild nötig, sind die üblichen RAID-Level doch am Ende, oder? Wie viele Wochen wird es dauern, bis die neue Platte wieder eingebunden ist? Selbst mit RAID 6 ist doch dann kein Array mehr wirklich geschützt. Was ist Ihr Rat?

Antwort Doc Storage:

Die Frage, wer das braucht, stellt sich heute tatsächlich nicht mehr. Danke, dass Sie mir die Beantwortung dieser Frage erspart haben. Natürlich bekommt man den Speicherplatz immer voll, und natürlich werden wir auch in Zukunft immer größere Medien brauchen.

Um den Tempus zu ändern – wir werden nicht eine Menge der größeren Platten in Speichersystemen finden. Diese haben bereits seit einiger Zeit Einzug gehalten und stellen die Anwender vor genau dieselben Probleme wie bei allen anderen Volumenzuwächsen vorher. Ob die RAID-Level am Ende sind, ist eine fast schon religiöse Frage, und um ellenlange Briefschlachten zu verhindern, ignoriere ich diese jetzt einfach mal. Allerdings wird eine vollständige Wiederherstellung wesentlich länger in Anspruch nehmen, als wir es von den nunmehr winzigen 1- oder 2-TByte-Plättchen gewohnt waren.

Natürlich hängt die tatsächliche Zeit für diesen Vorgang nicht nur vom Volumen der Platten, sondern auch von der Bandbreite ab, die der verwendete RAID-Controller dem Array zur Wiederherstellung reserviert, und natürlich vom verwendeten RAID-Schutz. Bei RAID 1 müssen lediglich die Zylinder von 0 bis n »durchkopiert« werden, was wesentlich schneller vonstattengeht als das Errechnen und Wegschreiben von Paritätsinformationen in RAID 5, ganz zu schweigen vom doppelten Schreibvorgang in RAID 6. Als Daumenwert in durchschnittlichen Umgebungen kann für jedes TByte ungefähr ein Tag in RAID 1, 30 Stunden in RAID 5 und 32 Stunden in RAID 6 angenommen werden.

Im schlimmsten Falle, also der Ausstattung mit 14-TByte-Medien, stehen Sie in RAID 1 also ungefähr zwei Wochen und in RAID 5 knapp 18 Tage neben einem ungeschützten und gegen weitere Ausfälle wehrlosen System. In RAID 6 dürfte der Vorgang gar knapp 19 Tage in Anspruch nehmen, allerdings sind die Daten dort wenigstens noch durch den zweiten Paritätssatz geschützt.

Allerdings beziehen sich diese Zeiten ausschließlich auf Systeme, die während der Wiederherstellung keine anderen Aufgaben zu erfüllen haben. Jeglicher produktive Zugriff während dieses Vorganges verlangsamt diesen zum Teil erheblich.

Es macht also wenig Sinn, Arrays mit solch großen Medien mit etwas anderem als RAID 6 auszustatten, um wenigstens gegen einen zweiten Plattenausfall gefeit zu sein. Ansonsten bleibt mir nur noch der Hinweis auf eine Kopie auf ein zweites Array oder auf ein Backup, welches Sie aber als professioneller Anwender immer parat haben sollten.

Und ja – viele Hersteller statten ihre Systeme inzwischen mit speziellen Schutzmechanismen aus, die die Herstellungszeit zum Teil erheblich verkürzen. Hierbei werden beispielsweise nur die Zylinder wiederhergestellt, die tatsächlich mit Daten beschrieben sind. Wieder andere lesen Informationen aus den Laufwerken aus und versuchen, Plattenausfälle rechtzeitig vorherzusehen und die dort vorhandenen Daten im laufenden Betrieb auf ein Ersatzlaufwerk zu kopieren. Handelt es sich allerdings um einen »dummen« RAID-Controller, fallen diese Möglichkeiten meistens aus.

Gruß
Doc Storage

Weiterführende Links

Doc Storage: Verlängert ein schonender Schreibzyklus die HDD-Lebensdauer?
Doc Storage: Was ist bei lange eingelagerten Festplatten zu beachten?
Doc Storage: Worauf muss man bei NAS-optimierten Festplatten achten?
Doc Storage: Was ist Erasure-Coding?
Doc Storage: Limitierte Schreibzyklen auch bei Festplatten?