20.10.2017 (Doc Storage)
4 von 5, (8 Bewertungen)

High-Capacity-HDDs und RAID-Rebuild

Leserfrage: Die Festplattenkapazität überschreitet die 10-TByte-Marke, siehe die jüngsten Neuvorstellungen mit zwölf und 14 TByte. Mit acht Laufwerken lassen sich damit bereits über 100 TByte in einem Array darstellen. Die Frage, wer braucht's, stellt sich nicht, wir haben den Speicherplatz bisher immer voll bekommen. Was ist aber, wenn eine Platte ausfällt? Wir werden viele der High-Capacity-HDDs mit +10 TByte in »normalen« Disk-Subsystemen finden. Kommt es zu einem Plattenausfall und es ist ein Rebuild nötig, sind die üblichen RAID-Level doch am Ende, oder? Wie viele Wochen wird es dauern, bis die neue Platte wieder eingebunden ist? Selbst mit RAID 6 ist doch dann kein Array mehr wirklich geschützt. Was ist Ihr Rat?

Antwort Doc Storage:

Die Frage, wer das braucht, stellt sich heute tatsächlich nicht mehr. Danke, dass Sie mir die Beantwortung dieser Frage erspart haben. Natürlich bekommt man den Speicherplatz immer voll, und natürlich werden wir auch in Zukunft immer größere Medien brauchen.

Um den Tempus zu ändern – wir werden nicht eine Menge der größeren Platten in Speichersystemen finden. Diese haben bereits seit einiger Zeit Einzug gehalten und stellen die Anwender vor genau dieselben Probleme wie bei allen anderen Volumenzuwächsen vorher. Ob die RAID-Level am Ende sind, ist eine fast schon religiöse Frage, und um ellenlange Briefschlachten zu verhindern, ignoriere ich diese jetzt einfach mal. Allerdings wird eine vollständige Wiederherstellung wesentlich länger in Anspruch nehmen, als wir es von den nunmehr winzigen 1- oder 2-TByte-Plättchen gewohnt waren.

Anzeige

Natürlich hängt die tatsächliche Zeit für diesen Vorgang nicht nur vom Volumen der Platten, sondern auch von der Bandbreite ab, die der verwendete RAID-Controller dem Array zur Wiederherstellung reserviert, und natürlich vom verwendeten RAID-Schutz. Bei RAID 1 müssen lediglich die Zylinder von 0 bis n »durchkopiert« werden, was wesentlich schneller vonstattengeht als das Errechnen und Wegschreiben von Paritätsinformationen in RAID 5, ganz zu schweigen vom doppelten Schreibvorgang in RAID 6. Als Daumenwert in durchschnittlichen Umgebungen kann für jedes TByte ungefähr ein Tag in RAID 1, 30 Stunden in RAID 5 und 32 Stunden in RAID 6 angenommen werden.

Im schlimmsten Falle, also der Ausstattung mit 14-TByte-Medien, stehen Sie in RAID 1 also ungefähr zwei Wochen und in RAID 5 knapp 18 Tage neben einem ungeschützten und gegen weitere Ausfälle wehrlosen System. In RAID 6 dürfte der Vorgang gar knapp 19 Tage in Anspruch nehmen, allerdings sind die Daten dort wenigstens noch durch den zweiten Paritätssatz geschützt.

Allerdings beziehen sich diese Zeiten ausschließlich auf Systeme, die während der Wiederherstellung keine anderen Aufgaben zu erfüllen haben. Jeglicher produktive Zugriff während dieses Vorganges verlangsamt diesen zum Teil erheblich.

Es macht also wenig Sinn, Arrays mit solch großen Medien mit etwas anderem als RAID 6 auszustatten, um wenigstens gegen einen zweiten Plattenausfall gefeit zu sein. Ansonsten bleibt mir nur noch der Hinweis auf eine Kopie auf ein zweites Array oder auf ein Backup, welches Sie aber als professioneller Anwender immer parat haben sollten.

Und ja – viele Hersteller statten ihre Systeme inzwischen mit speziellen Schutzmechanismen aus, die die Herstellungszeit zum Teil erheblich verkürzen. Hierbei werden beispielsweise nur die Zylinder wiederhergestellt, die tatsächlich mit Daten beschrieben sind. Wieder andere lesen Informationen aus den Laufwerken aus und versuchen, Plattenausfälle rechtzeitig vorherzusehen und die dort vorhandenen Daten im laufenden Betrieb auf ein Ersatzlaufwerk zu kopieren. Handelt es sich allerdings um einen »dummen« RAID-Controller, fallen diese Möglichkeiten meistens aus.

Gruß
Doc Storage


Stellen Sie Ihre Frage
Doc. tec. Storage beantwortet alle Ihre technischen Fragen zu Storage, Backup & Co.

Stellen Sie Ihre Frage an: DocStorage@speicherguide.de

Mehr von Doc. tec. Storage 19.10.2018 NAS: Wie viele Volumes sind sinnvoll?

Die Ausgangslage ist ein Desktop-NAS mit RAID-5-Verbund. Wie ordnet man hier am sinnvollsten seine Daten? Ist es besser ein einziges Standard-Volume nutzen oder zu versuchen mit mehreren Volumes eine Struktur aufzubauen? Wie viele Volumes sind sinnvoll?


12.10.2018 Was bringt NVMe-oF und NF1?

Kürzlich wurde mit Mission Peak ein neues skalierbares und angeblich hochperformantes Speichersystem vorgestellt. Das Gerät basiert auf NVMe-oF und nutzt NF1-SSDs. Sind diese Technologien wirklich so toll? Wie hoch darf man die Erwartungen schrauben?


31.08.2018 Was ist Edge-Computing?

Neben dem Cloud-Computing wabert auch immer mal wieder der Begriff Edge-Computing vorbei. Eine der Definitionen lautet zum Beispiel, dass Daten direkt am Ursprung verarbeitet werden sollen, ohne dabei den Weg über ein Rechenzentrum einzuschlagen. Was bedeutet das genau und wofür brauchen wir Edge-Computing?


17.08.2018 Wie sinnvoll sind Objektspeicher mit NAS-Funktion?

Objektspeicher sind seit einiger Zeit nun auch mit NAS-Funktionalitäten erhältlich. Lassen sich solche Konfigurationen in der Praxis sinnvoll einsetzen und wie schaut es mit der Performance und Leistungswerten aus?


03.08.2018 Was können die Ethernet-Protokolle RoCE und iWARP?

Es gibt zwei neue RDMA-Protokolle: RoCE und iWARP. Hier stellt sich die Frage, was machen die und was sollte man als »normaler ITler« darüber wissen? Doc Storage erklärt die Funktionsweise der Ethernet-Protokolle, gibt aber zu bedenken, dass beide noch neu sind und man vielleicht noch ein wenig warten sollte.


20.07.2018 Storage mit KI: Wie ist hier der Stand?

Man liest ja in letzter Zeit einiges über Storage-Systeme mit eingebauter Intelligenz. Betrifft dies nur das Placement der Daten (Tier-Klassen), Objekt-Storage oder steckt da eine neue brauchbare Idee bezüglich Künstlicher Intelligenz (KI) dahinter?

powered by
TIM DCP Datacore Software
N-TEC GmbH Unitrends
Fujitsu Technology Solutions GmbH