20.10.2017 (Doc Storage)
4 von 5, (10 Bewertungen)

High-Capacity-HDDs und RAID-Rebuild

Leserfrage: Die Festplattenkapazität überschreitet die 10-TByte-Marke, siehe die jüngsten Neuvorstellungen mit zwölf und 14 TByte. Mit acht Laufwerken lassen sich damit bereits über 100 TByte in einem Array darstellen. Die Frage, wer braucht's, stellt sich nicht, wir haben den Speicherplatz bisher immer voll bekommen. Was ist aber, wenn eine Platte ausfällt? Wir werden viele der High-Capacity-HDDs mit +10 TByte in »normalen« Disk-Subsystemen finden. Kommt es zu einem Plattenausfall und es ist ein Rebuild nötig, sind die üblichen RAID-Level doch am Ende, oder? Wie viele Wochen wird es dauern, bis die neue Platte wieder eingebunden ist? Selbst mit RAID 6 ist doch dann kein Array mehr wirklich geschützt. Was ist Ihr Rat?

Antwort Doc Storage:

Die Frage, wer das braucht, stellt sich heute tatsächlich nicht mehr. Danke, dass Sie mir die Beantwortung dieser Frage erspart haben. Natürlich bekommt man den Speicherplatz immer voll, und natürlich werden wir auch in Zukunft immer größere Medien brauchen.

Um den Tempus zu ändern – wir werden nicht eine Menge der größeren Platten in Speichersystemen finden. Diese haben bereits seit einiger Zeit Einzug gehalten und stellen die Anwender vor genau dieselben Probleme wie bei allen anderen Volumenzuwächsen vorher. Ob die RAID-Level am Ende sind, ist eine fast schon religiöse Frage, und um ellenlange Briefschlachten zu verhindern, ignoriere ich diese jetzt einfach mal. Allerdings wird eine vollständige Wiederherstellung wesentlich länger in Anspruch nehmen, als wir es von den nunmehr winzigen 1- oder 2-TByte-Plättchen gewohnt waren.

Natürlich hängt die tatsächliche Zeit für diesen Vorgang nicht nur vom Volumen der Platten, sondern auch von der Bandbreite ab, die der verwendete RAID-Controller dem Array zur Wiederherstellung reserviert, und natürlich vom verwendeten RAID-Schutz. Bei RAID 1 müssen lediglich die Zylinder von 0 bis n »durchkopiert« werden, was wesentlich schneller vonstattengeht als das Errechnen und Wegschreiben von Paritätsinformationen in RAID 5, ganz zu schweigen vom doppelten Schreibvorgang in RAID 6. Als Daumenwert in durchschnittlichen Umgebungen kann für jedes TByte ungefähr ein Tag in RAID 1, 30 Stunden in RAID 5 und 32 Stunden in RAID 6 angenommen werden.

Im schlimmsten Falle, also der Ausstattung mit 14-TByte-Medien, stehen Sie in RAID 1 also ungefähr zwei Wochen und in RAID 5 knapp 18 Tage neben einem ungeschützten und gegen weitere Ausfälle wehrlosen System. In RAID 6 dürfte der Vorgang gar knapp 19 Tage in Anspruch nehmen, allerdings sind die Daten dort wenigstens noch durch den zweiten Paritätssatz geschützt.

Allerdings beziehen sich diese Zeiten ausschließlich auf Systeme, die während der Wiederherstellung keine anderen Aufgaben zu erfüllen haben. Jeglicher produktive Zugriff während dieses Vorganges verlangsamt diesen zum Teil erheblich.

Es macht also wenig Sinn, Arrays mit solch großen Medien mit etwas anderem als RAID 6 auszustatten, um wenigstens gegen einen zweiten Plattenausfall gefeit zu sein. Ansonsten bleibt mir nur noch der Hinweis auf eine Kopie auf ein zweites Array oder auf ein Backup, welches Sie aber als professioneller Anwender immer parat haben sollten.

Und ja – viele Hersteller statten ihre Systeme inzwischen mit speziellen Schutzmechanismen aus, die die Herstellungszeit zum Teil erheblich verkürzen. Hierbei werden beispielsweise nur die Zylinder wiederhergestellt, die tatsächlich mit Daten beschrieben sind. Wieder andere lesen Informationen aus den Laufwerken aus und versuchen, Plattenausfälle rechtzeitig vorherzusehen und die dort vorhandenen Daten im laufenden Betrieb auf ein Ersatzlaufwerk zu kopieren. Handelt es sich allerdings um einen »dummen« RAID-Controller, fallen diese Möglichkeiten meistens aus.

Gruß
Doc Storage


Stellen Sie Ihre Frage
Doc. tec. Storage beantwortet alle Ihre technischen Fragen zu Storage, Backup & Co.

Stellen Sie Ihre Frage an: DocStorage@speicherguide.de

Mehr von Doc. tec. Storage 14.06.2019 Ein Jahr DSGVO: Aufwand unerträglich hoch

Kolumne: Zur Einführung der DSGVO hat Doc Storage mächtig Dampf abgelassen. Ein Jahr später lässt kaum ein Verband ein gutes Haar an der Datenschutz-Grundverordnung. Der Aufwand für Firmen und IT-Abteilungen sei unerträglich hoch.


07.06.2019 Welchen Flash für welche Anwendung?

Vor rund sechs Jahren schickten sich Flash-Speicher an, sich in Computern und Storage-Systemen zu etablieren. Damals galten die Lösungen aber noch als proprietär. Wo steht die Technik heute und welcher Flash eignet sich für welchen Einsatzzweck?


17.05.2019 NAS-Caching oder Tiering für VMs multiple Zugriffe?

In einer Lehrumgebung werden virtuellen Maschinen auf einem NAS mit 10GbE-Anbindung gespeichert. Nachdem eine Erweiterung mit NVMe-Flash ansteht, stellt sich die Frage, ob eine Caching- oder eine Tiering-Konfiguration die sinnvollere Wahl ist?


10.05.2019 Wird Flash nun auch zum Backup-Medium?

Flash wird zunehmend auch für Backup interessant. Der Geschwindigkeitsvorteil soll die Dauer der Sicherung wie auch der Wiederherstellung reduzieren. Macht dies in der Praxis bereits Sinn – auch aus Kostensicht?


03.05.2019 Unterschied zwischen Active/Active und Active/Passive

Beim Thema Hochverfügbarkeit unterscheidet man zwischen Konfigurationen, die Active/Active bzw. Active/Passive agieren. Was ist genau der Unterschied und für welche Szenarien empfehlen sich die beiden Möglichkeiten? Welche Cluster-Architektur bietet hinsichtlich Skalierbarkeit mehr Spielraum für zukünftigen Lastzunahmen?


26.04.2019 Dateisysteme für den PByte-Bereich

Datenberge jenseits des PByte-Bereichs, Cloud-Anbindungen und Analytics-Szenarien stellen Dateiysteme vor neue Herausforderungen. Der Markt bietet einige Optionen wie GPFS, Gluster FS, OneFS oder QF2. Worauf gilt es zu achten? Update zu CephFS und ZFS.

powered by
Boston Server & Storage Solutions Datacore Software
Itiso GmbH Seagate Technology
N-TEC GmbH FAST LTA AG
Fujitsu Technology Solutions GmbH Pure Storage