HDD-Fehlerraten schlecht in RAID-5-Arrays?

16.02.2018 Doc Storage

HDD-Fehlerraten schlecht in RAID-5-Arrays?

Leserfrage: In diesem Video »Why You Should NOT Use RAID 5 Storage (But Use RAID 6!)« (ab ca. 3:40), wird argumentiert, dass HDDs gewisse Fehlerraten haben, im Schnitt alle 10^14 Bit, das sind rund zwölf TByte. Und wenn das Array mehr als zwölf TByte ausmacht, sei es gut möglich, dass es einen Lesefehler gibt. In diesem Falle würde sich das RAID nicht mehr wiederherstellen lassen, wenn eine Platte ausfällt. Was halten Sie von dieser Aussage?

Antwort Doc Storage:

Wie immer in der EDV, es kommt drauf an: Erstens auf die Platte und ihren Hersteller, zweitens auf das Alter der Medien, drittens auf deren Nutzungs- und Abnutzungsgrad, viertens auf die Umgebungsbedingungen und vieles mehr. Natürlich gibt es diesen theoretischen Wert von zwölf TByte, der bereits seit ich-weiß-nicht-wann in den Medien herumschwirrt. Es kommt auch darauf an, wie wir mit diesem Wert umgehen – bezieht er sich auf einzelne Medien oder auch einen Verbund derselben?

Nehmen wir einmal an, dass er sich auf den Verbund derselben, also eine RAID-Gruppe bezieht. Auch hier gibt es wieder Unterscheidungsmerkmale, wie unter anderem die Platten und Controller. Sollte es in einem RAID 5 zu einem Medienfehler kommen, und sollte dieser nicht schon beim Schreiben aufgefallen und der entsprechende Zylinder ausgeschlossen worden sein (was in den meisten Fällen passiert, so dass Medienfehler überhaupt nicht auffallen), kommt es auf die »Intelligenz« des Controllers an.

Moderne Controller und Speichersysteme werden nur den beschädigten Zylinder und die dort gespeicherten Daten nicht mehr lesen können. Dies bedeutet eine beschädigte Datei, vielleicht mehrere, wenn diese klein genug sind, sich den Zylinder zu teilen.

Der Controller wird einen entsprechenden Hinweis geben, und die Aufforderung die Platte zu ersetzen gleich dazu. Und jetzt kommt das berühmte »aber«: Erstens sind alle Platten mit Ersatzzylindern ausgerüstet und verlagern möglicherweise dort gespeicherte Daten frühgenug auf einen »frischen« (also bevor ein Lesefehler passiert). Zweitens warnen alle vernünftigen Controller und Speichersysteme frühzeitig vor einer »ausgelatschten« Platte und verlagern die Daten auf ein mitlaufendes Ersatzmedium. Drittens verwendet niemand, der seine Daten liebt, bei einem zwölf oder mehr TByte großen Array allen Ernstes noch RAID 5.

Wenn das Geld da nicht mehr für RAID 6 reicht, sollte man es gleich lassen. Ach ja - und viertens hat jeder, der seine Daten liebt, jeden Tag oder in kürzeren Abständen ein Backup gezogen. Damit sollten alle Schrecken, die der junge Kollege hier zu verbreiten versucht, vermieden bzw. statistisch ins Reich des annähernd unmöglichen verwiesen sein.

Und um die Frage zu beantworten, was ich von dem Video halte: mathematisch absolut korrekt, in der praktischen DV allerdings (mal wieder) völlig bedeutungslos.

Gruß
Doc Storage

Weiterführende Links

Doc Storage: High-Capacity-HDDs und RAID-Rebuild
Doc Storage: Verlängert ein schonender Schreibzyklus die HDD-Lebensdauer?
Doc Storage: Was ist bei lange eingelagerten Festplatten zu beachten?
Doc Storage: Wie lange kann man HDDs ungenutzt lagern?