zur Startseite 
Anzeige
 Fehlerteufel
 © 2010 by
speicherguide.de GbR
Seite empfehlenSeite empfehlen Diese Seite bookmarken bei ...
 Seite bei Google bookmarken    Seite bei Mister Wong bookmarken    Seite bei Linkarena bookmarken    Seite bei Yigg bookmarken    Seite bei Webnews bookmarken    Seite bei Folkd bookmarken 
[29.09.2005] (kfr)
Article Rating

MTBF-Zeiten nur Schall und Rauch

Immer mehr Harddisk-Hersteller nehmen davon Abstand, die Zuverlässigkeit ihrer Produkte mit Hilfe hauptsächlich mathematisch ermittelter MTBF-Stunden (Mean Time Between Failure) zu dokumentieren. Neue Angaben wie die Annualized-Failure-Rate (AFR) sollen mehr Klarheit schaffen.

von Siegfried Dannehl

Die bis dato verwendete MTBF-Zeit zur Darstellung der Ausfallsicherheit von Festplatten, ist eine Angabe, die leicht zu vermarkten ist. Doch selbst Experten sind sich einig, sie ist genauso schwierig zu erklären und nahezu unmöglich zu überprüfen. Aufgrund des Fehlens klarer Richtlinien zur Ermittlung der MTBF-Zeit – ein Versuch der Standardisierung durch die IDEMA (International Disk Drive Equipment Materials Association) verlief im Sande – sind die Angaben zu den Laufwerken unterschiedlicher Hersteller oft nicht einmal vergleichbar. Obwohl die Berechnungen der Produzenten auf Spezifikationen wie dem »Military Handbook for Reliability Prediction of Electronic Equipment« (MIL-HDBK-217) oder dem von den AT&T Bell Labs entwickelten Bellcore-Reliability-Prediction-Model basieren, bleibt den Harddisk-Herstellern viel Freiraum für eigene Interpretationen.

So basierte die Kalkulation der MTBF-Zeit von IBM IDE-Platten jahrelang auf 333 monatlichen Betriebsstunden (Power On Hours, POH) bei einer Umgebungstemperatur von 40 Grad Celsius. Seagate ging dagegen bei seinen ATA-Laufwerken von 270 Betriebsstunden bei einer Temperatur von 25 Grad Celsius aus. Der MTBF-Kalkulation der für den Netzwerkbetrieb spezifizierten SCSI-Drives lag demgegenüber ein monatlicher Rund-um-die-Uhr-Betrieb von 732 Betriebsstunden zu Grunde.

Theorie und Praxis klaffen auseinander

MTBF-Angaben, die bei neuesten Harddisk-Generationen mittlerweile bei über einer Million Stunden liegen, wurden laut Hitachi GST in der Vergangenheit überdies häufig fehlinterpretiert. So bedeuten beispielsweise eine MTBF von 1,2 Millionen Stunden nicht, dass das Laufwerk die nächsten 137 Jahre rund um die Uhr fehlerfrei funktioniert. Vielmehr versteht Hitachi GST unter dieser Angabe, dass bei einer installierten Basis von 1,2 Millionen Laufwerken, die unter idealen (!) Temperatur- und Belastungsbedingungen betrieben werden, statistisch gesehen jede Stunde ein Laufwerk ausfällt. Dass ideale Betriebsbedingungen in der Praxis eher selten auftreten, bedarf keiner ausdrücklichen Erwähnung. Konkurrent Maxtor geht deshalb davon aus, dass die tatsächliche MTBF-Zeit unter realen Bedingungen gerade einmal 50 bis 60 Prozent der statistisch ermittelten MTBF-Dauer entspricht.

 Zum Vergrößern anklicken!  Mehr Zugriffe, mehr Fehler
Quelle: Seagate
Doch nicht nur Umgebungseinflüsse wie Staub, Vibrationen oder eine zu hohe bzw. zu niedrige Umgebungstemperatur wirken sich negativ auf die Ausfallhäufigkeit von Festplatten aus. Auch die Belastung, dargestellt durch die Art und Dauer der Schreib-/Lese- und Suchzugriffe, kann sich insbesondere bei preiswerten ATA- bzw. SATA-Laufwerken deutlich in der Fehlerrate niederschlagen wie Festplattenhersteller Seagate in einer Studie ermittelte.

Der Analyse zugrunde lagen drei Gruppen von jeweils 100 handelsüblichen ATA-Drives, die über einen Zeitraum von 1.200 Stunden unterschiedlichen Belastungen ausgesetzt wurden. Bereits bei einem häufigen sequenziellen Zugriff verdoppelte sich die kumulierte Fehlerrate. Bei Betriebsbedingungen, die denen eines Low-End-Servers entsprechen (häufiger Random-Zugriff), vervierfachte sich die Fehlerrate der für den Desktop-Betrieb konzipierten ATA-Disks.

AFR statt MTBF

 Zum Vergrößern anklicken!  Quelle: Seagate
Die Annualized-Failure-Rate (AFR) errechnet sich aus den monatlichen Ausfällen der installierten Basis mal 12 Monate.



 Zum Vergrößern anklicken!  Jährliche prozentuale Ausfallrate
Quelle: Seagate
Mit neuen und vor allem für den Anwender nachvollziehbaren Angaben wollen Festplattenhersteller wie Western Digital oder Maxtor Abhilfe schaffen. WD dokumentiert die Zuverlässigkeit unserer Laufwerke nicht mehr mittels MTBF, sondern verwenden die Angaben: Component-Design-Life (CDL) und Annualized-Failure-Rate (AFR). CDL soll dabei fünf Jahre betragen, die AFR unterhalb von 0,8 Prozent liegen. Während CDL die Lebenserwartung der verwendeten Schlüsselkomponenten widerspiegelt, errechnet sich die AFR aus den monatlichen Ausfällen pro installierter Basis multipliziert mit dem Faktor 12 (für ein Jahr). Es besteht auch ein direkter Zusammenhang zwischen der AFR und der MTBF: die AFR (%) = 1/MTBF x POH (Power On Hours) x 100.

 Zum Vergrößern anklicken!  Temperatur und Ausfallrate
Quelle: Seagate
Dass aber auch die jährliche prozentuale Ausfallrate keine feste Größe ist, zeigt wiederum eine Untersuchung von Seagate. Hier haben Forscher die Auswirkungen der Betriebszeit (POH), der Schreib-/Lesebelastung (Duty Cycle) und der Temperatur auf die AFR analysiert und dargestellt:

Auch Hitachi GST geht dazu über den eher hypothetischen MTBF-Wert durch klar definierte und vor allem verständliche Begriffe zu ersetzen. Diese sollen dem Anwender helfen, die Ausfallsicherheit seiner eingesetzten Festplatten besser abzuschätzen. Dazu zählen Angaben zu Parametern wie:

Recoverable-Error-Rate – Hinweis, wie häufig behebbare Fehler auftreten.
Unrecoverable-Error-Rate – Hinweis, wie oft nicht behebbare Fehler auftreten.
Load/Unload-Cycles – Hinweis, wie oft der Schreib-/Lesekopf positioniert wird, bis Fehler durch mechanische Abnutzungen auftreten können.
Start/Stop-Cycles – Hinweis, wie häufig der Motor anläuft bzw. abbremst, bevor Fehler durch mechanische Abnutzungen auftreten können.
Recommended-Power-On-Hours – Hinweis zu den empfohlenen maximalen Betriebsstunden.
Duty-Cycle – Prozentuale Angabe wie häufig das Laufwerk während des Betriebs Schreib-, Lese- und Suchoperationen durchführen kann, ohne an Zuverlässigkeit zu verlieren.
Rating
Kommentare
Only registered users may post comments.


 ...nach oben 
Grundlagen Technik
Hintergrund, Spezifikationen, Komponenten
Zuverlässigkeitsangaben für Disks ohne Aussagekraft
Special »Serial-ATA«
powered by:
 Anzeige