E-Mail-Kommunikation und E-Business-Transaktionen bestimmen das Geschäftsleben. Auch das private Umfeld wird zunehmend zum digitalen Zuhause. Die langfristige Sicherung essenzieller Datenbestände auf geeigneten Speichermedien stellt IT-Manager wie Heimanwender vor große Herausforderungen.
von Siegfried Dannehl
Die Problematik der Archivierung digitaler Daten an sich ist nicht neu. Bereits seit Jahren sind beispielsweise Finanzinstitute, Versicherungen, öffentliche Verwaltungen, Industrie, Forschung oder das Gesundheitswesen mit dieser Thematik konfrontiert. Einen kontinuierlich wachsenden Stellenwert erlangt das Thema durch die weltweit wachsende Anzahl gesetzlicher Regularien (GDPdU, Sarbanes-Oxley), die Unternehmen verpflichten, relevante, elektronisch erstellte Geschäftsunterlagen über lange Zeiträume zu archivieren.
Vergleichsweise neu ist, dass sich angesichts der zunehmenden Konvergenz von Computertechnik und Unterhaltungselektronik auch IT-Heimanwender mit der langfristigen Archivierung persönlicher digitaler Daten auseinander setzen müssen. Egal ob es um die digitalen Fotos des Traumurlaubs oder um ein MP3-Musikarchiv mit Lieblingstiteln geht – es gibt digitale Daten, die selbst im Laufe von Jahrzehnten nichts von ihrem hohen persönlichen Wert einbüßen und die es zu konservieren gilt.
Informationsmanagement wird zur Schlüsseldisziplin
Unter dem Stichwort Information-Lifecycle-Management (ILM) werden derzeit weltweit Konzepte erarbeitet, der Informationsflut Herr zu werden. Eine zentrale Rolle spielt dabei die sichere Lagerung der Daten während ihres gesamten – nicht selten jahrzehntelangen – Nutzungszeitraums von ihrer Generierung bis zur Löschung. Die Datensicherung wird gewöhnlich in die beiden Bereiche Backup und Archivierung unterteilt.
Unter Backup versteht man das regelmäßige Erstellen von Sicherungskopien relevanter Datenbestände. Diese besitzen eine begrenzte Lebensdauer und müssen kontinuierlich aktualisiert werden. Die Sicherung soll die Rekonstruktion der Datenbestände beispielsweise bei katastrophalen Hard- und Software-Fehlern, Virenbefall, aber auch wegen einer unbeabsichtigten Löschung, schnell und konsistent ermöglichen.
Unter Archivierung ist im Gegensatz dazu der Prozess zu verstehen, elektronische Daten langfristig auf ein externes magnetisches oder optisches Speichermedium auszulagern, um gegebenenfalls nach vielen Jahren innerhalb weniger Minuten darauf zuzugreifen. Ein Sonderfall der Archivierung ist die Datenkonservierung (Preservation). Während die meisten archivierten Daten ein Verfallsdatum haben und nach 5, 10, oder 30 Jahren vernichtet werden können, gilt es gesellschaftlich wertvolle Datenbestände, wie sie beispielsweise in Bibliotheken existieren, quasi zeitlich unbegrenzt für die Nachwelt zu erhalten.
Archivierung: eine Aufgabe – drei Probleme
In Papierarchiven kann der lesekundige Benutzer einfach lesen. Elektronische Archive lassen sich dagegen ohne elektronische Hilfsmittel nicht nutzen. Neben dieser grundsätzlichen Hürde sieht Dr. Ulrich Kampffmeyer von der Unternehmensberatung Project Consult im Umfeld der elektronischen Archivierung drei Problemfelder:
1. Das Format der Dokumente
Textverarbeitungsdateien, E-Mails, Videos, Sprachaufzeichnungen, Multimediaobjekte, Zusatzinformationen – die Vielfalt der verwendeten Datenformate und ihre Kurzlebigkeit machen es schwierig, die Objekte nach Jahren verlustfrei wieder anzuzeigen und zu reproduzieren. Auch Standards haben einen Lebenszyklus und bieten im Laufe von Jahrhunderten nicht die Sicherheit, Information in gleicher Form und in gleichem Kontext verfügbar zu halten.
2. Die Erschließungsdaten
Es geht nicht nur um die Objekte selbst, sondern auch um ihre Metadaten. Das sind den Inhalt beschreibende und den Zugriff erlaubende Informationen. Ist die Datenbank, die ein elektronisches Archiv verwaltet, beispielsweise inkonsistent geworden oder selbst nicht mehr nutzbar, ist kein Zugriff auf die archivierten Objekte mehr möglich. Das Archiv wird zum Datengrab.
3. Die Speichermedien
Elektronische Speichermedien altern oder benötigen wie im Fall vieler optischer Speichermedien spezielle Software für den Zugriff und das Auslesen. Selbst wenn die Informationen noch unverändert vorhanden sind, kann nach einiger Zeit nicht mehr sichergestellt werden, dass der Datenträger bei Weiterentwicklungen der Hard- und Software noch genutzt werden kann.
Haltbarkeitsangaben bleiben vage Prognosen
Betrachtet man die digitale elektronische Archivierung unter physikalischen Gesichtspunkten, hängt die reale Lebensdauer der gespeicherten Daten auf dem jeweiligen Datenträger nach Ansicht von Professor Martin Albrecht von der Physikalisch-Technischen Bundesanstalt in Braunschweig im wesentlichen von den folgenden Parametern ab:
| 1. | Aufzeichnungsverfahren |
| 2. | Stabilität der Aufzeichnung (magnetisch, optisch, magneto-optisch, mechanisch) |
| 3. | Lagerbedingungen der Datenträger |
| 4. | Häufigkeit des Lesens, Verschleiß beim Lesen der Daten |
| 5. | Verfügbarkeit von geeigneten Lesegeräten |
| 6. | Verfügbarkeit einer Dekodierungssoftware |
Generell untersuchen und spezifizieren die jeweiligen Hersteller bei der Medienentwicklung die Haltbarkeit der Trägermaterialien und die Lebensdauer der Aufzeichnung. Die angegebenen Werte gelten allerdings nur, wenn die in der Spezifikation angegebenen Grenzwerte für die Datenkodierung und die Lagerbedingungen exakt eingehalten werden. Idealbedingungen, die in der Praxis eher selten vorkommen. Im Alltagsbetrieb kommen dejustierte Laufwerke, in denen wichtige Parameter wie Schreibstrom oder Laserintensität nicht mehr der Norm entsprechen, ebenso häufig vor wie Abweichungen von den vorgeschriebenen Lagerbedingungen, beispielsweise der Temperatur oder Luftfeuchtigkeit.
Als weiteres Kriterium, das sich negativ auf die Datenhaltbarkeit auswirkt, nennt Professor Albrecht die Anzahl der Lesevorgänge und der dabei auftretende Verschleiß. Optische Medien, die beim Datenzugriff keinen direkten Kontakt zum Lesegerät benötigen, nutzen sich üblicherweise weniger ab als Magnetbänder oder Disketten. Sie erweisen sich allerdings als deutlich empfindlicher gegenüber anderen mechanischen oder thermischen Belastungen wie Kratzern, Verschmutzung, Verbiegung oder hoher Temperatur.
Ein weiterer wesentlicher Punkt ist die Art der Datenkodierung. Wählt man aus Platzgründen komprimierende Verfahren mit Fehlerkorrektur, wie sie heute bei fast allen Medien üblich sind, so hängt die Lesbarkeit direkt von der Existenz von Treiber-Software für die in Zukunft gängigen Controller und Betriebssysteme ab. Wenn das bei der Speicherung verwendete Verfahren zur Datenkompression und Fehlerkorrektur ausläuft, wird es also notwendig, die Daten auszulesen und mit den aktuellen Verfahren wiederum zu speichern.
Die permanente Datenmigration, bei der sämtliche magnetisch bzw. optisch gespeicherten Archivdaten in regelmäßigen Abständen jeweils auf die neueste Generation von Hard- und Software umkopiert werden, ist allerdings nur ein scheinbarer Ausweg aus dem Dilemma. Die Vorgehensweise stößt in der Praxis schnell an ihre Grenzen. Zum einen ist der benötigte Zeitaufwand enorm, zum anderen sind die dadurch entstehenden Kosten häufig unkalkulierbar. Letztendlich sind Migrationen selbst – sogar bei sorgfältigster Durchführung – nicht selten ein potenzieller Auslöser für Datenverluste.
Zusammenfassend kommt Albrecht zu dem Schluss, dass es kein optimales System für alle Speicheranwendungen gibt. Entscheidend ist, welche Ansprüche bezüglich Datensicherheit, Dauer der Speicherung, Zugriffszeit, Umgebungsbedingungen und Kosten bestehen. Unter Berücksichtigung dieser Anforderungen kann ein optimales System für die Anwendungen gewählt werden, das eine sehr lange Datenspeicherung ermöglicht. Doch selbst in diesem Fall bleibt die Frage nach der konkreten Datenhaltbarkeit offen. »Die Lebensdauer von gespeicherten Daten unter realen Bedingungen lässt sich nur sehr schwer abschätzen und schon gar nicht berechnen«, resümiert Albrecht.
Schwankungsbreite bei der Haltbarkeit von Speichermedien
Quelle: Data Preservation Coalition
Die Lagerbedingungen (Luftfeuchtigkeit, Temperatur) von magnetischen wie optischen Speichermedien können die Haltbarkeit der auf ihnen gespeicherten Daten extrem beeinflussen. Je wärmer und feuchter das Umgebungsklima, desto kürzer bleibt die Datenintegrität erhalten.