Anzeige

Langzeitarchivierung und das dunkle Zeitalter Teil II

Dr. Ulrich Kampffmeyer

Metadaten für Langzeitarchive haben ein Problem: Einen Metadaten-Standard für die Archivierung kann es nicht geben. Die Anforderungen von mehreren hundert Jahren erfüllt nur eine Strategie aus »Mapping« und »Continuous Migration«.
Grundlage für ein Langzeitarchiv ist die sinnvolle Auftrennung der Architektur. Hierzu sind die Komponenten »Vorverarbeitung in der Erfassung«, »Schema-Datenbank«, »Archivsystem nach ISO 17421 OAIS« und »Archivsystemspeicher« vorzusehen. Die Strategie sieht so aus:
a) Aus den anliefernden Systemen kommen möglichst »fertige Objekte«, also mit Metadaten zu Inhalt, Kontext und Formaten. Eine manuelle bzw. teilautomatisierte Nachbearbeitung wird wegen der Menge der Informationen durch das Archivpersonal nicht möglich sein. Die Vorverarbeitung vor dem OAIS-Ingest muss die Prüfung und die Auswertung der Metadaten sicherstellen. Dieses Modul ist ständig zu pflegen und muss über Standardschnittstellen zu den wichtigsten Zulieferern von Informationen verfügen.
b) Eine Mapping-Datenbank (Schema-Datenbank), die alle vorhandenen Eingangs- und Archivierungs-Schemata für Metadaten verwaltet, versioniert und historisiert und stellt die Kontrolle über die verwendeten Strukturen und Metadaten-Attribute sicher. Über die Datenbank erfolgt beim Ingest die Zuordnung der angelieferten Objekt-Metadaten zur aktuellen Version der Archivmetadaten. Bei Retrieval über Facetted-Search und einer freien Suche (à la Google) erfolgt ein Mapping auf die verfügbaren Archiv-Schemata-Attribute und eine Weiterleitung auf das jeweilige Repository mit Bereitstellung der Informationsobjekte. Diese Mapping-Datenbank ist ein Zusatzmodul für das OAIS-konforme System und ist in der Regel nur optional erhältlich. Eine Federated-Search stellt so sicher, dass aus unterschiedlichen Beständen die passenden Objekte gefunden werden.
c) Archivspeicher sind so auszulegen, dass sie über Standardschnittstellen (z.B. XAM oder eine verbesserte Folgeversion) ansprechbar sind sowie über eine separate Index-Datenbank verfügen, deren Struktur, Schema und Inhalte in der Schema-Datenbank erschlossen sind. Der Speicher sollte möglichst »dumm« sein, da nur Systeme ohne eigene Logik langfristig Bestand haben. Dies erlaubt auch die Nutzung gealterter Systeme (es wird nur noch gelesen, nicht mehr geschrieben), da eine Suche über verschiedene Repositorys mittels der Steuerung durch die Schema-Datenbank sichergestellt wird. Dies kann auch die physische Migration unnötig bzw. unabhängig vom technologischen Wandel machen. Zudem bietet diese Strategie die Möglichkeit, über die Zeit verschiedene Archivspeicher gemeinsam zu nutzen.
d) Im Rahmen von »Continuous Migration«, also der ständig durchgeführten und unabhängig von Technologiegenerationen geplanten Migration von Datenbanken und Speicher-Subsystemen, lassen sich Migrationen auch dafür nutzen, weitere Attribute dem migrierten System hinzuzufügen oder die Erschließungsstrukturen neuen Nutzungsmodellen anzupassen. So können Informationsobjekte in zusätzliche Anzeige-Renditionen konvertiert, die Inhalte durch automatische Klassifikation ausgelesen und im Index ergänzt, Header-Komponenten der Objekte vervollständigt oder neue geschrieben und andere Operationen durchgeführt werden. Durch die Schema-Datenbank ist der alte Zustand weiterhin bekannt und auch ein Mapping der ursprünglichen Struktur auf die migrierte Struktur möglich.
Diese Ansätze sind nicht neu und es gibt aus den zahlreichen Pilotprojekten von Archiven noch andere Alternativen. Jedoch stellt die selbstbeschreibende Funktionalität des Systems im Zusammenwirken mit Mapping-Strategien und Continuous-Migration derzeit den offenbar einzig gangbaren Weg dar, Information dauerhaft verfügbar und nutzbar zu halten. Die Umsetzung von Strategien zur sicheren Archivierung und zur sicheren Erschließung der archivierten Informationen über lange Zeiträume ist dringend geboten, denn längst macht das Bonmot des »dunklen Zeitalters der frühen Informationsgesellschaft« die Runde.
Zum Autor
Dr. Ulrich Kampffmeyer ist Geschäftsführer der Hamburger Unternehmensberatung Project Consult.

Anzeige