11.02.2022 (Doc Storage)
4.1 von 5, (14 Bewertungen)

Unterschiede zwischen Backup und Archiv

  • Inhalt dieses Artikels
  • Was ist Backup?
  • Was ist ein Archiv?
  • Was ist der Unterschied zwischen Wiederherstellen und Abrufen?
  • Warum Sie sowohl Backup als auch Archiv benötigen

Leserfrage: Eine immer wiederkehrende Diskussion dreht sich um das Thema Archivierung vs. Backup. Die landläufige Meinung lautet oft genug: Ein Archiv ist eigentlich nur ein Backup, welches länger aufbewahrt wird. Warum ersetzt ein Backup kein Archiv, wie ist Ihre Meinung?

Antwort Doc Storage:

Backups und Archive erfüllen unterschiedliche Funktionen, aber in vielen Fällen werden beide Begriffe in einem Zusammenhang verwendet. Allerdings ist es wichtig, den Unterschied zwischen beiden zu definieren, um sicherzustellen, dass Datenspeichermethoden die Anforderungen von Anwendern in einer ganzen Reihe von Bereichen erfüllen.

  • Aufbewahrung für einen benötigten Zeitraum
  • Schutz vor Verlusten oder unbefugten Zugriffen
  • Wiederherstellung und Abruf je nach Bedarf
  • Strukturen und Markierungen, um das Auffinden bestimmter Daten zu erleichtern
  • Online-Verfügbarkeit je nach Anforderungen

Danach lassen sich zwei Lösungen grob definieren:

  • Die Sicherung (Backup) dient der Wiederherstellung nach einem Systemfehler (Hardware und/oder Software) oder kürzlich erfolgter Beschädigung von Daten sowie deren Verlust
  • Das Archiv dient der Speicherplatzverwaltung und der langfristigen Aufbewahrung

Was ist Backup?

Ein Backup ist eine Kopie produktiver Daten, die zum Schutz vor Datenverlust oder deren Verfälschung erstellt wird. Typischerweise werden Backups regelmäßig gemäß einem Zeitplan erstellt, oder aber wenn sich die ursprünglichen Daten ändern. Die Originaldaten werden nicht gelöscht, aber ältere Backups werden oft zugunsten neuerer Versionen gelöscht.

Desktop-Rechner, Server, virtuelle Maschinen oder mobile Geräte werden üblicherweise alle gesichert. Backups können je nach Methodik und deren Zweck Daten, Betriebssystem- und Anwendungsdateien oder eine Kombination aller drei Kategorien umfassen.

Das Ziel eines Backups ist es, eine Kopie aller Daten zu erstellen, welche in einem System aktuell verwendet werden und von denen es nicht wünschenswert ist, dass diese verloren gehen. Backups von Desktop- oder Mobilgeräten enthalten typischerweise nur die Benutzerdaten, so dass sich bei Bedarf frühere Dateiversionen wiederherstellen lassen. Bei diesen Gerätetypen kann davon ausgegangen werden, dass sich das Betriebssystem und die Anwendungen selbst bei Bedarf problemlos aus den Originalquellen wiederherstellen lassen. In einer virtuellen Umgebung enthalten Backups meistens die Dateien der virtuellen Laufwerke, die Daten und das Betriebssystem, aber auch strukturierte Daten wie Datenbanken oder unstrukturierte Daten. Hiermit kann nach einer Wiederherstellung das System so schnell wie möglich wieder in Betrieb gehen.

Im Falle von kriminellen, meist Ransomware-Angriffen kann eine gute Backup-Strategie einen sehr teuren Unterschied ausmachen. Meist zwischen der Möglichkeit, ein angegriffenes System schnell wiederherzustellen, und der Zahlung eines hohen Geldbetrages in der vagen Hoffnung, einen Code zu erhalten, welcher den Zugriff auf Dateien ermöglicht, die nicht mehr verfügbar sind, da sie vom Angreifer verschlüsselt wurden.

Außerdem können sich Nutzer Backup-Versionen bedienen, um frühere Versionen von Dateien oder Datenbanken abzurufen. Dies für den Fall, dass die ältere Version Daten enthält, welche nicht mehr in der aktuellen Datei enthalten sind, oder aber, um eine Datei mit einem anderen Nutzer zu teilen.

Was ist ein Archiv?

Ein Archiv ist eine Kopie von Daten, welche zur langfristigen Speicherung und Referenz erstellt wurde. Die originalen Daten können aus dem Quellsystem gelöscht werden, nachdem die Archivkopie erstellt und gespeichert wurde. Allerdings ist es üblich, das Archiv als einzige Kopie bestimmter Daten vorzuhalten.

Im Gegensatz zu einem Backup, dessen hauptsächlicher Zweck darin besteht, einen Rechner oder ein Dateisystem in einen früheren, meist nutzbaren Zustand zu versetzen, erfüllt ein Archiv mehrere Zwecke. Es kann einem Unternehmen eine dauerhafte Aufzeichnung wichtiger Papiere, juristischer Dokumente, Korrespondenz und anderer Angelegenheiten zur Verfügung stellen. Darüber hinaus werden Archive verwendet, um die Anforderungen an die Aufbewahrung von Informationen für Unternehmen und Personen zu erfüllen. Gilt es Fragen zu bestimmten Dokumentinhalten oder anderen geschäftlichen Korrespondenzen, Verträgen, Finanztransaktionen oder Mitarbeitern zu klären, lassen sich Aufzeichnungen zu diesen Themen aus dem Archiv abrufen.

Ein Archiv kann darüber hinaus schnellere und stärker genutzte Online-Speichersysteme entlasten. Ältere Daten, die in den meisten Fällen nicht benötigt werden, werden oft auf Speichern abgelegt, die nicht die Geschwindigkeit in Verarbeitung und Transport haben müssen wie produktive Online-Speicher. Speichersysteme für Archive sind in der Regel auch günstiger, so dass auch hier die Möglichkeit besteht, Budget bei der Anschaffung einzusparen.

Archive werden meist basierend auf dem Alter der Daten erstellt oder darauf, ob das Projekt noch aktiv ist, zu dem die Daten gehören. Archivierungsprogramme können Daten an ein Archiv senden, falls seit einer bestimmten Zeit nicht mehr darauf zugegriffen wurde, wenn sie ein bestimmtes Alter erreicht haben, wenn die erstellende Person nicht mehr im Unternehmen ist oder die Dateien einfach zur Speicherung markiert wurden, weil ein übergeordnetes Projekt abgeschlossen ist.

Archive können auch mit Metadaten erstellt werden, die ein Projekt beschreiben. Ein Archivierungsprogramm kann relevante Metadaten automatisch hinzufügen. Daneben kann ein Benutzer Daten manuell kennzeichnen, um diese für einem späteren Abruf zu beschreiben und auffindbar zu machen. Solche Metadaten können Geschäftsinformationen sein, welche Daten beschreiben, oder zum Beispiel im Fall von Fotos und Videos die Ausrüstung, Kameraeinstellungen oder der Ort, an dem die Medien erstellt wurden. In manchen Systemen kommt Künstliche Intelligenz zur Anwendung, um Inhalte in einigen Daten wie Fotos und Videos zu identifizieren und zu katalogisieren. KI-Werkzeuge werden immer wichtiger, da immer mehr Daten ins Archiv wandern und die Anwender in der Lage sein müssen, sie anhand von Parametern zu finden, die zum Zeitpunkt der Archivierung der Daten möglicherweise noch nicht bekannt waren.

Was ist der Unterschied zwischen Wiederherstellen und Abrufen?

Im Allgemeinen stellen Backup-Systeme Daten wieder her und Archivierungssysteme rufen Daten ab. Die Werkzeuge, die zum Ausführen dieser Funktionen benötigt werden, sind unterschiedlich.

Wenn Daten aus einem Backup wiederherzustellen sind, handelt es sich meist um einzelne Dateien, einen Server oder strukturierte Daten wie eine Datenbank, die zu einem Zustand an einem bestimmten Zeitpunkt wiederhergestellt werden müssen. Der Anwender muss viel über diese Daten wissen, beispielsweise wo sie sich befanden, als sie gesichert wurden, in welcher Datenbank oder in welchem Ordner sie gespeichert waren, den Namen der Datei(en), wann diese gesichert wurden und so weiter.

Sollen Daten aus einem Archiv abgerufen werden, enthalten diese bestimmte Informationen wie Datum, einen E-Mail-Empfänger, einen Zeitraum oder andere Parametersätze, die bei einer Suche angegeben werden können. Typische Suchabfragen bestehen darin, alle Dateien zu erhalten, die sich auf einen Projektnamen beziehen, oder alle E-Mails, die von einer Person während eines bestimmten Zeitraums gesendet wurden.

Der Versuch, ein Backup als Archiv zu verwenden, kann zu Problemen führen. Es müsste genaue Aufzeichnungen darüber geben, wo und wann und auf welchem Medium die Dateien gesichert wurden, darüber hinaus zahllose andere Informationen, die zum Zeitpunkt der Sicherung festgehalten werden müssten. Backup-Systeme bewahren definitionsgemäß Kopien der aktuell verwendeten Daten auf. Die Aufbewahrung von Backups über einen längeren Zeitraum übersteigt die Möglichkeiten von Backup-Systemen und deren manuelle Verwaltung.

Ergebnis ist: Backups sollten nicht als Archiv verwendet werden. Backups bewahren zusätzliche Kopien der derzeit und vor kurzem verwendeten Daten auf, und dienen zur Wiederherstellung der Produktivumgebung, falls die dort vorhandenen Daten verfälscht oder gelöscht werden. Archive bewahren wichtige Daten dauerhaft auf, um sie bei Bedarf zur beispielsweise zur Klärung rechtlicher Fragen abrufen zu können.

Warum Sie sowohl Backup als auch Archiv benötigen

Hiermit ist nun klar, dass Backups und Archive unterschiedliche Verwendungszwecke haben. Aber – braucht man beides?

In Unternehmensumgebungen auf jeden Fall. Hier gilt es sicherzustellen, dass alle aktiven Geschäftsdaten vor versehentlichem Verlust oder böswilliger Manipulation geschützt sind. Daneben müssen alle wichtigen Aufzeichnungen und Dokumente so lange aufbewahrt werden, wie es aus geschäftlichen und rechtlichen Gründen erforderlich ist. Als Einzelperson oder kleines Unternehmen mit Dokumenten, Fotos, Videos und anderen Medien benötigt man beides, um sicherzustellen, dass die Daten sowohl kurz- als auch langfristig geschützt, verfügbar und abrufbar sind, wenn sie benötigt werden.

Die Auswahl der richtigen Werkzeuge und Dienstleistungen für Backup und Archivierung ist von entscheidender Bedeutung. Jede Lösung verfügt über einen Funktionsumfang, welcher sie für spezielle Aufgaben geeignet macht. Der Versuch, Backups für die Archivierung oder Archivierung für Backups zu verwenden, wovon abzuraten ist, muss am Ende scheitern. Es ist also wie immer: für jede Arbeit das passende Werkzeug.

Gruß
Doc Storage

Stellen Sie Ihre Frage
Doc. tec. Storage beantwortet alle Ihre technischen Fragen zu Storage, Backup & Co.

Stellen Sie Ihre Frage an: DocStorage@speicherguide.de
Kommentare (1)
11.02.2022 - jan

Lieber Doc,
als alter ADSM Administrator stimme ich zu 100% der Aussage zu, dass man sowohl (mindestens eine) Backupsystem als auch (i.d.R. genau ein) Archivsystem benötigt. Das heißt aber nicht, dass man zwei unterschiedliche Hard- und Softwaresysteme (Administratorgruppen) dafür braucht....
Zudem finde ich die Vorstellung, dass in einem Archiv nur systemunabhängige "archivierbare" Daten Platz finden können - sehr löblich (ich habe das früher auch mit Vehemenz vertreten) aber in der Praxis kaum durchhaltbar.
In der innerbetrieblichen Praxis - ist das so, dass größere Projekte, deren Verfolgung eingestellt wurde - dann mit Ihren binären Rohdaten in ein (dank ADSM, TSM, ISP) ~20 Jahre Speichermedien unabhängiges Archiv wandern, wohl wissend um den Aufwand bei der u.U. Jahrzehnte späteren Revitalisierung der Daten.
Zudem ist es i.d.R. so, dass Archive häufig nur "en block" gehandhabt werden können - wohingegen aus den Backups auch mal einzelne Files "gefischt" werden können.
Danke für den guten Artikel!