Zentraler Erfolgsfaktor der Datensicherung
Die Software-Architektur einer Datensicherung beeinflusst die Skalierbarkeit, Stabilität, Geschwindigkeit und Datenverfügbarkeit. Je nach Gewichtung dieser Faktoren kann sie für den erfolgreichen Einsatz wichtiger als die konkreten Funktionen sein.
Von Stefan Utzinger, Novastor Software
Im Gegensatz zu einfachen Kopien erfolgen Datensicherungen in einem eigenen Format und werden vom Sicherungssystem indexiert. Diese Index- und Metadaten benötigt das System für das Auffinden und Wiederherstellen gesicherter Daten. Doch selbst marktführende Datensicherungslösungen speichern die Index- und Metadaten in einer zentralen Datenbank, deren Verfügbarkeit damit zum erfolgskritischen Faktor wird.
Redundanz erzeugt höhere Datenverfügbarkeit
Eine verteilte Systemarchitektur nutzt mehrere Komponenten für die Ablage der Index- und Metadaten. NovaStors Datensicherung für Rechenzentren verteilt Metadaten beispielsweise auf den Client, das Medium und die zentrale Verwaltung. In dieser Architektur verfügen die Clients über Angaben zu Ziel, Ort und Zeitpunkt ihrer Backups sowie über eine Namensliste ihrer gesicherten Dokumente.
Aufgrund der lokal abgelegten Indexdaten können die Clients eine aktive Rolle übernehmen und Restores allein mit den Indexdaten auf dem Client und dem Speichermedium an einem Laufwerk durchführen. Auch mit den Metadaten auf dem Speichermedium oder in der Datenbank des Central Managements können Restores durchgeführt werden. Die Verfügbarkeit der gesicherten Daten bleibt bei diesem Systemaufbau auch gewährleistet, wenn die zentrale Datenbank nicht verfügbar ist.
Datenverteilung steigert Stabilität
Abhängig davon, welche Art von Daten gesichert und welche Sicherungsstrategien eingesetzt werden, steigt die Belastung der zentralen Datenbank. Und ist die Datenbank voll, steht das System. Weder Sicherungen noch Wiederherstellungen sind möglich. Der Aufwand für die erneute Inbetriebnahme geht bei der großen Mehrzahl der Installationen aufgrund ihrer Komplexität weit über einen einfachen Neustart hinaus.
Um die Auslastung der Speichermedien gering zu halten, aber auch um einen solchen Stillstand zu vermeiden, bieten professionelle Systeme die Option, Daten bei jeder Sicherung vollständig, inkrementell oder differentiell zu sichern. Auch Funktionen wie Deduplizierung sollen die Menge der zusichernden Daten reduzieren.
Deduplizierung hat jedoch aufgrund des Einsatzes von Platzhaltern und Verweisen einen deutlichen Anstieg der Komplexität des Datenbestandes zur Folge. Einerseits muss auch ein Verweis gesichert werden, andererseits müssen das Verhältnis von Original und Verweis zuverlässig verwaltet werden. Es entsteht ein für Fehler anfälliges Netz aus zusätzlichen Metadaten, das die Stabilität gefährdet. Die Metadaten für die Deduplizierung sollten daher getrennt von den Metadaten der Datensicherung gehalten werden.
Im Sinne eines möglichst fehlertoleranten Betriebes wäre daher eine Beschränkung der Datensicherung auf ihre Kernfunktion zu empfehlen. Die Deduplizierung sollte von einer von der Datensicherung unabhängigen Anwendung durchgeführt werden. Denn mit oder ohne Deduplizierung sorgen die massiv steigenden Datenmengen für höhere Anforderungen an Stabilität, Datendurchsatz und Geschwindigkeit einer Datensicherung.
Die verteilte Architektur erhöht die Stabilität des Systems, indem sie die Menge der zentral abgelegten Daten unabhängig von der Sicherungsstrategie senkt und damit die Fehleranfälligkeit der Datenbank reduziert.
Aktive Clients steigern Skalierbarkeit
Das Konzept aktiver Clients erlaubt den Ausbau der zu sichernden IT-Infrastruktur, ohne die Datensicherungsinfrastruktur im gleichen Maße nachrüsten zu müssen. Da die Clients in dieser Architektur die Indexdaten lokal vorhalten, steigt bei hinzukommenden Clients die Menge der zentral abgelegten Daten weit langsamer als bei Systemen, die Client-Daten zwar sichern, ihnen aber keine aktive Funktion übertragen.
Höhere Geschwindigkeit und Datendurchsatz
Im Gegensatz zu den Clients, die aktiv Indexdaten speichern und einen Restore vom Speichermedium durchführen können, übernehmen die Server in der verteilten Systemarchitektur eine passive Rolle. Diese »small footprint«-Server führen nur die Vorgaben des Client aus.
Die reduzierte Nutzung der Server hält die Server-Auslastung konstant – unabhängig davon, welche Datenmenge insgesamt vom Client zum Speichermedium bewegt wird. Der Client schreibt die zu sichernden Daten – ohne Umweg über den Backup-Server – direkt auf das Speichermedium.
Diese Art des Backup ohne aktive Nutzung der Server erhöht Backup-Geschwindigkeit und Ausfallsicherheit. »NovaBACKUP DataCenter« verteilt mit einem optimierten Kompressionsverfahren zudem die Rechenlast auf Client und Speichermedium, so dass beide Ressourcen nur geringfügig belastet werden.
Einsatzgebiete, die eine verteilte Systemarchitektur erfordern
1. Große Dateimenge
Nicht alle Daten sind gleich. Wenige große Dateien führen zu anderen Herausforderungen als viele kleine Dateien. Letzterer Fall wirkt sich besonders unvorteilhaft für Systeme aus, die sämtliche Index- und Metadaten zentral abspeichern. Muss ein Unternehmen viele einzelne Dateien sichern, wie zum Beispiel der zentrale IT- und Service-Dienstleister der deutschen Musikindustrie, PHONONET, mit 29 Millionen Dateien, kann die verteilte Systemarchitektur zum zentralen Erfolgsfaktor werden.
2. Große Datenmengen und kurze Backup-Fenster
Jede Datensicherung belastet die Arbeitsspeicher und reduziert so die für Produktivanwendungen verfügbare Kapazität. Aus diesem Grund finden Sicherungen außerhalb der produktiven Arbeitszeit statt. Ist die Menge der zu sichernden Daten jedoch extrem groß, können begrenzte Backup-Fenster zum Problem werden, das der Einsatz einer verteilten Systemarchitektur löst. Die erfolgskritische Bedeutung der Backup-Geschwindigkeit nimmt daher mit steigender Datenmenge zu.
3. Geringe Ressourcen in der Administration
IT-Administratoren übernehmen umfangreiche und vielfältige Aufgaben. Die Absicherung der Datenverfügbarkeit gehört dazu, darf aber im regulären Betrieb keinen oder nur sehr geringen Aufwand benötigen. Stabilität und Fehlertoleranz der eingesetzten Datensicherung sollten gegeben sein, damit die Datensicherung im Regelbetrieb keinen Arbeitsaufwand erfordert.
Fazit: Besser verteilen
Wer eine Datensicherung evaluiert oder sich fragt, woran die Probleme mit der aktuellen Datensicherung liegen, sollte nicht nur auf Funktionen sehen. Stabilität, Geschwindigkeit und Skalierbarkeit werden mit zunehmendem Funktionsumfang gefährdet.
Gleichzeitig beeinflusst die grundsätzliche Software-Architektur das Verhalten einer Datensicherung maßgeblich, wird in den Funktionsübersichten jedoch meist nicht ausgewiesen. Die Architektur in die Evaluation und Fehleranalyse für ein bestimmtes System einzubeziehen, kann also ausschlaggebend für den reibungslosen Betrieb sein. In jedem Fall kann eine Beurteilung der grundsätzlichen Qualitäten einer Datensicherung nicht ohne Einbeziehung der Software-Architektur erfolgen.
Novastor Software AG
Neumann-Reichardt-Str. 27-33 (Haus 11), 22041 Hamburg
Tel.: + 49 (0) 40 - 63 80 90, Fax: + 49 (0) 40 - 638 09 29
E-Mail: salesteam@novastor.com
Weitere Informationen zu Novabackup Datacenter.
