Ein sicheres und effizientes Backup- und Recovery-Konzept minimiert auch den Verwaltungsaufwand. IT-Abteilungen kämpfen zudem aber gegen einen steigenden Kostendruck an. Mittels Deduplizierung reduzieren Firmen nicht nur das Sicherungsvolumen, sondern optimieren auch die Datensicherungsstrategie.
Datensicherungen sollen immer schneller, flexibler und funktionaler werden, damit sie eine gute Basis für zügiges und reibungsloses Recovery bieten. Dafür reichen aber die traditionellen Methoden auf Bandmedien nicht mehr aus. Festplattensysteme sind somit nicht mehr aus den IT-Strategien auch mittelständischer Unternehmen wegzudenken. Diese sind als Ergänzung und Puffer zum dahinter gelagerten Bandsystem eine optimale Methode, Sicherungen zu beschleunigen, knappe Zeitfenster zu bedienen und eine sichere Backup-Strategie zu unterstützen.
»Es geht darum, Daten entsprechend ihrer Relevanz für den Unternehmenserfolg auf den kostengünstigsten Medien abzulegen und in akzeptabler Zeit wiederherzustellen«, sagt Udo Weitz, Business Manager StorageWorks Division bei Hewlett-Packard. »Dabei muss neuen Anforderungen mit intelligenten Lösungen begegnet werden. Auch gilt es Kostendruck und Verwaltungsaufwand zu dämpfen. Das ist mit Bandsystemen allein nicht mehr zu erreichen. Es zählen nun vor allem Funktionalität und Flexibilität, die sich durch den zusätzlichen Einsatz von Festplatten umsetzen lassen. Die Kombination von Disk und Band schafft eine solide Datensicherungsbasis.«
Um ein solches Konzept sinnvoll zu gestalten, bedarf es zunächst der Datenanalyse. Dabei geht es darum festzustellen, welche Informationen wann, wie, wie oft und auf welche Medien gespeichert werden sollen bzw. wie viel Zeit vergehen darf, bis die Daten wiederhergestellt sein müssen. Danach ist der IT-Verantwortliche in der Lage entsprechende Sicherungsszenarien umzusetzen, angefangen bei der ersten Vollsicherung bis hin zur Realisierung von hierarchisch gestuftem Speicher.
Backup/Recovery-Probleme und Anforderungen
Die Notwendigkeit neuer Datensicherungsansätze basiert auf den gestiegenen Ansprüchen im Backup-Umfeld. Dabei ist hier nicht nur die steigende Datenmenge zu nennen. Durch den Druck ständiger Datenverfügbarkeit ergeben sich zwangsläufig kleine Zeitfenster, in denen aber mehr Informationen als zuvor gesichert sein sollen. Bei den Restore-Vorgaben sieht es kaum anders aus. Ausfall oder Datenverlust kann sich kein Unternehmen leisten, deswegen sind die gewünschten Zeiten bei der Wiederherstellung auch knapp bemessen. Dazu kommt der ewige Kostendruck in der IT. Sicherung und Sicherheit sollen immer das optimale Kosten-Nutzen-Verhältnis aufweisen, was vom IT-Manager meist einen schwer zu realisierenden Spagat verlangt.
Zu den neuen Herausforderungen bei der Datensicherung zählen heute vermehrt virtuelle Umgebungen – die ein anderes Sicherungskonzept brauchen – sowie die Integration verteilter Standorte in ein zentrales Backup. Nicht zuletzt bringen auch neue Bandtechnologien für die Archivierung eine zusätzliche Problematik ein. Es gilt hohe Übertragungsraten zu bedienen, ohne die Server- oder Netzwerkinfrastruktur zu stark zu beeinträchtigen.
»All diese Faktoren zusammen zeigen die enorme Komplexität, die das Backup angenommen hat und mit der Administratoren und IT-Dienstleister umgehen müssen«, meint Weitz. »Natürlich sollen neue Lösungen zugleich hier eine Erleichterung schaffen. Damit landet der Speichersuchende zwangsläufig bei Disk-to-Disk. Die Systeme sind skalierbar, flexibel und lassen sich mit Funktionen wie Deduplizierung ausstatten. Damit sind sie prädestiniert für den Einsatz als Bindeglied zur Datensicherung auf Band.«
Funktionsvielfalt der Disk überzeugt
Der augenscheinlichste Vorteil von Disk-Backup ist die Möglichkeit, Daten im Online-Zugriff zu halten und für die Wiederherstellung schneller darauf zugreifen zu können. Zusätzlich bedient es die hohen Transferraten neuerer Bandtechnologien.
Warum Disk-Backup vorteilhafter ist, zeigt folgendes Beispiel: Um ein Bandlaufwerk aktueller Bauart am Streamen zu halten, ist Multiplexing zwingend erforderlich. Dies ist aber in der Praxis nicht im Direktanschluss realisierbar. Weil der Datendurchsatz variiert, kommt es hier meist zu Problemen. Schwierigkeiten beim Restore vom Band sind ebenso möglich. Mit Plattenspeichern in Form einer Virtual-Tape-Library (VTL) ergibt sich ein anderes Bild. Hier lässt sich ein virtuelles Tape-Drive abbilden, das kein Multiplexing benötigt. Die Variationen des Datendurchsatzes spielen keine Rolle mehr und auch die Performance beim Restore bleibt optimal. Zudem lässt sich das Kopieren von Platte auf Band sehr gut vorbereiten. Bei der Ablage auf Band kann ein gleichbleibender Datenstrom das Medium füttern. Inkonsistenzen oder Leistungsabfall bleiben aus. Ebenso nutzt der IT-Manager die vorgegebenen Backup-Fenster besser aus und muss keine zeitlichen Engpässe mehr fürchten. Kommt zusätzlich Deduplizierung zum Einsatz, ist auch bei Datenwachstum das Backup-Fenster auf längere Zeit kein Problemfaktor.
»Für eine effizientere Nutzung der Disksysteme benötigen Firmen Funktionen wie Deduplizierung, was die Datenmenge reduziert und gerade bei Replikation eine Verkürzung von Zeitfenstern und den Einsatz von Datenleitungen mit geringerer Bandbreite erlaubt«, sagt HP-Manager Weitz. »Dazu kommt natürlich noch der Preis. Außerdem wird die Integration von Zweigstellen ins Gesamt-Backup durch Deduplizierung erleichtert, das Management automatisiert und somit die Sicherheit wesentlich erhöht.«
Deduplizierung optimiert das Backup
Die Deduplizierung kann die Datensicherung eines Unternehmens noch effizienter gestalten. Dabei vergleicht entweder eine Hardware-Appliance oder ein Software-Algorithmus Datenblöcke auf identische, gespeicherte Kopien. Findet sich eine Übereinstimmung, wird nur ein Zeiger – ein Pointer – auf die originalen Daten angelegt. Redundanzen werden so eliminiert. Einsparungen von bis zu 20:1 lassen sich typischerweise in Perioden von bis zu drei Monaten erreichen. Allerdings ist die Technologie nicht in allen Umgebungen bzw. für alle Daten flächendeckend einsetzbar. Zunächst ist die Technik nur dort sinnvoll, wo auch wirklich doppelt oder mehrfach abgelegte Datensätze vorliegen. Des Weiteren eignet sich Deduplizierung nicht für seismische Daten, medizinische Bilddaten sowie für Datenreduzierung zwischen Applikationen verschiedenen Typs und auch nicht für Daten, die an der Quelle verschlüsselt wurden, bevor sie auf das Disk-Target gelangen. Ebenso lässt sich eine Datenbank mit 20 TByte Volumen nicht auf ein TByte Speicherplatz herunterdeduplizieren.
Sofern richtig eingesetzt, spart Deduplizierung aber Zeit, Mittel und Aufwand. Bei den Reduktionsraten lassen sich tatsächlich Faktoren von 10:1 bis 400:1 erreichen. Das hängt allerdings von der Art der Datenbestände und der Backup-Strategie ab. Entscheidend sind unter anderem die Anzahl der Vollsicherungen, die Aufbewahrungszeit der Backups, die Komprimierbarkeit der Daten sowie die Redundanzen und die Segmentgrößen der Daten.
Deduplizierungsbeispiel
Das folgende Beispiel zeigt, was wirklich machbar ist. Ein Unternehmen unternimmt jeden Tag ein Voll-Backup seiner Informationen, die 200 GByte umfassen. Dabei werden üblicherweise auch alle Daten gesichert, die bereits am Vortag vorhanden waren. Mit der Dedup-Technik sähe die Datensicherung wie folgt aus: Am ersten Tag erfolgt die Vollsicherung von 200 GByte. Am zweiten Tag überprüft die Deduplizierungslösung alle Daten und sichert nur fünf GByte nicht redundanter Daten im Vergleich zum Vortag. Bei einem gleich bleibenden Änderungsvolumen von fünf GByte entsteht schon am fünften Tag eine Dedup-Rate von 4,55:1, da die Sicherung nur 220 GByte Speicherplatz benötigt und nicht ein TByte, wie es die übliche Vollsicherung nach fünf Tagen in Anspruch nähme.
»Die Deduplizierungsrate ist aber längst nicht alles, was diese Technologie ausmacht«, weiß HP-Manager Weitz. »Vielmehr ist sie die Schlüsseltechnologie für effiziente Backup-Strategien. Mit ihr lassen sich beispielsweise Remote-Replikation und Remote-Office-Backup umsetzen. Auf den Festplatten lassen sich Backup-Daten eines längeren Zeitraums bei gleicher Speicherkapazität aufbewahren, schneller wiederherstellen und rascher an andere Standorte übertragen. Nicht zuletzt kann der EDV-Verantwortliche seine Bandkopien optimal vorbereiten und realisieren.«
Deduplizierung in der Praxis
Eine Problemstellung kennen vor allem Unternehmen mit Außenstellen. Hier gilt es dafür zu sorgen, dass ein zügiges und reibungsloses Disaster-Recovery erfolgen kann – ebenso wie in der Zentrale. Traditionelle Backups sehen meist so aus, dass in den Außenstellen die Informationen zunächst auf Platte und dann auf Band gesichert werden. Meist passiert die Erstellung der Bänder in der Nacht, damit der Produktionsprozess keine Unterbrechung nerfuhr. Die Bandkassetten lagert das Unternehmen meist nicht vor Ort, sondern an einem zentralen Platz. Dies muss aber zusätzlich administriert werden und verursacht weitere Kosten. Während eines Ausfalls dauert es lange, eine Wiederherstellung umzusetzen. Bänder müssen geortet, angeliefert und einzeln zurückgespielt werden. Hier erreicht Deduplizierung einen hohen Optimierungsgrad.
Installiert man in den Außenstellen Deduplizierung, so lässt sich im ersten Schritt der vorhandene Speicherplatz um ein Vielfaches länger nutzen. Das hängt von der jeweils auftretenden Reduzierungsrate ab. Darüber hinaus entfallen die dezentralen Bandsicherungen und manuellen Eingriffe. Vielmehr kann der IT-Manager die Sicherung nun so einrichten, dass nach einer ersten Vollsicherung automatisch nur noch die deduplizierten Daten über das WAN an die Zentrale fließen. Das führt auch bei einer eventuell anfallenden Wiederherstellung zu einer enormen Zeitersparnis, da sie sich zentral und zügig steuern lässt. D2D-Systeme automatisieren die Sicherungsprozesse in Außenstellen nicht nur, sondern nutzen die Zeitfenster optimal aus.
»Wir sehen, dass neben der Sicherung virtueller Welten gerade die Einbindung von Zweigstellen in die zentrale Datensicherung ein wichtiger Punkt für den Mittelstand ist«, bestätigt Weitz. »Unsere Serie D2D Backup-Systeme mit der von uns entwickelten Deduplizierungs-Software `StoreOnce´ sind für diese Anforderungen konzipiert. Bei der Entwicklung achteten wir auf eine möglichst einfache Implementierung und Skalierbarkeit sowie auf die Automatisierung und Verschlankung einst manueller und komplexer Abläufe. Das sichert nicht nur die Datenverfügbarkeit des Gesamtunternehmens, sondern eben auch seine Geschäftstüchtigkeit.«
Kommentare:
Kommentar schreiben
Meine Anerkennung zum hohen Data Protection Sachverstand von Herrn Weitz. Ich stimme Herrn Weitz bei den meisten der vorgebrachten Argumente zu, will aber doch ein paar (aus meiner Sicht wichtige) Aspekte ansprechen.
Bei Anwendung von Deduplicaton am DP target sollte man bedenken, dass bei B2D eine Umstellung von vielen auf wenig Fullbackups (verbunden mit entsprechend mehr Incremental Backups) praktisch immer sinnvoll ist. Daraus ergibt sich dann allerdings zwangsläufig, dass wesentlich geringere nominale Dedupe-Ratios die Folge sind (ich sehe hier bisher 3:1 bis ca. 7:1 als typisch). Compression-only ist dann oft eine gute Alternative zu Deduplication.
Aber noch viel wichtiger ist, dass die Hauptproblematik beim Backup und Restore meist bei der (immer weiter sinkenden) Primär-Storage-System Speed liegt (hier stören sich zu viele parallele DP- und Online-Prozesse beim Disk-Zugriff).
Diese Problematik sehe ich nur bei Anwendung von Snapshot-based Data Protection vollständig gelöst. Dafür bietet NetApp heute schon folgende Funktionalitäten (aber auch andere Storage-Hersteller immer mehr):
- Hunderte von differential Snapshots ohne Performanceeinbrüche am Primär-Storage,
- Extrem schnelle lokale Restores durch simple Pointer-Änderung,
- Block-Level-Incremental-Forever Replikationen zum Sekundärstorage
- Dedupe/Compression Effizienz schon ab dem Primär-Storage
- Ein Sekundärspeicher-Datenformat, welches Disaster-Ready ist (man kann
ohne Umspeichern der Daten bei DR mit diesen Systemen weiter arbeiten).
- Eine NDMP-Engine, welche physical Tapes direkt vom Speicher aus
ansprechen kann.
Auch das Thema „Remote Office Backup“ ist damit sehr effizient gelöst.
Ich empfehle daher Snapshot-basierte DP Techniken anzuwenden, wo es nur geht. Für den Rest stellen allerdings DP-Storage-Appliances (mit Deduplication oder Compression only) – oft kombiniert mit physical Tape – eine sinnvolle Ergänzung dar.