Verfügbarkeiten komplexer IT-Systeme
Die Begriffe Hochverfügbarkeit und Disaster Recovery werden oftmals miteinander vermengt. Doch der IT-Verantwortliche sollte hier gut unterscheiden. Denn das Thema Hochverfügbarkeit kann man sich nicht allein über technische Aspekte erschließen. Es gilt immer die Faktoren »Mensch« und »Prozesse« – sprich die zugehörigen Arbeitsabläufe – mit einzubeziehen – und daraus entstehen dann sehr komplexe Systeme.
Eine gängige Definition der Hochverfügbarkeit umfasst Systeme, die so entworfen wurden, dass sie einen bestimmten Grad von Verfügbarkeit – also ungestörte Betriebszeit – für eine gewisse Zeitspanne aufweisen. In dieser Betriebszeit müssen die Anwender den Zugriff auf die Systeme haben und sie auch korrekt nutzen können. Wer sich diese Definition zu Eigen macht, muss aber bei der Verkettung von einzelnen Komponenten große Sorgfalt anwenden, denn sonst kann er eventuell nicht alle Aspekte sauber abdecken. Generell reihen sich in der IT-Kette die folgenden Komponenten auf:
- Server,
- Speichersysteme,
- die Daten,
- die Applikationen,
- das Netzwerk,
- die Wartung,
- die Überwachung und
- die eigentlichen Konfigurationen.
Hier zeigt schon ein übliches Beispiel, wie umfassend diese Forderung zu gelten hat: Wer für seine Mail- oder Datenbank-Infrastruktur lediglich eine Cluster-Konfiguration für die betreffenden Server einsetzt, der wird seine Verfügbarkeitsanforderungen oder -Probleme nicht komplett lösen können. Denn der Ausfall der Netzwerkinfrastruktur oder aber schlecht aufgesetzte Wartungsabläufe können den Ausfall des Komplettsystems zur Folge haben.
Gesamtsicht ist wichtig
Daher lässt sich schon gut erkennen, dass einzelne Aktionen nicht zu einer hohen Verfügbarkeit führen. Gibt ein Unternehmen vor, dass eine bestimmte Applikation mit einer prozentual vorgegebenen Verfügbarkeit zu laufen hat, muss eine ganze Reihe von Komponenten hochverfügbar sein: Der (oder meistens die) Server, die Datenbanken, die Applikation und der Speicherbereich sowie die Netzwerkverbindungen.
Nun ist unter Umständen für jede dieser Komponenten ein anderer Hochverfügbarkeitsansatz nötig. Und diese einzelnen Konzepte müssen sich zu einem adäquaten Gesamtbild zusammenfügen lassen. Erst dann ist man in der Lage, das Gesamtkonstrukt so konfigurieren, dass letztendlich Hochverfügbarkeit für den kompletten Dienst erzielt wird.
Betrachtet man die Aufgabe detaillierter, müssen drei wesentliche Dinge passen:
- Die passende Technologie muss zum Einsatz kommen,
- das Wissen und die Motivation der betreibenden Personen müssen stimmen, und
- die nötigen Vorgehensweisen müssen definiert sein.
Denn nur so lässt sich garantieren, dass die Verwaltungsaufgaben für die Systeme im Einklang zur Hochverfügbarkeits-Anforderung stehen und sie nicht konterkarieren. Genau betrachtet sind diese drei Rahmenbedingungen immer für ein sauberes Hochverfügbarkeits-Design nötig.
Zahlen zur Verfügbarkeitsberechnung
Will man die Verfügbarkeit in Zahlen fassen, kommen zwei wichtige Größen ins Spiel: Die MTBF (Mean Time Between Failure) und die MTTR (Mean Time To Repair). Die mathematischen Zusammenhänge verdeutlicht Abbildung 1. Dabei finden auch die Begriffe Verfügbarkeit (Availability, abgekürzt: A) und Nichtverfügbarkeit (Unavailability, abgekürzt U) Verwendung.
Für den Umgang mit einfachen Komponenten – wie Magnetband- oder Festplattenlaufwerke – ist dieser Ansatz auch sofort zielführend. Doch wenn es – wie bereits ausgeführt – um ganze Ketten von Komponenten geht, kann das schnell schwierig werden. Denn alle Glieder in dieser Kette müssen dazu beitragen, dass die gewünschte Verfügbarkeit erreicht wird. Hier kommen dann die Reihenschaltung oder Parallelschaltung der einzelnen Komponenten ins Spiel (siehe Abbildung 3).
Mit diesen Berechnungsmethoden lassen sich dann die Verfügbarkeiten für komplexere System errechnen, wenn die Werte für die einzelnen Komponenten vorliegen und – ganz wichtig – die Komponenten nicht voneinander technisch abhängig sind.