Wie berechnen sich Speicherkosten?
Leserfrage: Als im Januar die Internetplattform Megaupload geschlossen wurde, hat der zuständige Provider Carphatio Hosting einen Antrag gestellt, um sich gegen die anfallenden Kosten der Datenspeicherung abzusichern. Berichten zufolge umfasst das Beweismaterials ein Datenvolumen von 25 PByte und die Speicherung verschlingt rund 6.800 Euro pro Tag. Sind diese Kosten realistisch und wie könnten sich diese aufschlüsseln?
Antwort Doc Storage:
Die Kosten für Speicherplatz setzen sich – wie immer im Rechenzentrumsbetrieb – aus weichen und harten Faktoren zusammen. Da wäre zunächst die Anschaffung der Arrays, auf denen die Daten gespeichert werden. Hier kann sich der Preis in einer weiten Schere befinden. Verwendet man die derzeit billigsten Platten (3 TByte, 3,5 Zoll) und relativ große RAID-Gruppen (RAID 6 mit 14+2 Laufwerken), so benötigt man für die rund 28,6 PByte brutto 9.524 Laufwerke. Unter Verwendung der größten momentan verfügbaren Arrays (z.B. HDS »VSP« oder EMC »Symmetrix«) mit ihren 2.400 Laufwerken hieße das, dass die IT schon einmal vier dieser Systeme exklusiv für die Speicherung dieser Daten bereitstellen muss. Jedes System kostet – ohne weiterführende Software – rund 750.000 Euro, macht also 3 Mio. Euro allein für die Hardware.
Sollen die Daten allerdings nur etwas Leistung bereitstellen, so muss der Betreiber schnellere Laufwerke (z.B. 600 GByte SAS) und kleinere RAID-Gruppen (RAID 5 mit 7+1 Laufwerken) bereitstellen. Das sind für 32,7 PByte brutto schon 54.476 Laufwerke, verteilt auf 23 Arrays mit jeweils 2.400 Festplatten. Weil die Platten an sich teurer sind, kann man hier mit einem Systempreis von ca. 900.000 Euro rechnen, insgesamt also schon einmal 20,7 Mio. Euro für die Anschaffung. Der Grundpreis liegt also zwischen 3 und 20,7 Mio. Euro. Werden die Systeme wie üblich über drei Jahre abgeschrieben, bedeutet dies einen täglichen Grundpreis von zwischen 2.740 und 18.904 Euro. Bei fünf Jahren liegen wir hier – ohne Wartung und Ersatzteile – bei zwischen 1.644 und 11.342 Euro.
Nun kommen wir zum Betrieb, also zur aufgenommenen Leistung und der zu kühlenden Luft. Hier liegen alle heute verwendeten Systeme bei gleicher Anzahl von Festplatten in einem Korridor von +/- 5 Prozent. Nehmen wir also die langsamste Konfiguration (vier Systeme mit zusammen 9.524 3-TByte-HDDs), nimmt diese schon im Standardbetrieb zirka 320 kVA auf. Rechnen wir mit einem gut verhandelten Preis von rund 15 Cent pro kWh, ergibt dies pro Stunde 48 Euro, also 1.152 Euro pro Tag. In der schnellsten Konfiguration (54.476 Laufwerke in 23 Arrays) müssen schon rund 1.800 kVA am Laufen gehalten werden, bei 15 Cent pro kWh also 270 Euro in der Stunde oder 6.480 Euro am Tag. Die Kühlung wird meist für die Gesamtaufnahme des Rechenzentrums berechnet und kann somit nur näherungsweise auf die einzelnen Systeme heruntergebrochen werden. Als Daumenwert liegen die Kosten hierfür bei zirka einem Drittel der Stromversorgung, also bei zwischen 384 und 2.160 Euro pro Tag. Insgesamt müssen also für den Betrieb der Arrays zwischen 1.536 und 8.640 Euro eingerechnet werden.
Zusammen also schon einmal täglich zwischen 3.180 und 27.544 Euro. Nicht hinzugerechnet habe ich hier den Betrieb des SANs und der zur Bearbeitung der Daten notwendigen Rechner. Ebenso nicht berücksichtigt sind die Kosten für das betreuende Personal und den allgemeinen Betrieb des Rechenzentrums (also z.B. Leitstand, Zugangskontrollen, Brandschutz usw.). Dies sind für die meisten Rechenzentren »eh da«-Kosten, die Leute und Einrichtungen sind sowieso vor Ort und werden in den meisten Fällen in solche Kalkulationen nicht einbezogen. Weiterhin nicht berücksichtigt habe ich die notwendige Software zur Überwachung, Einrichtung und Verwaltung der Arrays. Auch diese erhöht die täglichen Kosten nochmals um einige Prozent.
Die Angabe von 6.800 Euro täglicher Kosten für den Betrieb von 25 PByte Daten liegt also nach meinen Berechnungen am weitaus unteren Ende der Skala. Entweder hat der Betreiber sich entschlossen, die Arrays bis zur weiteren Klärung der Rechtslage abzuschalten und spart sich damit außer den Anschaffungs- jegliche anderen Kosten, oder aber er hat die Daten auf alte, bereits abgeschriebene oder extrem preiswerte Systeme verschoben. Auf jeden Fall ist diese Angabe mehr als glaubwürdig.
Gruß
Doc Storage