20.01.2012 (Doc Storage) Drucken
(3.4 von 5)

Wie funktioniert Big Data bei Facebook, Google & Co?

Leserfrage: Dass die Datenexplosion alle Unternehmen mehr oder weniger trifft, liest man allenthalben. Aber bei Unternehmen wie Facebook, Google, Youtube und Co. muss die Big-Data-Welle ja immens sein. Haben Sie einen Einblick, welche Speichersysteme bzw. Filesysteme dort installiert sind? Dort fallen vermutlich jeden Tag hunderte von Festplatten aus – welche Backup- oder Disaster-Recovery-Strategien lassen sich dort überhaupt verfolgen?

Antwort Doc Storage:

Die großen Internet-Plattformen arbeiten fast durchgängig nicht mit großen, zentralen Systemen, sondern im Gegenteil mit möglichst kleinen, zahlreichen und verteilten Einheiten. Damit lassen sich wesentlich einfacher Ressourcen hinzufügen und ersetzen, bei tausenden Rechnern und Speichersystemen mit systemübergreifend replizierten Daten fällt ein möglicher Hardware-Fehler kaum oder gar nicht auf.

Die meisten Plattformen arbeiten somit mit x86-Rechnern auf Blade-Basis, Linux-Betriebssystemen und Midrange-Speichern mit NAS- oder Objektspeicheranbindung. Auf den Speichern werden Dateisysteme mit großen Namensräumen oder eben gleich Objekte abgelegt, um die unüberschaubare Anzahl an Dateien speichern zu können. Eine Sicherung findet aufgrund der riesigen Anzahl sich ständig ändernder Informationen zumeist nur über Replikation in einen oder mehrere andere Standorte statt. Damit entfällt sowohl der Bedarf nach Rücksicherung als auch die Abhängigkeit von der Funktionsfähigkeit einzelner Niederlassungen. Ein netter Nebeneffekt ist, dass Daten schneller und über mehr Kanäle gelesen werden können, je mehr Kopien von ihnen an unterschiedlichen Orten gespeichert sind.

Gruß
Doc Storage

Stellen Sie Ihre Frage
Doc. tec. Storage beantwortet alle Ihre technischen Fragen zu Storage, Backup & Co.

Stellen Sie Ihre Frage an: DocStorage@speicherguide.de
Kommentare:
20.01.2012 - justbond

Was mir jetzt noch fehlt: Machen denn diese Google, Facebook & Co kein Backup auf Bänder? Auch diese Firmen unterliegen doch Compliance-Richtlinien. Die lassen doch nicht bis zu 10 Jahre alte Daten ständig auf Festplatten rotieren. Oder doch?


Kommentar schreiben


Doc. tec. Storage Archiv 18.05.2012 Was ist das Fraunhofer File-System FhGFS?

NFS, CIFS, zFS, GPFS – es gibt zahlreiche File-Systeme, mit denen Speichersysteme sich im Netzwerk unterhalten. Jetzt ist ein weiteres hinzugekommen und es kommt aus keiner geringeren Quelle denn vom Fraunhofer Institut selbst. Da stellt sich die Frage, wie es sich von anderen unterscheidet, was es bringt und wer es nutzen soll.

11.05.2012 Wie berechnen sich Speicherkosten?

Das Speichern vieler Daten hat seinen Preis. Die Schließung der Internetplattform Megaupload ist hier ein gutes Beispiel: Das Beweismaterials umfasst ein Datenvolumen von 25 PByte und die Speicherung verschlingt rund 6.800 Euro pro Tag. Wie schlüsseln sich diese Kosten auf?

04.05.2012 BYOD – schön und gut, aber wo bleiben die Tools?

Der Gedanke, dass Anwender ihre eigenen mobilen Geräte nutzen ist für Unternehmen verlockend. Für die IT-Abteilungen ist das so genannte BYOD jedoch eine Zumutung. Während es für RIM Blackberry vernünftige Verwaltungs-Tools gibt, sucht man diese bei Apple, Android und Co vergebens. Oder?

27.04.2012 Sind Sonnenstürme eine Bedrohung für Daten und IT?

Aktuell taucht das Thema »Sonnensturm« gehäuft auf. Stellt dies eine Bedrohung für IT-Systeme und Daten dar? Wie sollen kleine Unternehmen und Privatperson ihre Speicher- und Backup-Systeme gegen Sonnenstürme bzw. starke elektromagnetische schützen. Gibt es hier erschwingliche Produkte?

20.04.2012 Cloud-Storage – Wo bleibt das Storage-Management?

Die Bandbreite der Cloud-Storage-Provider reicht vom kostenlosen Dropbox bis zum sündteuren Nirvanix. Bei Nirvanix gibt es ein vernünftiges Storage-Management, das allerdings vorerst nur für Enterprise-Organisationen konzipiert ist. Zeichnen sich Storage-Management-Lösungen ab, die auch für KMUs bezahlbar sind?

13.04.2012 Welchen Mehrwert bietet IBMs neue Puresystems-Familie?

IBM stellt mit »PureSystems« eine integrierte Lösung für Rechner, Netzwerk und Speicher vor. Ähnlichkeiten zum »vBlock« von VCE und Netapps »FlexPod« sind unverkennbar. Wo sind die Gemeinsamkeiten mit den bisherigen Angeboten, wo gibt es Unterschiede?

05.04.2012 Gibt es Unterschiede bei Daten-Reduktionstechniken?

Wer seine Speichersysteme besser ausnutzen will, kann Reduktionstechniken einsetzen. Deduplizierung hat sich etabliert und ist bekannt. Nun gehen aber zahlreiche Unternehmen mit Kompression oder Intelligent Data Replacement hausieren. Gibt es hier Unterschiede und wenn ja, wo liegen diese?

30.03.2012 Mainframes – ein Glaubenskrieg?

Mainframes sind ein immer junges Streit«-Thema. Auf der einen Seite verbietet sich ein Vergleich mit der Client-Server-Welt. Auf der anderen ist eine Gegenüberstellung unvermeidlich. So entfachte der Doc-Storage-Beitrag »Sind Big Data und Cloud das Ende von Mainframes?« sofort weiteren Gesprächsbedarf.

23.03.2012 Bootstorm – was nun?

Vor allem beim morgendlichen Start vieler virtuelle Arbeitsplätze geht die Performance stark in die Knie. Dies nennt sich Bootstorm. Abhelfen würden viele neue SSDs im Storage-System, die sind aber teuer. Geht es nicht auch anders?

16.03.2012 Was ist HANA und hat es Einfluss auf den Speicher?

SAP hat eine In-Memory-Lösung für seine Datenbank entwickelt, was offensichtlich auch Auswirkungen auf Speicherumgebungen hat. Was genau ist HANA? Werden sich die Speicherlandschaften aufgrund dieser Technologie ändern und muss Oracle hier nachziehen?

powered by
FTS FTS
HDS N-TEC
Quantum TIM