23.10.2015 (Doc Storage)
3.8 von 5, (4 Bewertungen)

Was sind »Data Lakes«?

Leserfrage: Was sind »Data Lakes« und welchen Zweck erfüllen sie?

Antwort Doc Storage:

Der Ausdruck Data-Lake wird James Dixon zugeschrieben, dem Chef der Firma Pentaho. Er umschreibt ihn so: »Stellen Sie sich einen Datenspeicher als einen Stapel aus Kisten mit Mineralwasser vor – gereinigt und zum einfachen strukturierten Verbrauch verpackt. Im Gegensatz dazu ist ein Data-Lake ein großer See aus Wasser in seiner natürlicheren Form. Die Inhalte des Data-Lakes strömen aus einer oder mehreren Quellen in diesen See, und verschiedene Nutzer können sich seinen Inhalt anschauen, in ihn eintauchen oder Proben entnehmen.«

In der Praxis bedeutet dies, dass ein Data Lake einen riesigen, einfach zu erreichenden Speicher aus preiswerten Komponenten darstellt, in dem ungeordnete Datenmenge beliebiger Größe (also Big Data) gespeichert werden können. Im Gegensatz zu bisherigen, eher analytischen Lösungen in diesem Segment, die lediglich einige Attribute der Informationen zusammenfassen und die eigentlichen Daten in nachgeschalteten Speichern halten, ist ein Data-Lake dazu vorgesehen, sämtliche Informationen auf derselben Ebene zu speichern. Dies kann man beispielsweise deshalb tun, weil man die eigentliche Verwendung oder die Art der Auswertung der Daten noch nicht oder noch nicht vollständig kennt und deshalb eine Ordnung noch nicht vornehmen kann.

Im Ende ist ein Data Lake also die Gesamtheit aller in einem Zusammenhang verfügbaren Daten, bevor sie durch Prozesse oder Auswahlkriterien in irgendeine weiter nutzbare Ordnung gebracht wurden. Unter dieser Prämisse sind Data Lakes einfacher aufzubauen, müssen keine oder kaum Ansprüche an Leistungsfähigkeit erfüllen und sind damit wesentlich preiswerter als herkömmliche, bereits spezialisierte und leistungsfähige Big-Data-Installationen.

Gruß
Doc Storage


Stellen Sie Ihre Frage
Doc. tec. Storage beantwortet alle Ihre technischen Fragen zu Storage, Backup & Co.

Stellen Sie Ihre Frage an: DocStorage@speicherguide.de

Mehr von Doc. tec. Storage 02.08.2019 Soft-/Hardware: Wie Daten richtig verschlüsseln?

Eine Software-Verschlüsselung soll weniger Probleme verursachen, als eine Hardware-Verschlüsselung. Stimmt das? Was passiert, wenn der gewählte Verschlüsselungsanbieter nicht mehr verfügbar ist, wie kommt man dann an seine Daten?


12.07.2019 Analysten-Prognosen sind verschwendete Lebenszeit

Diesmal nimmt sich Doc Storage die Trendvorhersagen von Marktforschern vor. Seiner Ansicht nach ist vieles nur ein Blick in die Glaskugel, anderes dagegen so offensichtlich, dass es keine weitere Betrachtung benötige. Er hält diese Art von Info für verschwendete Lebenszeit.


28.06.2019 DSGVO bleibt aus DV-Sicht ein unsägliches Thema

Kolumne: Unser Doc Storage ist kein Freund der DSGVO. Dies hat er in mehreren Kolumnen klar formuliert. In seinem zweiten Teil zu »Ein Jahr DSGVO« fasst er nochmal zusammen, warum die Thematik aus seiner DV-Sicht für Firmen unsäglich ist.


14.06.2019 Ein Jahr DSGVO: Aufwand unerträglich hoch

Kolumne: Zur Einführung der DSGVO hat Doc Storage mächtig Dampf abgelassen. Ein Jahr später lässt kaum ein Verband ein gutes Haar an der Datenschutz-Grundverordnung. Der Aufwand für Firmen und IT-Abteilungen sei unerträglich hoch.


07.06.2019 Welchen Flash für welche Anwendung?

Vor rund sechs Jahren schickten sich Flash-Speicher an, sich in Computern und Storage-Systemen zu etablieren. Damals galten die Lösungen aber noch als proprietär. Wo steht die Technik heute und welcher Flash eignet sich für welchen Einsatzzweck?


17.05.2019 NAS-Caching oder Tiering für VMs multiple Zugriffe?

In einer Lehrumgebung werden virtuellen Maschinen auf einem NAS mit 10GbE-Anbindung gespeichert. Nachdem eine Erweiterung mit NVMe-Flash ansteht, stellt sich die Frage, ob eine Caching- oder eine Tiering-Konfiguration die sinnvollere Wahl ist?

powered by
Boston Server & Storage Solutions Itiso GmbH
Fujitsu Technology Solutions GmbH Infortrend
N-TEC GmbH FAST LTA AG
Datacore Software Seagate Technology
Folgen Sie speicherguide.de auch auf unseren Social-Media-Kanälen
Folgen Sie und auf Facebook Folgen Sie und auf YouTube Folgen Sie und auf Twitter