23.10.2015 (Doc Storage)
3.8 von 5, (4 Bewertungen)

Was sind »Data Lakes«?

Leserfrage: Was sind »Data Lakes« und welchen Zweck erfüllen sie?

Antwort Doc Storage:

Der Ausdruck Data-Lake wird James Dixon zugeschrieben, dem Chef der Firma Pentaho. Er umschreibt ihn so: »Stellen Sie sich einen Datenspeicher als einen Stapel aus Kisten mit Mineralwasser vor – gereinigt und zum einfachen strukturierten Verbrauch verpackt. Im Gegensatz dazu ist ein Data-Lake ein großer See aus Wasser in seiner natürlicheren Form. Die Inhalte des Data-Lakes strömen aus einer oder mehreren Quellen in diesen See, und verschiedene Nutzer können sich seinen Inhalt anschauen, in ihn eintauchen oder Proben entnehmen.«

In der Praxis bedeutet dies, dass ein Data Lake einen riesigen, einfach zu erreichenden Speicher aus preiswerten Komponenten darstellt, in dem ungeordnete Datenmenge beliebiger Größe (also Big Data) gespeichert werden können. Im Gegensatz zu bisherigen, eher analytischen Lösungen in diesem Segment, die lediglich einige Attribute der Informationen zusammenfassen und die eigentlichen Daten in nachgeschalteten Speichern halten, ist ein Data-Lake dazu vorgesehen, sämtliche Informationen auf derselben Ebene zu speichern. Dies kann man beispielsweise deshalb tun, weil man die eigentliche Verwendung oder die Art der Auswertung der Daten noch nicht oder noch nicht vollständig kennt und deshalb eine Ordnung noch nicht vornehmen kann.

Im Ende ist ein Data Lake also die Gesamtheit aller in einem Zusammenhang verfügbaren Daten, bevor sie durch Prozesse oder Auswahlkriterien in irgendeine weiter nutzbare Ordnung gebracht wurden. Unter dieser Prämisse sind Data Lakes einfacher aufzubauen, müssen keine oder kaum Ansprüche an Leistungsfähigkeit erfüllen und sind damit wesentlich preiswerter als herkömmliche, bereits spezialisierte und leistungsfähige Big-Data-Installationen.

Gruß
Doc Storage


Stellen Sie Ihre Frage
Doc. tec. Storage beantwortet alle Ihre technischen Fragen zu Storage, Backup & Co.

Stellen Sie Ihre Frage an: DocStorage@speicherguide.de

Mehr von Doc. tec. Storage 01.07.2022 Ist die Cloud die Zukunft? Ja, aber…

Je nachdem mit wem man spricht, aber auf Anbieterseite geht ohne der Cloud nichts mehr. Aber ist dem wirklich so? Administratoren und IT-Manager sind hier durchaus anderer Meinung. Daher, ist die Cloud wirklich die Technologie der Zukunft?


10.06.2022 Warum Immutability allein nicht hilft...

Immutability und unveränderliche Speicher sind eine Empfehlung, sich gegen die Folgen von Ransomware zu schützen. Dies sieht auch Doc Storage so, allerdings nur in Verbindung mit einer richtigen Strategie, die mehrere Datenspeicher, eine Offsite-Auslagerung und ein regelmäßiges Notfall-Training miteinschließt.


03.06.2022 Das ewige Gemeckere über die DSGVO

Zum 4-jährigen bekommt die DSGVO mal wieder Gegenwind. Unternehmer ist es vielfach zu kompliziert, zeitraubend und geschäftsschädigend. Bei den Nutzern freuen sich noch zu wenige über die eigene Datenhoheit. Fast die Hälfte sind genervt. Unser Doc Storage hat hierzu eine klare Meinung: »Ich kann es nicht mehr hören – das ewige Gemeckere über die DSGVO.«


27.05.2022 Mimimi – die Industrie und das Gejammer über Ransomware

Ransomware und Cyberangriffe gehören zweifelsohne zu den größten Bedrohungen, denen die Unternehmens-IT ausgesetzt ist. Abwehrmaßnahmen und Produkte, die einen möglichen Schaden begrenzen sollen, werden den Verantwortlichen zur Genüge angeboten. Das Problem an sich ist aber hausgemacht, meint zumindest Doc Storage.


20.05.2022 Datenverfügbarkeit: Was bedeuten die Neunen?

Die meisten Hersteller werben heute mit ich-weiß-nicht wie vielen Neunen an Zuverlässigkeit und Datenverfügbarkeit. Auf was bezieht sich diese »Zuverlässigkeit« genau und welche Informationen kann der »normale« Kunde aus diesen Angaben ziehen?


22.04.2022 RAID: Systemwechsel ohne Datenverlust möglich?

Lässt sich ein RAID in einer anderen Umgebung in Betrieb nehmen, zum Beispiel weil der dazugehörige PC kaputt ist? Doc Storage sieht hier nur einen kleinen Handlungsspielraum, um einen Datenverlust zu vermeiden.

powered by
N-TEC GmbH Overland-Tandberg
FAST LTA Quantum
Holstein IT-Solutions TrueNAS
Folgen Sie speicherguide.de auch auf unseren Social-Media-Kanälen
Folgen Sie uns auf Facebook Folgen Sie uns auf Pinterest Folgen Sie uns auf YouTube
Folgen Sie uns auf Twitter Folgen Sie uns auf Linkedin speicherguide.de-News per RSS-Feed