27.11.2015 (Doc Storage)
4.3 von 5, (10 Bewertungen)

Was ist Erasure-Coding?

Leserfrage: Die RAID-Technologie scheint nun langsam aber sicher das Ende der Fahnenstange zu erreichen. Neuere Festplatten- und vor allem All-Flash-Arrays setzen auf Erasure-Coding bei der Datenredundanz. Was sind die generellen Vorteile von Erasure-Coding? Und: Gibt’s auch Nachteile?

Antwort Doc Storage:

Erasure Coding (EC) benutzt eine Methode zum Schutz gespeicherter Daten. Bei EC werden die Informationen in einzelne Stücke zerlegt, mit redundanten Informationen erweitert und an physikalisch unterschiedlichen Orten in einem Speichersystem abgelegt. Ziel dieser Methode ist es zu ermöglichen, korrumpierte, veränderte oder verloren gegangene Daten mit Hilfe der noch an anderer Stelle vorhandenen Informationen rekonstruieren zu können. EC wird oftmals an Stelle traditionellen RAID-Schutzes eingesetzt, weil die Hersteller davon überzeugt sind, dass EC deutlich weniger Zeit und Backend-Operationen bei der Rekonstruktion von Informationen in Anspruch nimmt. Allerdings kann EC auch wesentlich mehr der zentralen CPU-Zeit belegen, da in diesem Falle ja kein dedizierter RAID-Prozessor mehr vorhanden ist – was dann wiederum in längeren Liefer- und Schreibzeiten mündet.

Anzeige

EC nutzt hierfür eine mathematische Funktion, um eine Reihe von Ziffern zu erzeugen, die sich mit Hilfe sogenannter polynomer Interpolation auf Korrektheit prüfen und im Falle des Verlustes einzelner Ziffern wieder vervollständigen lassen. Eine einfache Darstellung dieser Funktion ist f = a + b, wobei a die ursprüngliche Menge von Informationen und b die Anzahl von redundant hinzugefügten Daten ist. f ergibt dann die tatsächlich zu speichernde Anzahl an Informationen. Als Beispiel: in einer EC 16/24-Konfiguration werden acht zusätzliche Ziffern zu den ursprünglichen 16 hinzugefügt. Die gesamten 24 Ziffern werden an 24 unterschiedlichen Orten im Array, idealerweise auf 24 unterschiedlichen Laufwerken, abgelegt. Die Originaldaten lassen sich nun jederzeit aus nur 16 der 24 gespeicherten Fragmente rekonstruieren. Das heißt, theoretisch könnten in diesem Array bis zu acht Laufwerke ausfallen, ohne dass es zu Datenverlust kommt.

Der große Vorteil von EC ist weiterhin, dass Daten redundant und wiederherstellbar auch über Gerätegrenzen hinaus geschrieben werden können. Dazu muss man sich nur vorher auf einen generellen Algorithmus einigen. Damit ermöglicht EC den Aufbau von beispielsweise Cloud- oder Archivspeichern auf Basis von Standard- oder unterschiedlicher Hardware unter Beibehaltung der von RAID her gewohnten Redundanzen bzw. logischen Schutzmechanismen.

Gruß
Doc Storage

Stellen Sie Ihre Frage
Doc. tec. Storage beantwortet alle Ihre technischen Fragen zu Storage, Backup & Co.

Stellen Sie Ihre Frage an: DocStorage@speicherguide.de

Mehr von Doc. tec. Storage 19.03.2021 Backup-Konzept: Was sind die Türme von Hanoi?

Die Türme von Hanoi sind eine eher selten eingesetzte Datensicherungsstrategie. Was sind die Vorteile und warum hat sich das Konzept nicht durchgesetzt? Doc Storage erklärt den komplexen Backup-Plan und warum es gar nicht abwegig ist, darüber nachzudenken.


19.02.2021 HDD/SSD vs. Interface: Wer ist der Flaschenhals im NAS?

Ein NAS-System mit SSDs aufzurüsten bringt zusätzliche Performance. Sollte es zumindest. Wie verhält es sich mit einer SATA-3-Schnittstelle, avanciert diese nicht zum Flaschenhals und bremst die schnellen Flash-Speicher aus?


05.02.2021 Was ist ein Data-Mover?

Was ist eigentlich ein Data-Mover? Wird oft in der Funktionsliste genannt, meist bei Disk-Subsystemen, aber auch in anderem Kontext. Überträgt man damit einfach nur größere Mengen an Daten oder steckt mehr dahinter?


29.01.2021 Was versteht man unter Back-Hitching und Shoe-Shining?

Wenn es um Tape geht, fallen immer mal wieder die Begriffe Back-Hitching und Shoe-Shining – im negativen Sinne. Was genau ist darunter zu verstehen? Mit welchen Folgen ist beim Auftraten zu rechnen und was sollten Administratoren in diesem Fall unternehmen?


18.12.2020 Speichermarkt 2020 – Ein Rückblick

Doc Storage zieht ein Resümee für den Speichermarkt 2020 und seines Ausblicks Anfang des Jahres. Technologisch hatten die vergangenen zwölf Monate wenig zu bieten. Pandemiebedingt hat sich vieles nicht wie erwartet bzw. ganz anders entwickelt.


11.12.2020 Was ist eine Data-Fabric?

Mittlerweile haben fast alle größeren Hersteller irgendetwas im Angebot, was sich Data-Fabric nennt. Was muss man dazu wissen? Eigentlich vereinen sich darin ja nur verschiedene Services, oder?

powered by
N-TEC GmbH FAST LTA
Cloudian Tech Data IBM Storage Hub
Microchip
Folgen Sie speicherguide.de auch auf unseren Social-Media-Kanälen
Folgen Sie uns auf Facebook Folgen Sie uns auf Pinterest Folgen Sie uns auf YouTube
Folgen Sie uns auf Twitter Folgen Sie uns auf Linkedin speicherguide.de-News per RSS-Feed