16.05.2014 (Doc Storage)
4.2 von 5, (5 Bewertungen)

Was ist »FluidCache« und wie funktioniert er?

Leserfrage: Flash-Ressourcen zu verteilen, optimiert die Performance im Speicherumfeld. Wie genau aber funktionieren Lösungen wie »FluidCache« und wie viel Nutzen bringen sie? Andere Konzepte – wie das Startup DSSD es propagiert – bringen die Flash-Ressource direkt an den Server, dafür höchst parallelisiert. Wo lässt sich was besser einsetzen?

Antwort Doc Storage:

Zunächst einmal müssen wir diese Welt in »Wünsche« und Realität« einteilen. Und auch hier nicht nur die technische Machbarkeit, sondern vor allem den betriebswirtschaftlichen Nutzen der ganzen Flash-Angebote, die nun in welcher Kopplungstechnik auch immer den Markt förmlich fluten.

Zu den Wünschen der Hersteller zählt zweifelsohne, den Zugriff auf die verbauten Flash-Medien noch schneller zu ermöglichen als bisher. »Bisher« bedeutet in erster Linie die Nutzung von Festkörperspeichern auf PCI-Steckkarten. Diese Anbindung ist Faktoren schneller als über die üblichen Wege, also beispielsweise FC oder InfiniBand. Das bekommt man auch hin, allerdings für den Preis nicht vorhandenen physikalischen oder logischen Datenschutzes, da diese Karten meist nur singuläre Entitäten darstellen und sich damit nicht mit RAID oder ähnlichen Technologien schützen lassen. Viele Hersteller, die neben den PCI- auch herkömmliche Speicherlösungen anbieten, behelfen sich damit, die in die Steckkarten geschriebenen Daten in ein externes Array zu duplizieren. Womit man wieder in die Leistungsfalle gerät, denn, wie ein lieber Kollege immer zu sagen pflegte: »Nichts wird dadurch schneller, indem man es mehrfach macht.«

Ein weiterer Wunsch der Hersteller ist daher, wie bei DSSD eine Art Hardware-RAID über die Speichermodule zu legen, die dann gegenseitig mit einem eigens entwickelten Algorithmus für Datenintegrität sorgen. Auch nichts neues, eine solche Herangehensweise gab es schon weiland bei den alten »Symmetrix«-Modellen vor der »VMAX«, als es dort noch keinen gespiegelten Cache gab. Und diese hat wunderbar funktioniert, kamen doch Cache-Fehler so gut wie niemals vor. Allerdings handelte es sich damals um DRAM und ein eigens für diese Aufgabe entwickeltes Betriebssystem. Heute versucht DSSD das Ganze mit Standard-Flash und einer abgespeckten Linux-Version hinzubekommen. Ob das ein Wunsch bleibt oder irgendwann Realität wird, das werden die kommenden Quartale zeigen. Genug Geld hat EMC ja auch schon vor der Übernahme in das Unternehmen gesteckt.

In der Realität wird sich für den Kunden beim Einsatz von PCI-Lösungen wie zum Beispiel Dells Fluid Cache eine extreme Steigerung der Transaktionsleistung in Standardservern, also x86-Architekturen zeigen. Denn hier liegt der nächste Pferdefuß. Diese Lösungen sind fast ausschließlich der Intel-Welt vorbehalten, proprietäre Systeme mit AIX-, HP-UX- oder anderen professionell genutzten Betriebssystemen bleiben meist außen vor oder müssen eine erhebliche Verzögerung in der Entwicklung gegenüber den Commodity-Systemen hinnehmen.

Einsatzgebiete sind (ich werde jetzt absichtlich nicht Big-Data oder Cloud schreiben...) alle Anwendungen, die mit hohen Transaktionsleistungen daherkommen. Datenbanken, CRM-Systeme, Data-Warehouse oder Data-Mining. Webshops mit entsprechender Datenbankanbindung werden mit Sicherheit genauso von PCI-Flash profitieren wie Mailserver oder der schlichte Virtualisierungsserver, der morgens und mittags mit extrem vielen Zugriffen (Bootstorms) zurechtkommen muss.

Die Frage nach dem »besser« bei parallel oder direkt ist für jeden Nutzer, ja jede Anwendung individuell zu beantworten und kann nicht pauschal beschieden werden. Betriebswirtschaftlich ist nur eine Frage zu stellen: Ist das, was man durch den Einsatz von PCI-Flash schneller und dadurch mehr machen kann, den Aufwand wert? Ist das frühere Ergebnis oder die schnellere Verfügbarkeit am Markt so viel oder mehr wert als der Anschaffungspreis der Hardware? Kann man vielleicht Dinge tun, die mir vorher durch alte und langsame Methoden verwehrt waren, und dadurch neue Produkte, neue Verfahren und Methoden entwickeln, die meinem Unternehmen oder meinen Fachabteilungen einen Wettbewerbsvorteil und damit echte betriebliche Wertschöpfung bringen? Erst wenn sich diese Fragen mit »ja« beantworten lassen lohnt es sich überhaupt, über die Anschaffung solcher Hardware nachzudenken.

Und eines darf dabei nicht vergessen werden: Es geht hier nicht ums Kaufen, Einbauen und Weitermachen. Es geht hier um die Feststellung der Transaktionsleistung einer Anwendung, die Identifizierung der »Flash-würdigen« Daten, das Verbringen dieser Daten auf die neue Hardware, das Neustarten der Anwendung und die Inbetriebnahme einer (fast) völlig neuen Umgebung. Das ist nicht an einem Tag gemacht, und vor allem nicht mal so nebenher, wie es die Hersteller uns gern weiszumachen versuchen. Hier gilt es zu testen, zu identifizieren, seine Hausaufgaben als Rechenzentrum und Anwendungsbetreiber mehr als sorgfältig zu machen. Es gilt dann umzubauen, Daten umzuziehen, einen Probebetrieb parallel zur Produktion zu betreuen und dann irgendwann der Fachabteilung ein fertiges Produkt zu übergeben. Das dauert, je nach Personaldecke, zwischen mehreren Wochen und einem Jahr. Auch das ist in die Gesamtkalkulation einzubeziehen.

Ich kann mir am Schluss diese Bemerkung mit einem Augenzwinkern nicht verkneifen: Und dann, wenn die Rechenzentren mit der Einführung neuer Technologien auf Flash-Basis fertig sind, alle Tests gelaufen, alle Bugs gefunden und die Anwendungen in Produktion gegangen sind, genau an diesem Tag wird ein Hersteller eine Technologie veröffentlichen, gegen die Flash aussieht wie ein VW Käfer neben einem Ferrari.

Gruß
Doc Storage

Stellen Sie Ihre Frage
Doc. tec. Storage beantwortet alle Ihre technischen Fragen zu Storage, Backup & Co.

Stellen Sie Ihre Frage an: DocStorage@speicherguide.de

Mehr von Doc. tec. Storage 12.04.2019 Dateisysteme für den PByte-Bereich

Datenberge jenseits des PByte-Bereichs, Cloud-Anbindungen und Analytics-Szenarien stellen Dateiysteme vor neue Herausforderungen. Der Markt bietet einige Optionen wie GPFS, Gluster FS, OneFS oder QF2. Worauf gilt es zu achten?


05.04.2019 Neuordnung des Storage-Tiering

Nachdem sich Flash und SSDs mittlerweile auch in mehrere Leistungsklassen unterteilen, steht die Technik nicht mehr nur für Tier 0. 15k-HDDs scheinen vor dem Aus zu stehen. Gilt dies auch für alle SAS-Platten? Wie sieht die Neuordnung des Storage-Tiering aktuell aus?


15.03.2019 30 Jahre World Wide Web: Was gibt es zu feiern?

Das World Wide Web feiert seinen 30. Geburtstag. Ohne dem Internet ist unser heutiges Leben nicht mehr vorstellbar. Für Doc Storage hat das Netz aber auch genug Schattenseiten. An Regulierungen bzw. an das vom Erfinder erhoffte bessere Internet, glaubt er nicht.


08.03.2019 Datenanordnung im RAID 10 mit 8 Platten

In einem Server wird ein RAID 10 mit acht Festplatten unter Windows 2008 R2 betrieben. Nun ist ein Laufwerk ausgefallen. Da sich nur wenige Daten auf den HDDs befinden, besteht die Möglichkeit, dass die defekte Platte eventuell gar keine Daten enthält?


22.02.2019 Welcher RAID-Level für welche Anwendung?

Gibt es eigentliche eine Faustregel, welches RAID-Level für welche Anwendung am besten geeignet ist? Ich denke da zum Beispiel an Datenbanken mit sehr vielen Zugriffen bei relativ kleinen Datenmengen oder an Webserver und als Extrem auf der anderen Seite Bild-Datenbanken, Audio-Server beim Rundfunk, Video-Archive mit sehr hohen Datenvolumen.


15.02.2019 Was sagt DWPD über SSDs aus?

Im Zusammenhang mit (Enterprise-)SSDs wird oft die Qualitätsgröße DWPD (Drive Writes Per Day) genutzt. Meist wird die Angabe auch für einen Zeitraum von fünf Jahren spezifiziert. Was sagt DWPD genau aus und mit welcher Standard-Lebensdauer darf man rechnen?

powered by
Boston Server & Storage Solutions Datacore Software
Fujitsu Technology Solutions GmbH Seagate Technology
N-TEC GmbH FAST LTA AG