03.08.2018 (Doc Storage)
4.4 von 5, (5 Bewertungen)

Was können die Ethernet-Protokolle RoCE und iWARP?

Leserfrage: Es gibt zwei neue RDMA-Protokolle: »RDMA over Converged Ethernet« (RoCE) und iWARP (Internet Wide Area RDMA Protocol). Was können die? Und was sollte man als »normaler ITler« darüber wissen?

Antwort Doc Storage:

RoCE ist ein Protokoll, welches einen entfernten Zugriff über ein Ethernet-Netzwerk ermöglicht. Es gibt zwei Versionen, RoCE 1 und 2.

RoCE 1 ist ein Protokoll auf der niedrigsten Schicht (Typ 0x8915), also dem Ethernet-Link-Layer. Die Frame-Größe ist damit auf 1,5 KByte limitiert (9 KByte für Jumbo-Fames). Es erlaubt Kommunikation zwischen zwei Rechnern in derselben Ethernet-Broadcast-Domäne.

RoCE 2 findet auf der Internet-Schicht statt und kann geroutet werden, daher auch der manchmal gebrauchte Name RRCoE (Routable RoCE). Es läuft auf dem UDP/IPv4- oder -v6-Protokoll. Zwar nutzt RoCE die Vorteile eines konvergierten Netzes, kann allerdings auch auf »einfachen«, nicht konvergierten Netzen benutzt werden. Im Gegensatz zu Standard-UDP-Paketen, deren Reihenfolge beliebig ist, erfordert RoCE 2, dass Pakete derselben UDP-Quelle und desselben UDP-Zieles neu geordnet werden müssen, um in der richtigen Reihenfolge anzukommen. Die Unterstützung für RoCE steckt momentan noch in den Kinderschuhen beispielsweise unterstützt Linux ab dem Kernel 4.5 das Protokoll.

iWARP ist eine Erweiterung dieser Funktionalitäten, um RDMA über Internet-Protokolle zu ermöglichen. Da es auf TCP und STCP aufsetzt, lässt es sich in einer Vielzahl von Umgebungen zum Einsatz bringen. Als Hauptbestandteil von iWARP fungiert das Direct-Data-Placement-Protokoll (DDP), welches allerdings den Transport der Daten dem unterliegenden TCP oder STCP überlässt. Somit findet dieser Transport über das RDMA-Protokoll statt.

Die Nutzer haben einige Kritikpunkte an RoCE gesammelt, beispielsweise eine fehlende Übersetzung zwischen den in RoCE 1 gebräuchlichen GIDs und MAC-Adressen. Moniert wird auch die fehlende Implementierung von VLANs oder der Einschränkung von RoCE-1-Übertragungen auf bestimmte Ports an Ethernet-Switchen.

Im Gegensatz zu RoCE, welche auf UDP aufsetzen, arbeitet iWARP auf TCP-Verbindungen. Die Speicheranforderungen bei einer hohen Anzahl an Verbindungen und andere Einschränkungen führen zu Skalierungsproblemen bei iWARP in größeren Umgebungen. Daneben ist Multicast in den RoCE-Definitionen hinterlegt, während es bei iWARP solche Funktionen vermissen lässt.

Aufgrund der fehlenden Reife und den noch bestehenden Problemen vor allem bei der Integration in bestehende Ethernet-Strukturen empfiehlt es sich, mit der Nutzung der entsprechenden Lösungen noch eine Zeit abzuwarten.

Gruß
Doc Storage

Stellen Sie Ihre Frage
Doc. tec. Storage beantwortet alle Ihre technischen Fragen zu Storage, Backup & Co.

Stellen Sie Ihre Frage an: DocStorage@speicherguide.de
Kommentare (1)
24.08.2018 - mress

Das kann ich nur bestätigen! Die Entwicklungsabteilungen der Hersteller sind aktuell alle an dem Thema dran - denn wie viel einfacher ist es nur noch ein Netzwerk zu haben anstatt FC + GbE! Wir befinden uns da aber aktuell in dem Zeitraster von FC/AL (das nannte sich mal Fibre Channel Arbitrated Loop): FC Fabric gab es noch nicht und man nutzte nur Point-Point Verbindungen zwischen gleichen Herstellern. Einige Hersteller verwenden inzwischen bereits P2P Verbindungen auf Basis von RoCE - vornehmlich als Interconnect zwischen ihren Arrays (was wiederum die DWDM Kosten massiv reduziert da keine dedizierten FC DWDMs erforderlich sind).

Wer allerdings heute in neue Netzwerkinfrastruktur investiert sollte sich überlegen, das zukünftige Low latency Storagenetzwerke IP basierend sein werden welche NVMe-oF als Protokoll nutzen und RoCE als Transportschicht.

Dies bedeutet wiederum gänzlich andere Anforderungen an die Netzwerkinfrastruktur als bisher - insbesondere da dies mittelfristig auch eine Abkehr von FC bedeutet (auch wenn jetzt bereits produktiv nutzbare NVMe-oFC Lösungen verfügbar sind).


Mehr von Doc. tec. Storage 12.04.2019 Dateisysteme für den PByte-Bereich

Datenberge jenseits des PByte-Bereichs, Cloud-Anbindungen und Analytics-Szenarien stellen Dateiysteme vor neue Herausforderungen. Der Markt bietet einige Optionen wie GPFS, Gluster FS, OneFS oder QF2. Worauf gilt es zu achten?


05.04.2019 Neuordnung des Storage-Tiering

Nachdem sich Flash und SSDs mittlerweile auch in mehrere Leistungsklassen unterteilen, steht die Technik nicht mehr nur für Tier 0. 15k-HDDs scheinen vor dem Aus zu stehen. Gilt dies auch für alle SAS-Platten? Wie sieht die Neuordnung des Storage-Tiering aktuell aus?


15.03.2019 30 Jahre World Wide Web: Was gibt es zu feiern?

Das World Wide Web feiert seinen 30. Geburtstag. Ohne dem Internet ist unser heutiges Leben nicht mehr vorstellbar. Für Doc Storage hat das Netz aber auch genug Schattenseiten. An Regulierungen bzw. an das vom Erfinder erhoffte bessere Internet, glaubt er nicht.


08.03.2019 Datenanordnung im RAID 10 mit 8 Platten

In einem Server wird ein RAID 10 mit acht Festplatten unter Windows 2008 R2 betrieben. Nun ist ein Laufwerk ausgefallen. Da sich nur wenige Daten auf den HDDs befinden, besteht die Möglichkeit, dass die defekte Platte eventuell gar keine Daten enthält?


22.02.2019 Welcher RAID-Level für welche Anwendung?

Gibt es eigentliche eine Faustregel, welches RAID-Level für welche Anwendung am besten geeignet ist? Ich denke da zum Beispiel an Datenbanken mit sehr vielen Zugriffen bei relativ kleinen Datenmengen oder an Webserver und als Extrem auf der anderen Seite Bild-Datenbanken, Audio-Server beim Rundfunk, Video-Archive mit sehr hohen Datenvolumen.


15.02.2019 Was sagt DWPD über SSDs aus?

Im Zusammenhang mit (Enterprise-)SSDs wird oft die Qualitätsgröße DWPD (Drive Writes Per Day) genutzt. Meist wird die Angabe auch für einen Zeitraum von fünf Jahren spezifiziert. Was sagt DWPD genau aus und mit welcher Standard-Lebensdauer darf man rechnen?

powered by
Boston Server & Storage Solutions Datacore Software
Fujitsu Technology Solutions GmbH Seagate Technology
N-TEC GmbH FAST LTA AG