03.08.2018 (Doc Storage)
4.4 von 5, (5 Bewertungen)

Was können die Ethernet-Protokolle RoCE und iWARP?

Leserfrage: Es gibt zwei neue RDMA-Protokolle: »RDMA over Converged Ethernet« (RoCE) und iWARP (Internet Wide Area RDMA Protocol). Was können die? Und was sollte man als »normaler ITler« darüber wissen?

Antwort Doc Storage:

RoCE ist ein Protokoll, welches einen entfernten Zugriff über ein Ethernet-Netzwerk ermöglicht. Es gibt zwei Versionen, RoCE 1 und 2.

RoCE 1 ist ein Protokoll auf der niedrigsten Schicht (Typ 0x8915), also dem Ethernet-Link-Layer. Die Frame-Größe ist damit auf 1,5 KByte limitiert (9 KByte für Jumbo-Fames). Es erlaubt Kommunikation zwischen zwei Rechnern in derselben Ethernet-Broadcast-Domäne.

RoCE 2 findet auf der Internet-Schicht statt und kann geroutet werden, daher auch der manchmal gebrauchte Name RRCoE (Routable RoCE). Es läuft auf dem UDP/IPv4- oder -v6-Protokoll. Zwar nutzt RoCE die Vorteile eines konvergierten Netzes, kann allerdings auch auf »einfachen«, nicht konvergierten Netzen benutzt werden. Im Gegensatz zu Standard-UDP-Paketen, deren Reihenfolge beliebig ist, erfordert RoCE 2, dass Pakete derselben UDP-Quelle und desselben UDP-Zieles neu geordnet werden müssen, um in der richtigen Reihenfolge anzukommen. Die Unterstützung für RoCE steckt momentan noch in den Kinderschuhen beispielsweise unterstützt Linux ab dem Kernel 4.5 das Protokoll.

iWARP ist eine Erweiterung dieser Funktionalitäten, um RDMA über Internet-Protokolle zu ermöglichen. Da es auf TCP und STCP aufsetzt, lässt es sich in einer Vielzahl von Umgebungen zum Einsatz bringen. Als Hauptbestandteil von iWARP fungiert das Direct-Data-Placement-Protokoll (DDP), welches allerdings den Transport der Daten dem unterliegenden TCP oder STCP überlässt. Somit findet dieser Transport über das RDMA-Protokoll statt.

Die Nutzer haben einige Kritikpunkte an RoCE gesammelt, beispielsweise eine fehlende Übersetzung zwischen den in RoCE 1 gebräuchlichen GIDs und MAC-Adressen. Moniert wird auch die fehlende Implementierung von VLANs oder der Einschränkung von RoCE-1-Übertragungen auf bestimmte Ports an Ethernet-Switchen.

Im Gegensatz zu RoCE, welche auf UDP aufsetzen, arbeitet iWARP auf TCP-Verbindungen. Die Speicheranforderungen bei einer hohen Anzahl an Verbindungen und andere Einschränkungen führen zu Skalierungsproblemen bei iWARP in größeren Umgebungen. Daneben ist Multicast in den RoCE-Definitionen hinterlegt, während es bei iWARP solche Funktionen vermissen lässt.

Aufgrund der fehlenden Reife und den noch bestehenden Problemen vor allem bei der Integration in bestehende Ethernet-Strukturen empfiehlt es sich, mit der Nutzung der entsprechenden Lösungen noch eine Zeit abzuwarten.

Gruß
Doc Storage

Stellen Sie Ihre Frage
Doc. tec. Storage beantwortet alle Ihre technischen Fragen zu Storage, Backup & Co.

Stellen Sie Ihre Frage an: DocStorage@speicherguide.de
Kommentare (1)
24.08.2018 - mress

Das kann ich nur bestätigen! Die Entwicklungsabteilungen der Hersteller sind aktuell alle an dem Thema dran - denn wie viel einfacher ist es nur noch ein Netzwerk zu haben anstatt FC + GbE! Wir befinden uns da aber aktuell in dem Zeitraster von FC/AL (das nannte sich mal Fibre Channel Arbitrated Loop): FC Fabric gab es noch nicht und man nutzte nur Point-Point Verbindungen zwischen gleichen Herstellern. Einige Hersteller verwenden inzwischen bereits P2P Verbindungen auf Basis von RoCE - vornehmlich als Interconnect zwischen ihren Arrays (was wiederum die DWDM Kosten massiv reduziert da keine dedizierten FC DWDMs erforderlich sind).

Wer allerdings heute in neue Netzwerkinfrastruktur investiert sollte sich überlegen, das zukünftige Low latency Storagenetzwerke IP basierend sein werden welche NVMe-oF als Protokoll nutzen und RoCE als Transportschicht.

Dies bedeutet wiederum gänzlich andere Anforderungen an die Netzwerkinfrastruktur als bisher - insbesondere da dies mittelfristig auch eine Abkehr von FC bedeutet (auch wenn jetzt bereits produktiv nutzbare NVMe-oFC Lösungen verfügbar sind).


Mehr von Doc. tec. Storage 15.02.2019 Was sagt DWPD über SSDs aus?

Im Zusammenhang mit (Enterprise-)SSDs wird oft die Qualitätsgröße DWPD (Drive Writes Per Day) genutzt. Meist wird die Angabe auch für einen Zeitraum von fünf Jahren spezifiziert. Was sagt DWPD genau aus und mit welcher Standard-Lebensdauer darf man rechnen?


08.02.2019 Unterschiede der Performance-States von SSDs

Gängige Meinung: SSDs sind schnell. In der Praxis gibt es aber dann doch einige Unterschiede, so sind vielen die verschiedenen Performance-States von SSDs und Flash-Speichern nicht bekannt: FOB, steady, burst and transition. Was steckt genau dahinter?


01.02.2019 BSI empfiehlt 200-km-Distanz – 200 km ERNSTHAFT!?

Kurz vor Weihnachten veröffentlichte das BSI neue Kriterien für georedundante RZs. Darin wird der bisher empfohlene Mindestabstand von fünf auf 200 Kilometer hochgesetzt. Aus Praxissicht laut Doc Storage »vollkommener Blödsinn«.


31.01.2019 Nervfaktor digitale Transformation – ein Rant

Die digitale Transformation bzw. Digitalisierung verfolgt uns nun schon geraume Zeit. Mit dem Faktor Mensch kommt nun nochmal ein neues Trendthema hinzu. Doc Storage hat hier eine klare Meinung: »alles Blödsinn – es nervt«. Nichts von dem, was heute diskutiert wird, ist neu und Menschen waren schon immer der Kern eines jeden Geschäftsbetriebs – selbst in der IT.


25.01.2019 SSDs: Was ist mit den Schreibzyklen, wenn SSDs fast voll sind?

Moderne SSDs sorgen mit der Wear-Leveling-Funktion automatisch dafür, dass möglichst gleichmäßig über alle Sektoren geschrieben wird. Wie verhält es sich mit den spezifizierten Schreibzyklen, wenn die SSD nahezu voll ist?


18.01.2019 Wie sinnvoll sind Benchmarks und Performance-Tests?

Welchen Stellenwert haben Benchmarks und Performance-Tests (z.B. SPC-1 und SPC-2) bei der Anschaffung von Storage-Systemen? Man hört ja, dass sich Firmen die Anforderungen nur noch vertraglich garantieren lassen. Ist das wirklich ein gangbarer Weg?

powered by
Boston Server & Storage Solutions Datacore Software
Fujitsu Technology Solutions GmbH Unitrends
N-TEC GmbH FAST LTA AG