Internet Wide Area RDMA Protocol
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2016/04/11 07:59 UTC 版)
iWARPは、従来のTCP上でゼロコピー通信を可能とする仕様である Virtual Interface Architecture の上位セットである。
iWARPは InfiniBandの特徴をEthernetに移植したものとも見ることができる。
概要
TCPスタックのカーネル実装はボトルネックと考えられていたため、いくつかのベンダーはTCP処理をハードウェアで実装している。 ハードウェア実装されたTCPでは、密結合ネットワーク環境では単純なデータロストは稀なため、TCPのエラー訂正機構はソフトウェアで実行される一方、より頻繁に行われる通信はネットワークカード上の回路で直接処理される。 このようなハードウェアはTCP Offload Engine(TOE)として知られている。
TOE自身は受信側の計算機におけるコピーを削減しないため、ゼロコピー通信を実現するためにはRDMAハードウェアも必要となる。 このRDMA / TCP の使用は異なる複数のプロトコルの集合として、ハードウェア上に実装されている。これは、ソフトウェアとして実現することも可能だが、性能は落ちる。
複数のうち主要なプロトコルはDirect Data Placement (DDP)[1]である。DDPにより実際にゼロコピー通信が実現される。DDP自身は実際のデータ転送は行わず、データ転送はTCPにより行われる。
しかしながら、 TCPはメッセージ境界を意識しない。TCPはデータをバイトシーケンスとして、下層のプロトコルのデータサイズ(Protocol Data Unit, PDU)に配慮することなく送信する。よって、DDP自身はTCPよりSCTPを用いたほうがより効率が良くなるため、IETFは RDMA over SCTP の標準化にも関心を持っている。DDP over TCP にはMarker PDU Aligned (MPA) フレーミング[2]と呼ばれるメッセージ境界を固定する調整が必要となる。
また、DDPは直接アクセスされることは意図されていない。代わりに、RDMA Protocol (RDMAP) [3]がデータを読み書きするサービスを提供する。つまり、RDMA over TCP とは、実はRDMAP over DDP over MPA over TCPであると言える。これらのプロトコル全てがハードウェア実装されることが期待される。
プログラムインターフェース
iWARPはInfiniBand(IB)と同様、標準プログラムインターフェースを持たず、代わりにverbの集合が定義されている。[4]ただしIBとは異なり、iWARPはTCPとSCTPが提供する高信頼通信方式のみがサポートされている。 同様にiWARP仕様ではアトミックリモート操作などIBの持つ多くの特徴が省かれている。
iWARPのためのネットワークプロトコルは、Linux向けのものは OpenFabrics AllianceによるOpenFabrics Enterprise Distribution (OFED) に、Windows向けのものは Winsock Direct Protocol に含まれている。
iWARP上で用いられるプロトコル
- NFS over RDMA
- Sockets Direct Protocol (SDP)
- iSCSI Extensions for RDMA (iSER)
- SCSI RDMA Protocol (SRP)
- 1 Internet Wide Area RDMA Protocolとは
- 2 Internet Wide Area RDMA Protocolの概要
- 3 外部リンク
- Internet Wide Area RDMA Protocolのページへのリンク