共有メモリとは？わかりやすく解説

情報処理において共有メモリ（きょうゆうメモリ）とは、複数のプログラムが同時並行的にアクセスするメモリである。

概要

複数のプログラム間の通信手段として使う場合と、単に複製を用意する冗長さを防ぐ目的の場合などがある。共有メモリはプログラム間でデータをやりとりする効率的手段である。文脈によって、それらプログラムが単一のプロセッサ上で動作する場合と複数の異なるプロセッサ群上で動作する場合がある。単一のプログラムの内部でメモリを使って通信する場合もあり、例えばマルチスレッドが典型的だが、仮想空間をもともと共有している場合は「共有メモリ」とは呼ばない。

ハードウェアによる共有メモリ

コンピュータのハードウェアによる共有メモリは、マルチプロセッサシステムにおける複数のCPUがアクセスできるRAMの（通常）大きなブロックを意味する。

共有メモリシステムでは、全プロセッサがデータを共有しているためプログラミングが比較的容易で、同じメモリ位置へのアクセスによって高速なプロセッサ間通信が可能である。問題は、CPUはなるべく高速なメモリアクセスを必要とするため、それぞれにキャッシュメモリを持っていることが多い点である。そのため、以下の2つの問題が生じる。

CPU-メモリ間がボトルネックになりやすい。共有メモリ型コンピュータはあまりプロセッサ数を増やせない（CPUを増やしてもCPU数に比例して性能が強化されなくなる）。多くの場合、10個かそれ以下のプロセッサ数である。
キャッシュコヒーレンシ問題。あるキャッシュ上であるメモリ位置の情報が更新され、それを他のプロセッサが必要とする場合、その更新を他のプロセッサにも反映させなければならない。さもないとそれぞれのプロセッサが一貫していないデータを使って動作することになる。そのためのプロトコルをコヒーレンシプロトコルと呼び、それがうまく機能すれば複数のプロセッサが高速に共有メモリ（上の情報）にアクセスできるようになる。しかし一方で、コヒーレンシプロトコルがオーバーヘッドとなり、性能のボトルネックになることもある。

ボトルネック問題を和らげる技術として、クロスバースイッチ、オメガネットワーク（英語版）、HyperTransport、CPUバスの分離（フロントサイドバスとバックサイドバス、等）などがある。

共有メモリ以外の方式として分散メモリ（英語版）や分散共有メモリがあるが、どちらにも似たような問題がある。また、NUMAも参照。

GPU内の共有メモリ

GPGPUに対応したモダンなGPUは、GPUのスレッドブロック（ワークグループ、スレッドグループ）内でのみアクセス可能な共有メモリ（ローカルメモリ、グループ共有メモリ）を有している。この共有メモリは、VRAM上に確保されるグローバルメモリと比べると小容量だが高速であり、アプリケーションコードから操作可能なキャッシュメモリの役割を果たす^[1]。CUDA、OpenCL、DirectComputeのようなAPIは、それぞれ名称は異なるものの、このGPU共有メモリを利用する機能を持ち、グローバルメモリから読み出したデータをGPUのスレッドブロック内で共有したり、計算結果を交換したりする用途に活用することで、高速化を図ることができる。

ソフトウェアによる共有メモリ

ソフトウェアにおける共有メモリは、以下のいずれかを意味する。

プロセス間通信 (IPC) の技法の一つ。同時に動作しているプログラム間でデータを交換する方法である。1つのプロセスがメモリ上に他のプロセスからもアクセスできる領域を作成する。
通常、アクセスする主体ごとにコピーを用意するようなデータがあるとき、仮想記憶機構や何らかの明示的プログラム機構を使ってそれらが同じ実体（物理メモリ）をアクセスするようマッピングすること。共有ライブラリやXIP (Execute in Place) でよく使われる。
スレッド実装の一方式

プロセス群は共有メモリ領域に通常のメモリ領域と同じようにアクセスできるので、他のプロセス間通信（名前付きパイプ、ソケット、CORBAなど）と比較して通信手段としては非常に高速である。しかし、プロセス群が同じマシン上で動作しなければならないという制約があり（他のIPC手段はネットワーク上でも機能する）、プロセスが別々のCPU上で動作する場合はハードウェアによる共有メモリを使っていることになり、キャッシュコヒーレンシなどに注意が必要となる。プロセス間の通信がFIFOなストリーム型の場合は、名前付きパイプも通信手段として検討すべきである。一般に共有メモリ自体は保護機能をもたないので動作は高速である。しかし共有されるメモリは不定のタイミングで複数のプロセスからアクセスされる可能性がある。競合を避ける為にはセマフォやロックなどで競合を回避しなければならない。

共有メモリによるIPCは、例えばUNIX上のXサーバとアプリケーションの間で画像を転送する場合や、WindowsのCOMライブラリで CoMarshalInterThreadInterfaceInStream() 関数が返す IStream オブジェクトの内部で使われている。一般的に共有メモリが使われるアプリケーションとしてOracleなどのデータベースがある。Unix版OracleではSGAと呼ばれる共有メモリ空間にデータベースバッファキャッシュがおかれて複数のプロセスからアクセスさせて性能の向上を図っている。

動的ライブラリは一度メモリ上に置かれると、それが複数のプロセスにマッピングされ、プロセスごとにカスタマイズされるページ群（シンボル解決に違いが生じる部分）だけが複製され、通常コピーオンライトという機構で、そのページに書き込もうとしたときにコピーが行われる。

UNIXでのサポート

POSIX には共有メモリの標準化APIとして POSIX Shared Memory がある。これは、sys/mman.h にある shm_open という関数を使う^[2]。POSIXのプロセス間通信（POSIX:XSI拡張の一部）には共有メモリ関数として shmat、shmctl、shmdt が含まれている^[3]^[4]。

shm_open で生成された共有メモリは永続的であり、プロセスが明示的に削除しない限りシステム内に存在し続ける。ただしこれには欠点もあり、共有メモリを削除すべきプロセスがその前に異常終了したとき、その共有メモリがシステムのシャットダウンまで残存し続けることになる。そのような問題を避けるには、mmapを使って共有メモリを作成すればよい^[5]。2つの通信しあうプロセスが同じ名前の一時ファイルをオープンし、それに対してmmapすることでファイルをメモリにマッピングする。結果として、メモリマップされたファイル（メモリマップトファイル）への変更はもう一方のプロセスからも同時に観測できる。この技法の利点は、両方のプロセスが終了したとき、OSが自動的にファイルをクローズし、共有メモリを削除する点である。

Linuxカーネル 2.6 では、RAMディスク形式の共有メモリとして /dev/shm が導入された。より正確に言えば、誰でも書き込めるメモリ内のディレクトリであり、その容量の上限は /etc/default/tmpfs で指定できる。/dev/shm 機能サポートはカーネルの設定ファイルで指定でき、デフォルトでは無効となっている。なお、RedHat や Debian ベースのディストリビューションではデフォルトで有効になっている。

Androidでのサポート

Android では Linux カーネルを使用しているが、IPC 関係が一部無効になっており、独自に開発した（現在はLinuxカーネルに入っている）ashmem (anonymous shared memory) を使用している。メモリが不足したときにカーネルが解放する仕組みがあり、解放されないようにするには、ashmem_pin_region() を使い指定する。

Windowsでのサポート

Microsoft Windowsでは、Win32 APIのCreateFileMapping()関数を使って共有メモリ（メモリマップトファイル）を作成することができる^[6]。クライアント側プロセスはOpenFileMapping()関数を使って、ホスト側プロセスにて作成済みの共有メモリのハンドルを取得することができる。共有メモリを各プロセスのアドレス空間にマッピングするにはMapViewOfFile()関数を使う。

なおWindows APIには、CreateSharedMemory() ^[7]^[8]など “-SharedMemory” の名前を持つ関数があるが、これはセキュリティ関連のAPIであり、メモリ共有のためのAPIではない。これをメモリ共有のために使用すれば、リソースを大量に消費しシステムリソースを使い果たす可能性がある。

プログラミング言語ごとのサポート

一部のC++ライブラリは、共有メモリ機能への移植性の高いオブジェクト指向的なアクセスを提供している。例えば、Boost C++ライブラリには Boost.Interprocess があり^[9]、POCO C++ Libraries には Poco::SharedMemory、Qt には QSharedMemory クラスがある^[10]。

PHP では POSIX で定義している関数群とよく似た共有メモリ用APIが存在する^[11]。

.NET Frameworkはバージョン4でSystem.IO.MemoryMappedFiles.MemoryMappedFileクラス^[12]を標準化した。.NETあるいはXamarin (Mono) を通じて、Windows以外の他のプラットフォームでも利用できる。

脚注

[脚注の使い方]

^ CUDAプログラミングの基本 / パート II - カーネル | NVIDIA
^ Documentation of shm_open from the Single UNIX Specification
^ Robbins, Kay A.; Steven Robbins (2003). UNIX systems programming: communication, concurrency, and threads (2 ed.). Prentice Hall PTR. p. 512. ISBN 978-0-13-042411-2 2011年5月13日閲覧. "The POSIX interprocess communication (IPC) is part of the POSIX:XSI Extension and has its origin in UNIX System V interprocess communication."
^ Shared memory facility from the Single UNIX Specification.
^ Stevens, Richard (1999). UNIX Network Programming, Volume 2, Second Edition: Interprocess Communications. (2 ed.). Prentice Hall PTR. p. 311. ISBN 0-13-081081-9
^ Creating Named Shared Memory - Windows applications | Microsoft Docs
^ CreateSharedMemory function (Windows), Internet Archive
^ LSA_CREATE_SHARED_MEMORY (ntsecpkg.h) - Win32 apps | Microsoft Learn
^ Chapter 16. Boost.Interprocess - 1.80.0
^ QSharedMemory Class Reference
^ PHP 共有メモリ関数
^ MemoryMappedFile Class (System.IO.MemoryMappedFiles) | Microsoft Docs

学習参考書

Julian Shun: "Shared-Memory Parallelism Can be Simple, Fast, and Scalable", ACM books, ISBN 978-1-97000-191-4, doi:10.1145/3018787 (2017).

外部リンク

shm_overview(7) – JM Project Linux Overview, Conventions and Miscellanea マニュアル
IPC:Shared Memory by Dave Marshall
Shared Memory Introduction, Ch. 12 from book by Richard Stevens "UNIX Network Programming, Volume 2, Second Edition: Interprocess Communications".

[1] CUDAプログラミングの基本 / パート II - カーネル | NVIDIA

[2] Documentation of shm_open from the Single UNIX Specification

[3] Robbins, Kay A.; Steven Robbins (2003). UNIX systems programming: communication, concurrency, and threads (2 ed.). Prentice Hall PTR. p. 512. ISBN 978-0-13-042411-2 2011年5月13日閲覧. "The POSIX interprocess communication (IPC) is part of the POSIX:XSI Extension and has its origin in UNIX System V interprocess communication."

[4] Shared memory facility from the Single UNIX Specification.

[5] Stevens, Richard (1999). UNIX Network Programming, Volume 2, Second Edition: Interprocess Communications. (2 ed.). Prentice Hall PTR. p. 311. ISBN 0-13-081081-9

[6] Creating Named Shared Memory - Windows applications | Microsoft Docs

[7] CreateSharedMemory function (Windows), Internet Archive

[8] LSA_CREATE_SHARED_MEMORY (ntsecpkg.h) - Win32 apps | Microsoft Learn

[9] Chapter 16. Boost.Interprocess - 1.80.0

[10] QSharedMemory Class Reference

[11] PHP 共有メモリ関数

[12] MemoryMappedFile Class (System.IO.MemoryMappedFiles) | Microsoft Docs

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

SHMMAX	共有メモリの最大サイズ。通常は 131072 バイト
SHMMIN	共有メモリの最小サイズ。通常は 1 バイト
SHMMNI	共有メモリセグメントの最大数。通常は 100
SHMSEG	プロセス毎の共有メモリの最大数。通常は 6

名前	デフォルト	変更の可否	変更履歴
sysvmsg.value	"42"	PHP_INI_ALL
sysvmsg.string	"foobar"	PHP_INI_ALL

定数	型	変更履歴
MSG_IPC_NOWAIT	integer
MSG_EAGAIN	integer	5.2.0 以降
MSG_ENOMSG	integer	5.2.0 以降
MSG_NOERROR	integer
MSG_EXCEPT	integer

表話編歴並列計算
総論	クラウドコンピューティンググリッド・コンピューティング高性能計算コンピュータ・クラスター分散コンピューティング
並列レベル	タスクデータビット命令
スレッド	スーパースレッディング（英語版）ハードウェアマルチスレッディング同時マルチスレッディングハイパースレッディング SIMT
理論	アムダールの法則グスタフソンの法則コスト効率性（英語版） Karp-Flatt metric（英語版） Parallel slowdown（英語版） Speedup（英語版）
要素	スレッドファイバープロセス PRAM Instruction window（英語版）
調整	キャッシュコヒーレンシ同期バリアマルチプロセッシングメモリコヒーレンスキャッシュ無効化 Application checkpointing（英語版）
プログラミング	スレッド (コンピュータ) 並列プログラミングモデル Implicit（英語版） Explicit（英語版）並行性フリンの分類 SISD SIMD MISD MIMD SPMD（英語版） Lock-freeとWait-freeアルゴリズム累積和
ハードウェア	スーパーコンピュータスーパースカラーベクトル計算機マルチプロセッシング対称型非対称型（英語版）マルチコアメモリ NUMA COMA（英語版）分散型（英語版）共有型分散共有型 MPP Beowulf
API	Ateji PX（英語版） Boostスレッド C++ AMP Charm++（英語版） Cilk（英語版） Coarray Fortran（英語版） CUDA Dryad（英語版） Global Arrays（英語版） Intel Cilk Plus（英語版） Intel Threading Building Blocks MPI OpenACC OpenCL OpenHMPP（英語版） OpenMP PVM POSIXスレッド UPC
問題	Embarrassingly parallel（英語版） Grand Challenge（英語版） Software lockout（英語版）
並行計算カテゴリ:並行計算カテゴリ:並列コンピューティング

並列コンピューティング	Shared nothingアーキテクチャ EPICアーキテクチャ共有メモリ並列シスプレックス PACS >>製品 >>コンピュータ一覧 >>その他コンピュータ製品一覧
オペレーティングシステムの仕組み	Remote Direct Memory Access マルチブート共有メモリ Live CD 環境変数 >>固有名詞 >>製品一覧 >>コンピュータ一覧 >>ソフトウェア一覧
並行計算	トランスピュータ Concurrent Prolog 共有メモリマイクロスレッドコンテキストスイッチ >>製品 >>コンピュータ一覧 >>その他コンピュータ製品一覧

共有メモリとは？わかりやすく解説