マルコフ連鎖の数値解法とは? わかりやすく解説

Weblio 辞書 > 学問 > OR事典 > マルコフ連鎖の数値解法の意味・解説 

マルコフ連鎖の数値解法

読み方まるこふれんさのすうちかいほう
【英】:numerical method for Markov chain

概要

マルコフ連鎖定常分布過渡的分布数値的に計算するための方法. 定常分布計算線形方程式系を解く問題帰着され, 解法として消去法状態縮約法などの直接法, ヤコビ法, ガウス・ザイデル法, 状態縮約/非縮約法などの反復法がある. また, 構造化されたマルコフ連鎖に対して行列幾何形式解利用する方法も有力である. 一方, 過渡的分布に対しては, 離散時間ではべき乗法, 連続時間ではランダム化利用する方法などがある.

詳説

 マルコフ連鎖マルコフ連鎖数値的解析する際の中心的な対象定常分布である. 有限状態空間 {\mathcal S}=\{ 1, 2, \ldots, N \}\, 上の既約非周期的な (つまりエルゴード的) マルコフ連鎖考え, その推移確率行列\boldsymbol{P}=(p_{ij})\, , 定常分布\boldsymbol{\pi}=(\pi_1, \pi_2,\ldots,\pi_N)\, とする. 一様化により, 連続時間マルコフ連鎖定常分布は, 離散時間マルコフ連鎖定常分布として計算できるので, 以下では離散時間マルコフ連鎖限定して考える.

 エルゴード的なマルコフ連鎖では, 定常分布


(平衡方程式)  \pi_j = \sum_{i=1}^N \pi_i p_{ij}, \quad j=1, 2, \ldots,N, \qquad
\, (1)\,
(正規化条件)  \sum_{j=1}^N \pi_j = 1 \, (2)\,


満たす一意の解として与えられる (式(1)) の解は定数に関して一意でないため, 式 (2) で正規化する). したがって, 定常分布計算は, 原理的に線形方程式系数値的に解く問題帰着される. 状態数 N\, 大きくなければ, 消去法状態縮約法などの直接法 (反復計算伴わない方法) でも解を求めることは可能だが, 一般にマルコフ連鎖によるモデル化モデル複雑になるに従って状態数急激に増加する傾向があるため, そのような場合計算精度などを考慮して反復法用いることが多い.


ガウス・ザイデル法 反復法では, 反復回数 k \to \infty\, のときに定常分布 \boldsymbol{\pi}\, 収束するような近似値の列 \boldsymbol{\pi}^{(k)} = (\pi_1^{(k)}, \pi_2^{(k)}, \ldots,\pi_N^{(k)})\, 構成する. 例えば, ヤコビ法 (Jacobi method) では, 適当な初期分布 \boldsymbol{\pi}^{(0)}\, からスタートして



  \pi_j^{(k)} = \sum_{i=1}^N \pi_i^{(k-1)} p_{ij}, \quad
  j=1, 2, \ldots,N


によって分布\boldsymbol{\pi}^{(k)}\, 構成し, \boldsymbol{\pi}^{(k-1)}\, \boldsymbol{\pi}^{(k)}\, が十分近くなった時点収束した判断する. エルゴード的なマルコフ連鎖に対しては, ヤコビ法計算誤差除けば必ず収束するが, 一般に大きな N\, に対してはあまり収束速くない. これに対して, ガウス・ザイデル法 (Gauss-Seidel method) では



  \pi_j^{(k)} = \frac{ \sum_{i=1}^{j-1} \pi_i^{(k)} p_{ij}
              + \sum_{i=j+1}^{N} \pi_i^{(k-1)} p_{ij} }{1-p_{jj}},
  \quad j=1, 2, \ldots,N


によって分布列を構成する. この方法では, k\, 回目反復で既に更新されている値を逐次利用するため, ヤコビ反復法比べる一般に収束速くなることが多い. また, 推移確率行列ブロック構造を持つ場合には, ブロックごとに更新された値を利用するブロックガウス・ザイデル法 (block Gauss-Seidel method) も有効である. さらに収束加速する手段として過剰緩和法 (overrelaxation method) の利用がある. 過剰緩和法では, 緩和 (または加速) 係数\omega\, として



  \pi_j^{(k)} = \frac{ \omega \sum_{i=1}^{j-1} \pi_i^{(k)} p_{ij}
              + (1-\omega) \pi_j^{(k-1)} p_{jj}
              + \omega \sum_{i=j+1}^{N} \pi_i^{(k-1)} p_{ij} }{1-p_{jj}},
  \quad j=1, 2, \ldots,N


によって \boldsymbol{\pi}^{(k)}\, 計算する. \omega>1\, ときには, 外挿により \boldsymbol{\pi}^{(k-1)}\, から \boldsymbol{\pi}^{(k)}\, 計算しており, 適切な \omega\, を選ぶことで収束加速することが可能となる. なお, ガウス・ザイデル系の方法では, 初期分布 \boldsymbol{\pi}^{(0)}\, が (2) を満たしていても, 途中計算でこの制約満たされなくなるため, 計算最後に (2) が満たされるよう正規化することが必要である.


状態縮約/非縮約法 一方, 複数の状態をまとめて1つの状態と見なし状態数少な確率過程に対して反復計算を行う方法状態縮約/非縮約法 (aggregation/disaggregation method: AD法) がある. 例えば, 状態空間L\, 個の部分空間 {\mathcal S}_1, \ldots, {\mathcal S}_L\, 分割し, {\mathcal S}_{\alpha}\, には d_\alpha\, 個の状態 (\alpha,1), \ldots, (\alpha,d_\alpha)\, 含まれる場合考え, 推移確率\boldsymbol{P}=( p_{(\alpha,i)(\beta,j)} )\, , 状態 (\alpha,i)\, 定常確率\pi_{\alpha,i}\, , 部分空間 {\mathcal S}_\alpha\, 定常確率\textstyle \tau_\alpha=\sum_{i=1}^{d_\alpha} \pi_{\alpha,i}\, とする. いま, k-1\, 回の反復近似値 \pi_{\alpha,i}^{(k-1)}\, , \tau_\alpha^{(k-1)}\, 求められているとしよう. k\, 回目反復計算のうち, まず縮約フェーズでは, 部分空間 {\mathcal S}_\alpha,\; \alpha = 1,\ldots,L\, それぞれ1つの状態 s_\alpha\, 縮約した L\, 状態の確率過程考え, それをマルコフ連鎖見なして (特殊なケース除いて縮約した確率過程マルコフ連鎖とならない) 推移確率, 例えs_\alpha\, から s_\beta\, への推移確率\textstyle q_{\alpha,\beta}^{(k)}=\sum_{i=1}^{d_\alpha} \sum_{j=1}^{d_\beta}\pi_{\alpha,i}^{(k-1)} p_{(\alpha,i)(\beta,j)} / \tau_\alpha^{(k-1)}\, によって定める. このマルコフ連鎖 \boldsymbol{Q}^{(k)}=(q_{\alpha,\beta}^{(k)})\, 平衡方程式解いて, 更新され定常確率 \tau_\alpha^{(k)},\; \alpha=1,\ldots,L\, 求める. 次に縮約フェーズでは, 1つ着目した部分空間そのままで他のすべての部分空間1つの状態に縮約した確率過程近似的にマルコフ連鎖考える. 例えば, 部分空間 {\mathcal S}_\alpha\, 注目した場合には, {\mathcal S}_\alpha\, 内の推移確率は元のままで, {\mathcal S}_\alpha\, 内の状態 (\alpha,i)\, から縮約された状態への推移確率\textstyle \sum_{\beta \ne \alpha}\sum_{j=1}^{d_\beta} p_{(\alpha,i)(\beta,j)}\, , 逆に縮約された状態から (\alpha,i)\, への推移確率\textstyle \sum_{\beta \ne \alpha}   \sum_{j=1}^{d_\beta}\pi_{\beta,j}^{(k-1)} p_{(\beta,j)(\alpha,i)}/(1-\tau_{\alpha}^{(k)})\, 与えられるマルコフ連鎖考え, その定常分布計算し \pi_{\alpha,i}^{(k)}, \; i=1,\cdots,d_\alpha\, を得る. この計算を, 注目する部分空間{\mathcal S}_1\, から {\mathcal S}_L\, まで変えながら行えば, 更新され定常確率求めることができる. この縮約/非縮約の手続きを, 値が収束するまで反復すればよい.


無限状態と過渡的分布 状態数が無限のマルコフ連鎖に対しては, 状態空間適当な有限サイズ打ち切って数値計算を行うが, 打ち切るサイズによって計算時間計算精度の間にトレードオフ生じるので注意が必要である. 構造入っている場合 (後述) は, 上の方法用いにしてもその構造をうまく利用することによって, 少な計算量精度良い解が計算できることが多い.

 定常分布比べると, 過渡的分布 (各時点における推移確率) の計算方法それほど多くないが, 離散時間マルコフ連鎖に対してべき乗法, 連続時間マルコフ連鎖に対してランダム化利用する方法などが知られている.


構造化されたマルコフ連鎖 確率モデル, 特に待ち行列モデルから派生するマルコフ連鎖には, 何らかの構造を持つものが多いため, その構造利用した数値計算法が開発されている. 代表例として, 相型待ち行列対す行列幾何形式解考えよう. 到着過程サービス過程}にマルコフ型到着過程相型分布導入することで, 広い範囲待ち行列モデル準出生死滅過程 (quasi-birth-and-death process) を含むGI/M/1型, あるいはM/G/1型マルコフ過程などの構造化されたマルコフ連鎖表現することができる. このうち, GI/M/1型マルコフ連鎖は, レベル n\; (=0,1,\ldots)\, と相 i\;(=1,\ldots,d)\, の組 (n,i)\, によって状態が表されるマルコフ連鎖で, 1回推移では高々1つ上のレベルまでしか推移せず, またレベル n\, の状態からレベル m\; (m\le n+1)\, の状態への推移確率 (または推移速度) がレベルの差 m-n\, と各状態の相によって決まる性質持っている. レベル n\, の状態の定常確率ベクトル\boldsymbol{\pi}_n=(\pi_{n,1}, \ldots, \pi_{n,d})\, で表すと, 行列幾何形式解より, 公比行列 \boldsymbol{R}\, 用いて



  \mathbf{\pi}_n = \mathbf{\pi}_0
  \mathbf{R}^n, \quad n=1,2,\ldots
     (3)\,


表される. \boldsymbol{R}\, 推移確率行列要素係数とする非線形行列方程式非負最小解として与えられ, 逐次代入法などで計算することができる. また \boldsymbol{\pi}_{0}\, 境界条件相当する線形方程式解いて求められる [2]. この方法は, 本来無限次元定常分布有限次元ベクトル行列表せるという特徴を持つが, 高速化のためには \boldsymbol{R}\, 計算方法ポイントとなる.

 なお, M/G/1型マルコフ連鎖行列幾何形式解持たないが, やはりその構造利用したさまざまな方法考えられている [2].



参考文献

[1] D. P. Heyman and M. J. Sobel (eds.), 伊理, 今野, 刀根監訳, 『確率モデルハンドブック』, 朝倉書店, 1995.

[2] M. F. Neuts, Matrix Goemtric Solutions in Stochastic Models - An Algorithmic Approach, Johns Hopkins Univ. Press, 1981.

[3] M. F. Neuts, Structured Stochastic Matrices of {rm M/G/1} Type and Their Applications, Marcel Dekker, 1989.

[4] W. J. Stewart (ed.), Numerical Solution of Markov Chains, Marcel Dekker, 1991.

[5] W. K. Grassmann (ed.), Computational Probability, Kluwer Academic Publishers, 2000.

「OR事典」の他の用語
確率と確率過程:  マルコフ性  マルコフ決定過程  マルコフ連鎖  マルコフ連鎖の数値解法  マルコフ過程  マルチンゲール  ラプラス変換



英和和英テキスト翻訳>> Weblio翻訳
英語⇒日本語日本語⇒英語
  

辞書ショートカット

すべての辞書の索引

マルコフ連鎖の数値解法のお隣キーワード
検索ランキング

   

英語⇒日本語
日本語⇒英語
   



マルコフ連鎖の数値解法のページの著作権
Weblio 辞書 情報提供元は 参加元一覧 にて確認できます。

   
日本オペレーションズ・リサーチ学会日本オペレーションズ・リサーチ学会
Copyright (C) 2025 (社)日本オペレーションズ・リサーチ学会 All rights reserved.

©2025 GRAS Group, Inc.RSS