多段確率決定樹表とは? わかりやすく解説

Weblio 辞書 > 同じ種類の言葉 > 学問 > 学術 > > 多段確率決定樹表の意味・解説 

多段確率決定樹表

読み方ただんかくりつけっていじゅひょう
【英】:multistage stochastic decision tree-table

概要

多段期待値最適化において, 問題から最適解に至るまでを1枚図解したもの. 問題(ツリー)に, 計算過程は表(テーブル)に, 最適解表(ツリー・テーブル)にそれぞれ図示される. 方法としては全数列挙法(total enumeration method)であるが, 最適解構成までが簡単明瞭に表わされている. この表から, 原始政策, 一般政策, マルコフ政策生成される状況分かる. 特に, 加法評価に対してマルコフ政策最適になることが読み取れる.

詳説

 多段確率決定樹表 (ツリーテーブル) は, いわゆる決定(ディシジョンツリー), 決定表(ディシジョンテーブル)をそれぞれ進化発展させ, 多段階にわたる確率決定過程問題記述から最適解構成に至るまでを1枚統合した図表である. 問題データ過程進行状況に応じて配列し, あらゆる可能な経路その評価値と確率図示し, 各段における最適決定選択明示している. この意味では列挙法の解構成与えている. この表ではあらゆる型の評価関数期待値最適化, 確率最適化解かれる. 表には問題に応じて繰り返し法, 直接法などいくつかの型がある[1][2][3].

 ここでは3状態2決定2段(3-2-2)モデル加法最適化問題


\begin{array}{ll}
\mbox{max.} & \mbox{E}[\,r_{0}(u_{0}) 
+ r_{1}(u_{1}) + r_G(x_2) \,] \\
\mbox{s. t.} & 
p(\,\cdot \,|x_n,u_n) \sim x_{n+1} ~\, (n = 0, 1, u_{0} \in U),
 \ u_{1} \in U, 
\end{array}


考える. ただし, 数値次の通り


r_{0}(a_{1}) = 0.7 \quad r_{0}(a_{2}) = 1.0; \quad r_{1}(a_{1}) = 1.0 \quad r_{1}(a_{2}) = 0.6

r_G(s_{1}) = 0.3 \quad r_G(s_{2}) = 1.0 \quad r_G(s_{3}) = 0.8


表1:状態 s_1\, からの2段確率決定

多段階確率決定樹表fig1.jpg

多段階確率決定樹表fig2.jpg


決定表(繰り返し法)では, 次のように簡略化している:
履歴 = x_0~~r_{0}(u_0)\,u_0~~p_0~~x_1~~r_{1}(u_1)\,u_1~~p_1~~x_2~~r_G(x_2)\,
ただし p_0 = p(x_1 | x_0,u_0), ~p_1 = p(x_2 | x_1,u_1)\,
加法 =\, 評価値の和 = r_{0}(u_0) + r_{1}(u_1) + r_G(x_2)\,
経路 =\, 経路確率 = p_0 p_1\,
=\, 加法 \times\, 経路,   部期 =\, 部分期待値,   全期 =\, 全期待値.


この表によって s_{1}\, からの(最適原始決定関数経て)最適一般決定関数


\sigma_{0}(s_{1}) = a_{2}; \quad \sigma_{1}(s_{1}, s_{1}) =
 a_{2}, \quad \sigma_{1}(s_{1}, s_{2}) = a_{1}, \quad \sigma_{1}(s_{1}, s_{3}) = a_{1},a_{2}


および最大値 V_{1}(s_{1}) = \mathbf{2.791}得られる. さらに, s_{2},\,s_{3} からの表(省略)と合わせると, マルコフ政策\pi = \{\pi_{0}, \pi_{1} \}  : \,


\pi_{0}(s_{1}) = a_{2}, \quad \pi_{0}(s_{2}) = a_{2}, \quad \pi_{0}(s_{3}) = a_{2}

\pi_{1}(s_{1}) = a_{2}, \quad \pi_{1}(s_{2}) = a_{1}, \quad \pi_{1}(s_{3}) = a_{1}


最適になっていることがわかる. これは加法特有の性質である. 一般に, 任意の評価関数に対しては, 原始政策, したがって一般政策最適になる.



参考文献

[1] S. Iwamoto and T. Fujita, "Stochastic Decision-making in a Fuzzy Environment," Journal of the Operations Research Society of Japan, 38 (1995), 467-482.

[2] T. Fujita and K. Tsurusaki, "Stochastic Optimization of Multiplicative Functions with Negative Value," Journal of the Operations Research Society of Japan, 41 (1998), 351-373.

[3] S. Iwamoto, K. Tsurusaki and T. Fujita, "Conditional Decision-making in a Fuzzy Environment," Journal of the Operations Research Society of Japan, 42 (1999), 198-218.

「OR事典」の他の用語
動的・確率・多目的計画:  単一評価系  原始政策  反転定理  多段確率決定樹表  多目的計画  多重和の解法  多重積分の解法




多段確率決定樹表と同じ種類の言葉


英和和英テキスト翻訳>> Weblio翻訳
英語⇒日本語日本語⇒英語
  

辞書ショートカット

すべての辞書の索引

「多段確率決定樹表」の関連用語


2
98% |||||

3
98% |||||

多段確率決定樹表のお隣キーワード
検索ランキング

   

英語⇒日本語
日本語⇒英語
   



多段確率決定樹表のページの著作権
Weblio 辞書 情報提供元は 参加元一覧 にて確認できます。

   
日本オペレーションズ・リサーチ学会日本オペレーションズ・リサーチ学会
Copyright (C) 2024 (社)日本オペレーションズ・リサーチ学会 All rights reserved.

©2024 GRAS Group, Inc.RSS