問題設定
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2019/12/06 05:56 UTC 版)
X 1 , X 2 , … , X n {\displaystyle X_{1},X_{2},\ldots ,X_{n}} が多変量正規分布 N ( 0 , Σ ) {\displaystyle N(0,\Sigma )} から得られたとするとき、 精度行列 Θ = Σ − 1 {\displaystyle \Theta =\Sigma ^{-1}} を推定する。 グラフィカルラッソでは、以下の対数事後確率を最大化するような Θ ^ {\displaystyle {\hat {\Theta }}} を推定する: Θ ^ = argmax Θ ≥ 0 ( tr ( S Θ ) − log det ( Θ ) + λ ∑ j ≠ k | Θ j k | ) {\displaystyle {\hat {\Theta }}={\underset {\Theta \geq 0}{\operatorname {argmax} }}\left(\operatorname {tr} (S\Theta )-\log \det(\Theta )+\lambda \sum _{j\neq k}|\Theta _{jk}|\right)} ただし、 S {\displaystyle S} は標本共分散行列であり、 λ {\displaystyle \lambda } は正則化パラメータ。グラフィカルラッソの拡張として、定常過程としてモデル化できるデータを扱う拡張も提案されている。
※この「問題設定」の解説は、「グラフィカルラッソ」の解説の一部です。
「問題設定」を含む「グラフィカルラッソ」の記事については、「グラフィカルラッソ」の概要を参照ください。
問題設定
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2022/05/05 04:50 UTC 版)
MDP における基本的な問題設定は、現在の状態が s {\displaystyle s} が与えられたときに意思決定者の取る行動 a ∈ A {\displaystyle a\in A} を既定する政策 (policy) を求めることである。政策は通常 s , a {\displaystyle s,a} の条件付き分布 P ( a | s ) {\displaystyle P(a|s)} として規定され、状態 s {\displaystyle s} に 行動 a {\displaystyle a} を取る確率を π ( s , a ) {\displaystyle \pi (s,a)} と表記する。 政策を求める際に用いられるゴール(目的関数)は、典型的には現在時刻から無限区間先の未来までにおける「割引された」報酬の累積値が用いられる: ∑ t = 0 ∞ γ t r t + 1 where a t = π ( s t ) {\displaystyle \sum _{t=0}^{\infty }\gamma ^{t}r_{t+1}\quad {\text{where}}\ a_{t}=\pi (s_{t})} ここで γ ∈ [ 0 , 1 ] {\displaystyle \gamma \in [0,1]} は割引因子 (discount factor) と呼ばれる値であり、現在の報酬と未来の報酬との間における重要度 (importance) の差異を表している。状態が確率的に遷移することから上の値は確率変数となるため、通常はその期待値が用いられる。
※この「問題設定」の解説は、「マルコフ決定過程」の解説の一部です。
「問題設定」を含む「マルコフ決定過程」の記事については、「マルコフ決定過程」の概要を参照ください。
問題設定
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2022/07/25 10:18 UTC 版)
「ドイッチュ・ジョサのアルゴリズム」の記事における「問題設定」の解説
ドイッチュ・ジョサの問題では、オラクルと呼ばれるある関数 f : { 0 , 1 } n → { 0 , 1 } {\displaystyle f:\{0,1\}^{n}\rightarrow \{0,1\}} が実装されたブラックボックス量子コンピュータが与えられている。わかりやすく言えば、オラクルはn桁の2進数値を入力として受け取り、0または1を出力する。 ここで、関数 f {\displaystyle f} は定値 (すべての量子ビットが0 またはすべての量子ビットが1)であるか、均等 (量子ビットの丁度半数が1で、残りの半数が0)であることが保証されている。 問題は、オラクルを用いて関数が定値か均等かを決定することである。
※この「問題設定」の解説は、「ドイッチュ・ジョサのアルゴリズム」の解説の一部です。
「問題設定」を含む「ドイッチュ・ジョサのアルゴリズム」の記事については、「ドイッチュ・ジョサのアルゴリズム」の概要を参照ください。
- 問題設定のページへのリンク