統計モデル・生成モデルとしての表現
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2022/06/15 01:42 UTC 版)
「自己回帰モデル」の記事における「統計モデル・生成モデルとしての表現」の解説
上記のように自己回帰モデルは、決定論的/deterministicな線形変換に、確率的/probabilisticなブレ(確率項)が線形に追加されるモデルである。別の表現として、自己回帰モデルは統計モデル(生成モデル)で表すことができる。 自己回帰モデル AR(n) を考えるとし、因果関係を持つ時点 t から時刻 t-n までの値の組を X n = ( x t , x t − 1 , . . . , x t − n ) {\displaystyle X_{n}=(x_{t},x_{t-1},...,x_{t-n})} とする。Xn の確率分布すなわち xt ~ xt-nの同時確率 pAR(n) は p A R ( n ) ( X n ) = p A R ( n ) ( x t , x t − 1 , . . . , x t − n ) {\displaystyle p_{AR(n)}(X_{n})=p_{AR(n)}(x_{t},x_{t-1},...,x_{t-n})} であり、条件付き確率の定義を用いる(確率の連鎖律(英語版))と p A R ( n ) ( X n ) = p ( x t | x t − 1 , . . . , x t − n ) ⋅ p ( x t − 1 , . . . , x t − n ) = . . . = ∏ i = 0 n p ( x t − i | ⋂ j = i + 1 n x t − j ) {\displaystyle p_{AR(n)}(X_{n})=p(x_{t}|x_{t-1},...,x_{t-n})\cdot p(x_{t-1},...,x_{t-n})=...=\prod _{i=0}^{n}p(x_{t-i}|\bigcap _{j=i+1}^{n}x_{t-j})} となる(条件付確率分布の積、因子分解の積)。モデルのn次自己回帰性(== 過去方向にn次までしか依存しない)より xt-n はそれ単体で分布が定まる。 p(xt-k|xt-k-1, xt-k-2, ..., xt-n)を考えると(線形変換・ガウス確率項)ARモデルは確率項がガウス分布に従い、その平均値統計量は決定論的な線形変換で決まるため、 p ( x t − k | x t − k − 1 , . . . , x t − n ) = N ( x t − k | w t − k − 1 ⋅ x t − k − 1 , σ ) {\displaystyle p(x_{t-k}|x_{t-k-1},...,x_{t-n})=N(x_{t-k}|w_{t-k-1}\cdot x_{t-k-1},\sigma )} であるといえる。xt-k-1より過去の系列の情報はすべてxt-k-1の実現値として集約されている。 以上をまとめると、n次自己回帰モデルは統計モデル/生成モデルとして以下のように定式化できる。 X n := ( x t , x t − 1 , . . . , x t − n ) {\displaystyle X_{n}:=(x_{t},x_{t-1},...,x_{t-n})} x t − k ∼ p ( x t − k | x t − k − 1 , . . . , x t − n ) = N ( x t − k | w t − k − 1 ⋅ x t − k − 1 , σ ) {\displaystyle x_{t-k}\thicksim p(x_{t-k}|x_{t-k-1},...,x_{t-n})=N(x_{t-k}|w_{t-k-1}\cdot x_{t-k-1},\sigma )} ・・・(1) X n ∼ p A R ( n ) ( X n ) = ( ∏ i = 0 n − 1 p ( x t − i | ⋂ j = i + 1 n x t − j ) ) ⋅ p ( x t − n ) = ( ∏ i = 0 n − 1 N ( x t − i | w t − i − 1 ⋅ x t − i − 1 , σ ) ) ⋅ p ( x t − n ) {\displaystyle X_{n}\thicksim p_{AR(n)}(X_{n})=(\prod _{i=0}^{n-1}p(x_{t-i}|\bigcap _{j=i+1}^{n}x_{t-j}))\cdot p(x_{t-n})=(\prod _{i=0}^{n-1}N(x_{t-i}|w_{t-i-1}\cdot x_{t-i-1},\sigma ))\cdot p(x_{t-n})} 確率分布が計算可能なため、データ(標本)が与えられた際の母集団パラメータを最尤推定を用いて推定することができる。また生成モデルであるため、モデルに従う系列の生成(例: 現時刻までのデータに基づいた将来系列の生成)が可能である。もし音声を時系列とみなせば音声合成をおこなうことが可能になる。
※この「統計モデル・生成モデルとしての表現」の解説は、「自己回帰モデル」の解説の一部です。
「統計モデル・生成モデルとしての表現」を含む「自己回帰モデル」の記事については、「自己回帰モデル」の概要を参照ください。
- 統計モデル生成モデルとしての表現のページへのリンク