情報幾何学
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2025/02/23 14:29 UTC 版)
情報幾何学(じょうほうきかがく、英: information geometry、仏: géométrie de l’information、独: Informationsgeometrie、略称: IG[1])とは、確率分布を要素とする統計モデルに関する微分幾何学的研究[2]のことであり、狭義には双対アフィン接続の微分幾何学[3]を指す。「数理統計学の微分幾何学化」[4]や「統計的推論の幾何学的方法論」[5]や「情報理論における微分幾何を用いた定式化」[6]と表現されるように、情報幾何学は統計学・情報理論・確率理論(大偏差理論)にまたがる[7]学際的な分野である。
概要
情報幾何学の理論的な枠組みは統計学の言葉を必要とせず、純粋な微分幾何学の概念のみで定式化できる。
情報幾何学
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2017/09/12 04:16 UTC 版)
点 β {\displaystyle \beta } は空間を形成すると解釈され、特にこの空間は多様体となる。この多様体はどのような構造を持つかという疑問が当然に起きる。これを情報幾何学(英語版)という。 ラグランジュ未定乗数に関する多重微分は、半正定値の分散共分散行列を引き起こす。 g i j ( β ) = ∂ 2 ∂ β i ∂ β j ( − log Z ( β ) ) = ⟨ ( H i − ⟨ H i ⟩ ) ( H j − ⟨ H j ) ⟩ {\displaystyle g_{ij}(\beta )={\frac {\partial ^{2}}{\partial \beta ^{i}\partial \beta ^{j}}}\left(-\log Z(\beta )\right)=\langle \left(H_{i}-\langle H_{i}\rangle \right)\left(H_{j}-\langle H_{j}\right)\rangle } この行列は半正定値行列で、計量テンソルと解釈され、リーマン計量と見なせる。このことにより、上記の方法で計量を持つラグランジュ未定乗数の空間は、リーマン多様体となることが分かる。 この多様体の研究は「情報幾何学」と呼ばれ、上記の計量はフィッシャー情報計量(英語版)と呼ばれる。上記では β {\displaystyle \beta } は多様体上の座標である。上記の定義と、これに動機付けられた単純化されたフィッシャー情報とを比較することは面白いことかもしれない。 上記がフィッシャー情報計量を定義することは、期待値を明示的に代入することにより容易に理解することができる。 g i j ( β ) = ⟨ ( H i − ⟨ H i ⟩ ) ( H j − ⟨ H j ) ⟩ = ∑ x P ( x ) ( H i − ⟨ H i ⟩ ) ( H j − ⟨ H j ⟩ ) = ∑ x P ( x ) ( H i + ∂ log Z ∂ β i ) ( H j + ∂ log Z ∂ β j ) = ∑ x P ( x ) ∂ log P ( x ) ∂ β i ∂ log P ( x ) ∂ β j {\displaystyle {\begin{aligned}g_{ij}(\beta )&=\langle \left(H_{i}-\langle H_{i}\rangle \right)\left(H_{j}-\langle H_{j}\right)\rangle \\&=\sum _{x}P(x)\left(H_{i}-\langle H_{i}\rangle \right)\left(H_{j}-\langle H_{j}\rangle \right)\\&=\sum _{x}P(x)\left(H_{i}+{\frac {\partial \log Z}{\partial \beta _{i}}}\right)\left(H_{j}+{\frac {\partial \log Z}{\partial \beta _{j}}}\right)\\&=\sum _{x}P(x){\frac {\partial \log P(x)}{\partial \beta ^{i}}}{\frac {\partial \log P(x)}{\partial \beta ^{j}}}\\\end{aligned}}} ここに、 P ( x 1 , x 2 , … ) {\displaystyle P(x_{1},x_{2},\dots )} を P ( x ) {\displaystyle P(x)} と記すことして、和は確率変数 X k {\displaystyle X_{k}} のすべてを渡るものとする。もちろん、連続した値をとる確率変数に対して、和は積分に置き換わる。 奇妙なことに、フィッシャー情報計量ついての主要な記事に記載されているように、適当に変数変換した後ではフィッシャー情報計量(英語版)は、平坦なユークリッド計量として理解することもできる。 β {\displaystyle \beta } が複素数であるときには、結果として現れる計量はフビニ・スタディ計量である。純粋状態に代って、混合状態で書くときは、ビュレス計量(英語版)として知られている。
※この「情報幾何学」の解説は、「分配函数 (数学)」の解説の一部です。
「情報幾何学」を含む「分配函数 (数学)」の記事については、「分配函数 (数学)」の概要を参照ください。
- 情報幾何学のページへのリンク