統計的識別不能
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2020/01/08 05:23 UTC 版)
A {\displaystyle A} 、 B {\displaystyle B} を確率変数とする。 A {\displaystyle A} と B {\displaystyle B} との統計的距離を ∑ x ∈ { 0 , 1 } k | P r ( A = x ) − P r ( B = x ) | {\displaystyle \sum _{x\in \{0,1\}^{k}}|Pr(A=x)-Pr(B=x)|} により定義する。 X k {\displaystyle X_{k}} と Y k {\displaystyle Y_{k}} との統計的距離が、 k {\displaystyle k} に対して無視できるとき、すなわち任意の多項式 P {\displaystyle P} に対し、ある k 0 {\displaystyle k_{0}} があって任意の k > k 0 {\displaystyle k>k_{0}} に対し、 ∑ x ∈ { 0 , 1 } k | P r ( X k = x ) − P r ( Y k = x ) | < 1 / P ( k ) {\displaystyle \sum _{x\in \{0,1\}^{k}}|Pr(X_{k}=x)-Pr(Y_{k}=x)|<1/P(k)} となる時、族 { X k } k ∈ N {\displaystyle \{X_{k}\}_{k\in N}} と { Y k } k ∈ N {\displaystyle \{Y_{k}\}_{k\in N}} は統計的識別不能であるという。 二つの確率変数を見分けたい人が、いずれかの確率変数(の確率分布)によって選ばれた値を次々に観測し続けて、見分けることを考えよう。二つの確率分布が大きく異なる場合、観測値の頻度分布を求めることで、どちらの確率分布であるのかを見分けることができるだろう。逆に、確率分布がほとんど同じ場合、多くの値を観測したとしても見分けはつきにくい。統計的識別不可能は、多項式個の値を観測しても見分けがつかないことを意味する。 例: 確率変数 X k {\displaystyle X_{k}} :公正なコインを k {\displaystyle k} 回ふる、という実験の結果。コインの表が出たら1、裏が出たら0、として、 k {\displaystyle k} 個の0,1列で表現する。 確率変数 Z k {\displaystyle Z_{k}} : X k {\displaystyle X_{k}} と同じ実験をするが、 k {\displaystyle k} 回続けて裏が出たら、最初からやり直すという実験の結果。 Z k {\displaystyle Z_{k}} では、0が k {\displaystyle k} 個並んだものは生じず( P r [ Z k = 0000...0 ] = 0 {\displaystyle Pr[Z_{k}=0000...0]=0} )、それ以外の k {\displaystyle k} ビット列が確率 1 / ( 2 k − 1 ) {\displaystyle 1/(2^{k}-1)} で生じる。よって、 X k {\displaystyle X_{k}} と Y k {\displaystyle Y_{k}} の統計的距離は ( 2 k − 1 ) × | 1 / 2 k − 1 / ( 2 k − 1 ) | + | 1 / 2 k − 0 | = 1 / 2 k − 1 {\displaystyle (2^{k}-1)\times |1/2^{k}-1/(2^{k}-1)|+|1/2^{k}-0|=1/2^{k-1}} である。よって、 X = { X k } k {\displaystyle X=\{X_{k}\}_{k}} と Z = { Z k } k {\displaystyle Z=\{Z_{k}\}_{k}} は統計的識別不能である。
※この「統計的識別不能」の解説は、「識別不能」の解説の一部です。
「統計的識別不能」を含む「識別不能」の記事については、「識別不能」の概要を参照ください。
- 統計的識別不能のページへのリンク