非復元抽出による最大値の推定
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2019/03/31 05:59 UTC 版)
「離散一様分布」の記事における「非復元抽出による最大値の推定」の解説
整数 1, 2, …, N から k 個の標本が非復元抽出され、離散一様分布と同様に、標本の抽出のされ方に整数による差はないとする。ここで未知の最大値 N を推定する問題が生じる。このような問題を一般に German tank problem(ドイツ戦車問題)と呼び、第二次世界大戦中のドイツでの戦車生産数の最大値を推定するという問題に由来する。 最大値のUMVU推定によると、次のようになる。 N ^ = k + 1 k m − 1 = m + m k − 1 {\displaystyle {\hat {N}}={\frac {k+1}{k}}m-1=m+{\frac {m}{k}}-1} ここで m は標本内の最大値、k は標本数である。これは maximum spacing estimation の非常に単純な例と見ることもできる。 この式は直観的に次のように理解できる。 「標本の最大値に観測された標本値の平均間隔を加える」 この間隔は標本の最大値の負のバイアスを補填するよう加算され、母集団の最大値の推定とする。 この分散は次のようになる。 1 k ( N − k ) ( N + 1 ) ( k + 2 ) ≈ N 2 k 2 for small samples k ≪ N {\displaystyle {\frac {1}{k}}{\frac {(N-k)(N+1)}{(k+2)}}\approx {\frac {N^{2}}{k^{2}}}{\text{ for small samples }}k\ll N} つまり標準偏差は約 N/k で(母集団の)標本間の間隔の平均であり、上の m/k に似ている。 標本の最大値は母集団の最大値の最尤推定量だが、これまで述べたようにバイアスがかかっている。 標本が数として捉えられず、単に識別可能あるいは標識を付与できるなら、母集団の大きさの推定を標識再捕獲法で行うことができる。
※この「非復元抽出による最大値の推定」の解説は、「離散一様分布」の解説の一部です。
「非復元抽出による最大値の推定」を含む「離散一様分布」の記事については、「離散一様分布」の概要を参照ください。
- 非復元抽出による最大値の推定のページへのリンク