ブートストラップ法ブートストラップ法の概要

概要

ブートストラップ法は母集団の推定量（分散など）の性質を、近似分布にしたがって標本化したときの性質を計算することで推定する手法である。近似分布としては、測定値から求められる経験分布を用いるのが標準的である。また仮説検定に使う場合もある。仮定される分布が疑わしい場合や、パラメトリックな仮定が不可能ないし非常に複雑な計算を必要とするような場合に、パラメトリックな仮定に基づく推計の代わりに用いられる。

ブートストラップ法の利点は解析的な手法と比べて非常に単純なことである。母集団分布の複雑なパラメータ（パーセンタイル点、割合、オッズ比、相関係数など）の複雑な推定関数に対して標準誤差や信頼区間を求めるために、単にブートストラップ標本を適用するだけで済む。

一方ブートストラップ法の欠点として、漸近的に一致する場合には有限標本が保証されず、楽観的になる傾向がある。

例: フィッシャーのアヤメ

この手法の基本概念と価値を示すため、やや人工的な例を用いる。フィッシャーによる有名なアヤメの計測値（Iris flower data setを参照）を用い、iris-virginica（アイリス・バージニカ）と iris-versicolor（アイリス・バージカラー）の2種を判別するモデルを構築することを考える。

この2種を、がく片の長さのみを説明変数として判別するロジスティック回帰モデルを考え、最尤法を用いると、次表のとおりパラメータの最尤推定値と標準誤差が得られる。

説明変数	最尤推定値	標準誤差
切片	-12.57	2.91
がく片長	2.01	0.47

モデル式

2.01×がく片長-12.57≧0のとき virginica と判別

2.01×がく片長-12.57＜0のとき versicolorと判別

（このモデル式では、virginica は標本50個中37個、versicolor は50個中36個が正しく判別されている。）

最尤推定値は漸近的には正規分布することが知られている。今回の標本50個ずつのデータで出した最尤推定値（切片:-12.57、がく片長の係数:2.01）が、どの程度正規分布に近いか、ブートストラップ法で以下のように調べることができる。

元データからn個の標本を復元抽出する。このときnは元データの標本数である。
最尤法でロジスティック回帰モデルに当てはめる。
このブートストラップ抽出を何度も（ $B$

ブートストラップ法ブートストラップ法の概要