マローズのCp
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2024/01/20 19:03 UTC 版)
MallowsのCp[1] [2]は、最小二乗法によって推定された回帰モデルの適合度を評価するために用いられる指標である。名前はコリン・リングウッド・マローズにちなむ。モデル選択を行う際に用いられ、ある複数の変数から出力を予測することができるとき、その中から一部の変数を選んで最も良いモデルを見つけることが目的である。Cpの値が小さいほど、モデルが比較的正確であることを意味する。
マローズのCpは、ガウス線形回帰という特殊な場合において赤池情報量基準に相当することが示されている。[3]
定義と性質
マローズのCpは、過剰適合の問題に対する方法である。一般にモデルの変数が増えれば増えるほど、残差平方和などのモデル適合度の指標は常に小さくなる。したがって、残差平方和が最小となるモデルを選択する場合、常にすべての変数を含むモデルが選択されてしまう。代わりに、データのサンプルで計算されたC p統計は、 母集団ターゲットとして平均二乗予測誤差 (MSPE)を推定する。
- マローズのCpのページへのリンク