ノンパラメトリック手法
(ノンパラメトリック推定 から転送)
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2024/06/26 06:32 UTC 版)
ノンパラメトリック(英: non-parametric)な手法とは、統計学において、少数のパラメータ(母数: 母集団を規定する量)で表現されるモデルや確率分布を使用する物をパラメトリックな手法と呼ぶが、そうで無い手法をノンパラメトリックな手法という。回帰・分類・密度推定・仮説検定などそれぞれの統計学の分野でノンパラメトリックな手法がある。ノンパラメトリック検定は、特定のパラメトリックな確率分布に依存しない仮説検定 (distribution-free test) である[1]。
適用と目的
ノンパラメトリック手法は順序尺度、例えばレストランの人気ランキングなどを分析する際によく使われる。ランキングは順序を表してはいるものの、具体的な数値(比率尺度や間隔尺度)は提供しない尺度水準である。尺度水準という点で、ノンパラメトリック手法は順序尺度に基づくものである。データの順序尺度に基づいてソートした結果があれば、経験累積分布関数を作ることができ、ノンパラメトリック検定ではそれを利用する。
ノンパラメトリック手法はパラメトリック手法と比べて、母集団の分布などの前提を必要としない。そのためノンパラメトリック手法は広きにわたり適用できる(汎用性がある)。事前に詳しい事が解っていないデータや、社会科学や心理学におけるアンケート調査の分析などにおいて、ノンパラメトリック手法は広く使用されている。
ノンパラメトリック検定は、対応するパラメトリック検定(もし前提条件が満たされていれば)と比べて「パワー」が弱い。つまりパラメトリック検定と同じ「信頼」を得ようとした場合、ノンパラメトリック手法ではより多くの標本数を要することになる。パラメトリックとノンパラメトリックには、頑強性と効率性の間でのトレードオフが生じている訳である。ただし、例えば正規分布の場合、最善はパラメトリック検定のt検定であるが、ノンパラメトリック検定のウィルコクソンの符号順位検定を用いても、必要なデータ数は カテゴリ
ノンパラメトリック推定
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2019/04/20 04:43 UTC 版)
「回帰不連続デザイン」の記事における「ノンパラメトリック推定」の解説
回帰不連続デザインの文脈で最も一般的なノンパラメトリック推定方法は局所線形回帰である。それは以下のような線形回帰式で表される。 Y = α + τ D + β 1 ( X − c ) + β 2 D ( X − c ) + ε {\displaystyle Y=\alpha +\tau D+\beta _{1}(X-c)+\beta _{2}D(X-c)+\varepsilon } ここで c − h ≤ X ≤ c + h {\displaystyle c-h\leq X\leq c+h} であり、 c {\displaystyle c} は処置のカットオフ点、 D {\displaystyle D} は X ≥ c {\displaystyle X\geq c} ならば1、 X ≤ c {\displaystyle X\leq c} ならば0であるバイナリ変数、そして h {\displaystyle h} は使用されるデータのバンド幅である。カットオフの両側でデータにフィットする傾きと切片は異なる。典型的には、矩形カーネルか三角カーネルが用いられる。三角カーネルの方が好まれるが、矩形カーネルはより直感的な解釈ができる。 回帰不連続デザインによるノンパラメトリックな推定法を用いる大きな利点は、カットオフ付近のデータによる推定量が得られることであり、それは直感的にも分かりやすい。カットオフ付近での非連続性を推定する為に、カットオフ点から離れたデータを用いることによって生じたバイアスを減らす効果もある。より正確に言えば、局所線形回帰はバイアスに関する良い性質と収束に関する良い性質を持つために好まれる。しかしながら、パラメトリックな方法とノンパラメトリックな方法の両方を使うことは、それが可能ならば、推定結果が推定手法に過度に依存しないことを議論するための有益な方法となる。
※この「ノンパラメトリック推定」の解説は、「回帰不連続デザイン」の解説の一部です。
「ノンパラメトリック推定」を含む「回帰不連続デザイン」の記事については、「回帰不連続デザイン」の概要を参照ください。
- ノンパラメトリック推定のページへのリンク