誤差と残差とは? わかりやすく解説

誤差と残差

出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2021/04/11 01:18 UTC 版)

スチューデント化残差」の記事における「誤差と残差」の解説

誤差と残差の違い理解することは非常に重要である。簡単な線形回帰モデル Y i = α 0 + α 1 x i + ε i , {\displaystyle Y_{i}=\alpha _{0}+\alpha _{1}x_{i}+\varepsilon _{i},} を考えよう。ここで「誤差」 εi , i = 1, ... , n は統計的に独立 ですべて同じ分散 σ2 をもつものとする残差は真でなく観測できない誤差ではなく観測可能なデータに基く誤差推定値である。最小二乗法で α0 と α1を推定したとき、(誤差異なり残差は、独立ではありえない。なぜなら残差は以下の 2 つ拘束条件満たすからである。 ∑ i = 1 n ε ^ i = 0 , ∑ i = 1 n ε ^ i x i = 0 {\displaystyle \sum _{i=1}^{n}{\widehat {\varepsilon }}_{i}=0,\qquad \sum _{i=1}^{n}{\widehat {\varepsilon }}_{i}x_{i}=0} ここで ε i {\displaystyle \varepsilon _{i}} は i 番目の誤差、 ε ^ i {\displaystyle {\widehat {\varepsilon }}_{i}} は i 番目の残差を表す。 さらに、誤差異なり残差は、同じ分散持たない分散対応する x-値が x-値の平均から遠ざかるにつれ減少する。これは回帰分析予測値が、説明変数分布する領域の端の方であるほどより影響を受けることと、データ回帰係数に及ぼす影響力が高いほど変わりやすいということよるものである。これは説明変数分布の端の方のデータにおける残差はまた傾き推定値によって大きく影響を受けるが、説明変数分布平均辺りデータにおける残差傾きによる影響をあまり受けないということによっても確認できる真の誤差分散がすべて等しいにもかかわらず残差分散異なという事実は、スチューデント化が必要な主要な理由である。これは単に母集団パラメータ平均標準偏差)が未知であるという問題ではなく一変分布についての点推定のように同じ残差分布データ共有するのとは異なり回帰分析するということ異なるデータポイントに対して異な残差分布生み出してしまうということである。

※この「誤差と残差」の解説は、「スチューデント化残差」の解説の一部です。
「誤差と残差」を含む「スチューデント化残差」の記事については、「スチューデント化残差」の概要を参照ください。

ウィキペディア小見出し辞書の「誤差と残差」の項目はプログラムで機械的に意味や本文を生成しているため、不適切な項目が含まれていることもあります。ご了承くださいませ。 お問い合わせ



英和和英テキスト翻訳>> Weblio翻訳
英語⇒日本語日本語⇒英語
  

辞書ショートカット

すべての辞書の索引

「誤差と残差」の関連用語

誤差と残差のお隣キーワード
検索ランキング

   

英語⇒日本語
日本語⇒英語
   



誤差と残差のページの著作権
Weblio 辞書 情報提供元は 参加元一覧 にて確認できます。

   
ウィキペディアウィキペディア
Text is available under GNU Free Documentation License (GFDL).
Weblio辞書に掲載されている「ウィキペディア小見出し辞書」の記事は、Wikipediaのスチューデント化残差 (改訂履歴)の記事を複製、再配布したものにあたり、GNU Free Documentation Licenseというライセンスの下で提供されています。

©2025 GRAS Group, Inc.RSS