多重共線性とは? わかりやすく解説

Weblio 辞書 > 同じ種類の言葉 > 言葉 > 程度 > 多重 > 多重共線性の意味・解説 

多重共線性 multicollinearity

 通称マルチコ」。独立変数間に非常に強い相関があったり,一次従属変数関係がある場合には,解析不可能(「逆行列が求まりません」というエラーメッセージ出力されるであったり,たとえ結果が求まったとしてもその信頼性は低い。このような場合に多重共線性があると言われる
詳しくは,重回帰分析参照のこと。

多重共線性


 変数選択行わない場合には,独立変数相互間に相関の高いものは含めないほうがよい。
 もし,それらの中に独立でないものが含まれていると( 例え変数 A,B とその合計値 C = A + B が共に含まれていると )分析失敗する
 場合によっては,各独立変数従属変数との相関係数符号と,偏回帰係数符号一致しない場合生ずる。これは,「予測を行う」という観点から偏回帰係数定められるので,重回帰式含まれ変数相互間の関連符号決められるためである。このようなことが起きるのは,独立変数間に相関の高いものが混ざっていることが原因である( ある変数予測しすぎた部分別の変数打消しているような場合がある )。しかし,このようなことは因果関係考え上で不都合なので,符号一致しない独立変数除いた重回帰式探索するとよいであろう
 独立変数間の相関係数行列逆行列要素を rii としたとき,
多重共線性
は,独立変数 i を残り独立変数予測するときの重相関係数になっている。したがって,この数値大きいものは独立変数としてふさわしくないことを表す。
 これと同じことであるが 1 / riiトレランス,rii分散拡大係数 と呼ぶことがある。この場合には,トレランスが低い( 分散拡大係数大きい )独立変数は除く方がよいことを表す。

多重共線性

出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2024/03/24 09:45 UTC 版)

統計学において、多重共線性(たじゅうきょうせんせい、英語: Multicollinearity、単に共線性とも略される)とは、重回帰モデルにおいて、説明変数の中に、相関係数が高い組み合わせがあることをいう(例: 体重とBMI)。重回帰分析の際、説明変数を増やすほど決定係数が高くなりやすいために、より多くの説明変数を入れ、多重共線性を起こす可能性がある[1]。このような状況では、モデルやデータの小さな変化に応じて、重回帰の係数推定値が不規則に変化しうる。多重共線性は、少なくともサンプルデータセット内では、全体としてのモデルの予測力または信頼性を低下させず、個々の予測変数に関する計算にのみ影響を与える。つまり、共線性予測変数を持つ多変量回帰モデルは、予測変数の全体がどれだけよく結果変数を予測するかを示すことができるが、個々の予測変数に関する有効な結果、またはどの予測変数が不要かに関しては有効な結果を与えないことも考えられる。


  1. ^ 井上俊夫, 岩崎祐一, 加藤剛, 熊倉隆二『わかりやすい薬学系の統計学入門』小林賢, 佐古兼一 編(第9版)、講談社、2020年、106頁。ISBN 978-4-06-156312-4 
  2. ^ O’Brien, R. M. (2007). “A Caution Regarding Rules of Thumb for Variance Inflation Factors”. Quality & Quantity 41 (5): 673–690. doi:10.1007/s11135-006-9018-6. 
  3. ^ Farrar, Donald E.; Glauber, Robert R. (1967). “Multicollinearity in Regression Analysis: The Problem Revisited”. Review of Economics and Statistics 49 (1): 92–107. doi:10.2307/1937887. hdl:1721.1/48530. JSTOR 1937887. https://doi.org/10.2307/1937887. 
  4. ^ Wichers, C. Robert (1975). “The Detection of Multicollinearity: A Comment”. Review of Economics and Statistics 57 (3): 366–368. doi:10.2307/1923926. JSTOR 1923926. 
  5. ^ Kumar, T. Krishna (1975). “Multicollinearity in Regression Analysis”. Review of Economics and Statistics 57 (3): 365–366. doi:10.2307/1923925. JSTOR 1923925. 
  6. ^ O'Hagan, John; McCabe, Brendan (1975). “Tests for the Severity of Multicolinearity in Regression Analysis: A Comment”. Review of Economics and Statistics 57 (3): 368–370. doi:10.2307/1923927. JSTOR 1923927. 
  7. ^ a b Belsley, David (1991). Conditioning Diagnostics: Collinearity and Weak Data in Regression. New York: Wiley. ISBN 978-0-471-52889-0. https://archive.org/details/conditioningdiag0000bels 
  8. ^ R言語用のパッケージがある。:perturb: Tools for evaluating collinearity”. R Project. 2015年7月18日 13:55閲覧。
  9. ^ Chatterjee, S.; Hadi, A. S.; Price, B. (2000). Regression Analysis by Example (Third ed.). John Wiley and Sons. ISBN 978-0-471-31946-7. https://archive.org/details/regressionanalys0000chat_q4i3 
  10. ^ Gujarati, Damodar (2009). “Multicollinearity: what happens if the regressors are correlated?”. Basic Econometrics (4th ed.). McGraw−Hill. pp. 363. https://archive.org/details/basiceconometric05edguja 
  11. ^ 12.6 - Reducing Structural Multicollinearity |。STAT 501”. newonlinecourses.science.psu.edu. 2019年3月16日閲覧。
  12. ^ Lipovestky; Conklin (2001). “Analysis of Regression in Game Theory Approach”. Applied Stochastic Models in Business and Industry 17 (4): 319–330. doi:10.1002/asmb.446. 
  13. ^ 詳細な議論についてはこちら:Van Den Poel, D.; Larivière, B. (2004). “Customer attrition analysis for financial services using proportional hazard models”. European Journal of Operational Research 157: 196–217. doi:10.1016/S0377-2217(03)00069-9. 
  14. ^ Kock, N.; Lynn, G. S. (2012). “Lateral collinearity and misleading results in variance-based SEM: An illustration and recommendations”. Journal of the Association for Information Systems 13 (7): 546–580. doi:10.17705/1jais.00302. http://www.scriptwarp.com/warppls/pubs/Kock_Lynn_2012.pdf. 


「多重共線性」の続きの解説一覧

多重共線性

出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2022/03/27 14:50 UTC 版)

重回帰分析」の記事における「多重共線性」の解説

「多重共線性」も参照 独立変数説明変数)を選択する際、マーケティングアンケートでよく使う一般的な重回帰場合複数説明変数同士は強い相関がないという仮定入っている。そのため、説明変数同士関連性の高い場合一般化線形モデルでは多重共線性と呼ばれる状態になるため、係数直感反する値になることがある例えば、小学校での定期テスト得点から重回帰分析する場合理科点数従属変数に、数学国語とを説明変数にした場合数学増える理科点数増え国語点数高ければ理科点数が減るといった意味の係数が出ることがある。これは数学国語との点数の間に強い相関がある(一般に、どちらの成績学習習慣知能影響強く受ける)ことで起こりうる。この場合のように説明変数間の相関が高いと係数不安定になりやすい。 実務的対応としては、一方除いて分析するのが最も手軽である。また、数学国語平均点と、数学国語得点の差というように和と差に数字加工すると、この2つ相関がたいてい低く、かつ解釈しやすい。数学国語得点の差は、数学の方が高い生徒の方が理科点数が高い傾向があるというように理解できるためである。ただし、このような正の相関を持つ変数同士の差得点は元の変数よりも信頼性落ちるので、サンプル数を増やすなどの対応が求められるまた、適切な予測力を実質的に持たない変数であっても説明変数加えると予測式自体寄与率決定係数)R2は上がることが多い。そのため、単なるR2ではなくその分調整した修正R2を参照するステップワイズ法(英語版)等で投入する説明変数取捨選択するAICを見るなどの対応が求められる

※この「多重共線性」の解説は、「重回帰分析」の解説の一部です。
「多重共線性」を含む「重回帰分析」の記事については、「重回帰分析」の概要を参照ください。

ウィキペディア小見出し辞書の「多重共線性」の項目はプログラムで機械的に意味や本文を生成しているため、不適切な項目が含まれていることもあります。ご了承くださいませ。 お問い合わせ



多重共線性と同じ種類の言葉


英和和英テキスト翻訳>> Weblio翻訳
英語⇒日本語日本語⇒英語
  

辞書ショートカット

すべての辞書の索引

「多重共線性」の関連用語

多重共線性のお隣キーワード
検索ランキング

   

英語⇒日本語
日本語⇒英語
   



多重共線性のページの著作権
Weblio 辞書 情報提供元は 参加元一覧 にて確認できます。

   
統計学用語辞典統計学用語辞典
Copyright (C) 2024 統計学用語辞典 All rights reserved.
ウィキペディアウィキペディア
All text is available under the terms of the GNU Free Documentation License.
この記事は、ウィキペディアの多重共線性 (改訂履歴)の記事を複製、再配布したものにあたり、GNU Free Documentation Licenseというライセンスの下で提供されています。 Weblio辞書に掲載されているウィキペディアの記事も、全てGNU Free Documentation Licenseの元に提供されております。
ウィキペディアウィキペディア
Text is available under GNU Free Documentation License (GFDL).
Weblio辞書に掲載されている「ウィキペディア小見出し辞書」の記事は、Wikipediaの重回帰分析 (改訂履歴)の記事を複製、再配布したものにあたり、GNU Free Documentation Licenseというライセンスの下で提供されています。

©2024 GRAS Group, Inc.RSS