ダミー変数についてとは? わかりやすく解説

Weblio 辞書 > 学問 > 統計学用語 > ダミー変数についての意味・解説 

ダミー変数について


 次ののようなデータがあるとき,従属変数独立変数一次式で完全に予測できる
   従属変数予測値 = 3 + 2 × 独立変数
従属変数 独立変数
5 1
7 2
9 3
11 4
13 5
15 6
17 7
19 8
21 9
23 10

ダミー変数について
 しかし,次のようなデータにおいては従属変数独立変数だけでは予測できない
従属変数 独立変数
5 1
7 2
9 3
11 4
20 5
15 6
17 7
19 8
21 9
23 10

ダミー変数について
 無理に直線回帰式に当てはめても,下図のようになるだけである。
ダミー変数について
 予測うまくいかない原因は,独立変数が 5 のときには,他の場合と違う「何らかの要因作用しているらしいということである。
 そこで,この「何らかの要因」を表す独立変数新たに導入する
 この変数は,「何らかの要因」が存在するときに 1,存在しないときには 0 という値をとるものとする
 すなわち,独立変数が 5 のときにこの変数は 1 となり,それ以外ときには 0 となる。
 このように二つの値のうちのどちらかをとる(特に 0 か 1 かいずれかの値をとる)ような変数ダミー変数と呼ぶ。
従属変数 独立変数 ダミー変数
5 1 0
7 2 0
9 3 0
11 4 0
20 5 1
15 6 0
17 7 0
19 8 0
21 9 0
23 10 0

 このデータに対して重回帰分析適用すると,以下のような結果得られる

偏回帰係数 標準誤差 t 値 P
定数項 3 2.44456E-15 1.22722E+15 6.2998E-104
独立変数 2 3.86518E-16 5.1744E+15 2.6592E-108
ダミー変数 7 3.70063E-15 1.89157E+15 3.048E-105

 予測式として書くと,
   従属変数予測値 = 3 + 2 × 独立変数 + 7 × ダミー変数
となる。
従属変数 独立変数 ダミー変数 予測 独立変数の分 ダミー変数の分
5 1 0 5 5 0
7 2 0 7 7 0
9 3 0 9 9 0
11 4 0 11 11 0
20 5 1 20 13 7
15 6 0 15 15 0
17 7 0 17 17 0
19 8 0 19 19 0
21 9 0 21 21 0
23 10 0 23 23 0

 独立変数が 5 のときにはダミー変数が 1 であり,
   従属変数予測値 = 3 + 2 × 独立変数 + 7 × ダミー変数
           = 3 + 2 × 5 + 7 × 1 = 20
になる。
すなわち,独立変数が 5 のときも,他のときと同じ予測式成り立つとすると,
   従属変数予測値 = 3 + 2 × 独立変数
            = 3 + 2 × 5 = 13
となるところが,このときに「ある要因働いた」ために +7効果生じたのである
 ダミー変数は 0 か 1 の値を取るのであるから,ダミー変数対す偏回帰係数 7 を掛けると,要因が働くときに +7働かないときには +0 ということになる。
ダミー変数について
 要因複数ある場合には,それぞれの要因対応するダミー変数一個ずつ考えればよい。
 以下の図では,独立変数が 5 のときのほか,8 のときにも別の要因作用しているようである。
ダミー変数について
従属変数 独立変数 ダミー変数 ダミー変数
5 1 0 0
7 2 0 0
9 3 0 0
11 4 0 0
20 5 1 0
15 6 0 0
17 7 0 0
16 8 0 1
21 9 0 0
23 10 0 0

 このデータに対して重回帰分析を行うと,次のような結果得られる

偏回帰係数
定数項 3
独立変数 2
ダミー変数 7
ダミー変数 -3

ダミー変数について
 このデータは,春夏秋冬四半期ごとのデータプロットしたものである。
 春を基準とすると紫の傾向線で示すような直線を引くことができる。この直線では,春に対す予測は完全に行える。夏と秋の予測については傾向線にプラスαが,冬の予測についてはマイナスαが必要である。
 予測必要なダミー変数は,夏に対すダミー変数秋に対すダミー変数,冬に対すダミー変数三つである。
従属変数 独立変数
3 1 0 0 0
16 2 1 0 0
13 3 0 1 0
6 4 0 0 1
15 5 0 0 0
28 6 1 0 0
25 7 0 1 0
18 8 0 0 1
27 9 0 0 0
40 10 1 0 0
37 11 0 1 0
30 12 0 0 1
39 13 0 0 0
52 14 1 0 0
49 15 0 1 0
42 16 0 0 1

 このデータ重回帰分析すると,以下のような結果得られる

偏回帰係数
定数項 -6.89644E-15
独立変数 3
10
4
-6

 すなわち,春のデータについて
   従属変数予測値 = 3 ×独立変数
となり,夏に対しては「予測値 = 3 ×独立変数」で得られる予測値に +10,秋は +4,冬は -6 という修正項がつくのである
 ちなみに上の予測は,
   従属変数予測値 = 定数項 + b1 × 独立変数 + b2 × 季節
ということになる。
 しかし,季節という変数が「春」,「夏」,「秋」,「冬」という 4 種類の値をとる「名義尺度」であるため,これでは重回帰分析使用することができない
 そこで,4 種類の値に対応して 4 個のダミー変数考えることができる。
 ところで,本当に 4 個のダミー変数が必要かというとそうではない。
 図でもわかるように,どれか一つ基準とすれば残りの値はその基準に対して±αということ表現できるので,結局ダミー変数名義尺度の取る値の種類より 1 個少なくてすむのである


 以下のようなデータについて回帰分析をしてみよう。ただし,独立変数順序尺度である。
独立変数 従属変数
1 1
2 3
3 7
4 15

 本来はこのような場合には解析を行うのは不適切であるが,むりやり実行する次のうになる独立変数1, 2, 3, 4 というのが間隔尺度ではないということをおいても,回帰うまくいっているとは思えない
ダミー変数について
 そこで,独立変数がとる 4 種類の値に対応する 3 個のダミー変数作成する
ダミー変数1 ダミー変数2 ダミー変数3 従属変数
0 0 0 1
1 0 0 3
0 1 0 7
0 0 1 15

 重回帰分析結果は以下のようになる。この重回帰式は,完全に 4 つデータ点を通る(決定係数は 1 である)。

偏回帰係数
定数項 1
ダミー変数1 2
ダミー変数2 6
ダミー変数3 14

 さて,重回帰式
   従属変数 = 1+(2×ダミー変数1)+(6×ダミー変数2)+(14×ダミー変数3)
であるが,たとえば,ダミー変数1は0 か 1 の値し取らないので,
   「2×ダミー変数1」というのは,変数1 が 0 か 2 しかとらないのである定義すると「重み(=1)×変数1」と同じである。同じように,変数2は 0 か 6,変数3 は 0 か 14 しかとらない変数とすると,結局
   従属変数 = 1+(1×変数1)+(1×変数2)+(1×変数3)
 そして,変数1,変数2,変数3 は同時に0 以外の値はとらないので,もとの変数が値 1 をとるときに 0,値 1 のときに 2,値 3 のときに 6,値 14 のときに 15 となるような新し独立変数考える。すなわち,
元の変数 新し変数 従属変数
1 0 1
2 2 3
3 6 7
4 14 15

のようになる
 このデータ重回帰分析適用すると,

偏回帰係数
定数項 1
新し変数 1

のようになり,この重回帰式単回帰式)は 4 つの点全てを通る(決定係数は 1 である)。
 ここで示したのは「数量化 I 類」の考え方同じになる。つまり,順序尺度の,たまたま適当な数値として表されに過ぎない 1, 2, 3, 4数量化して,従属変数直線関係になるように 0, 2, 6, 14 という数値付与したのである



英和和英テキスト翻訳>> Weblio翻訳
英語⇒日本語日本語⇒英語
  

辞書ショートカット

すべての辞書の索引

ダミー変数についてのお隣キーワード
検索ランキング

   

英語⇒日本語
日本語⇒英語
   



ダミー変数についてのページの著作権
Weblio 辞書 情報提供元は 参加元一覧 にて確認できます。

   
統計学用語辞典統計学用語辞典
Copyright (C) 2025 統計学用語辞典 All rights reserved.

©2025 GRAS Group, Inc.RSS