分析の例
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2021/05/18 15:02 UTC 版)
例としてドッグショーに出品される犬について、その特徴に基づいて犬の体重を予測することを考える。ドッグショーとは純血犬種の品評会であり、その犬種の基本的な犬種標準(スタンダード)に最も近いことを競うものである。 ドッグショーに出品される全部の犬の体重のヒストグラムは、かなり複雑なものになる。犬を特徴に基づきグループ分けすることで、体重の分布を予測する。グループ分けが上手くいったときには(a)各グループの分散が小さく(グループが比較的均質さを意味する)、(b)各グループの平均値が異なる(2つのグループの平均値が同じであればグループ分けが意味をなしていない)。 ・若い犬と年老いた犬、短毛の犬と長毛の犬という2つの2値グループの積(相互作用)によって犬をグループ化することを考える。⇒ あまり予測として役に立たなさそう。このとき各グループ内の犬の体重分布は比較的大きな分散を持ち、平均値はグループ間で非常によく似ている。これらの特徴で犬をグループ化しても、犬の体重の変動を説明する効果的な方法にはならない。 ・体重分布をペット犬と作業犬、運動量の少ない犬と多い犬でグループ化することを考える。⇒ ある程度うまくいきそう。最も重い犬達は、大きくて強い作業犬種である可能性が高く、ペットとして飼われている犬種は小さくて軽い傾向がある。分散は1つ目のケースよりもかなり小さく、グループ間での平均値の差もよりはっきりする。しかし分布の重なりは依然大きく、予測の精度はまだ低い。 ・体重を犬種でグループ化することを考える。⇒非常によく予測が当てはまりそう。チワワはみんな軽く、セントバーナードは総じて重い。セッターとイングリッシュ・ポインターで体重の違うと言っても、直感的な説明では説得力に欠くとき、分散分析を用いることで論理的に違うことを説明できる。
※この「分析の例」の解説は、「分散分析」の解説の一部です。
「分析の例」を含む「分散分析」の記事については、「分散分析」の概要を参照ください。
- 分析の例のページへのリンク