マルチバリエイト分析
多変量解析 multi-variate analysis
多変量解析
複数の特性値に対してデータの特徴を要約し、目的に応じたデータの統合化を行う手法。いろいろな手法があるが、主成分解析がもっともよく知られている。多くの因子のなかから要因となるものを知ることができる。
多変量解析
【英】:multivariate analysis
概要
解析の対象に対して, 複数の変数(特性)についての値が得られているときに, それらを用いて, 総合的に解析するのを多変量解析という. 変数の型および変数の扱い方により, 種々の解析方法がある. 主成分分析や因子分析のように, すべての変数を同じに扱う場合と, 回帰分析のように, 変数を2つのグループに分けて, 一方で他方を説明する場合がある.
詳説
解析の対象 (会社, 地域, 人など) に対して, 複数の変数 (特性) についての値が得られているときに, それらを用いて, 総合的に解析するのを多変量解析という. 変数の型および変数の扱い方により, 種々の解析方法がある.
変数の型は, 同異だけがわかる名義尺度変数 (質的変数) と差に意味がある間隔尺度変数 (量的変数) に分かれる. 会社名, 地名, 人名などは, 名義尺度変数である. 名義尺度変数は, 分類にしか使えないが, 複数の間隔尺度変数は, 重み(係数)を乗じて, 加えた関数を考えることができる.
変数の扱い方には, すべての変数を同じに扱う場合と二つに分ける場合がある. 後者では, 第1のグループの変数の関数と第2のグループの変数の対応を求める. 第1のグループの変数を説明変数, 第2のグループの変数を目的変数という. 目的変数は, 1個であることが多い.
すべての変数が名義尺度変数である場合は, 対象を多重に分類した分割表を解析する方法があるが, 通常は, 多変量解析の対象にしていないので, ここでは, すべての変数が間隔尺度変数であるとする.
元の変数との関係をできるだけ失わないようにして, より少数の総合特性値をいくつか求める方法として, 主成分分析や因子分析がある. 主成分分析では, 主成分といわれる元の変数の線形式を順次一つずつ求めていく. したがって, 第(≧2)主成分には, すでに定まっている第1から第
主成分までに追加するのに最適なものが選ばれる. しかし, とりあげる総合特性値の数
が予め定まっている場合は, 第1主成分から第
主成分の1次変換であれば, どれでもよいので, 意味を考えて, よりよい
個の因子と呼ばれる総合特性値を求めるのが因子分析である.
対象をいくつかのグループに分類する方法として, クラスター分析がある.
説明変数は, すべて間隔尺度変数であるとする. 目的変数との関係がある説明変数の関数を求める方法がいくつか考えられている.
目的変数によって対象をグループ分けしたとき, 同じグループ内では近い値をとり, 異なるグループでは離れた値をとる説明変数の関数が求められれば, 説明変数で目的変数を判別することができる. 目的変数を判別するために用いる説明変数の関数を判別関数という.
その値が目的変数の値とできるだけ近くなるような説明変数の関数を求める方法として, 回帰分析がある.
ある特徴の有無, 質問の肯定・否定による回答などのように, 二つに分けられる名義尺度変数は, 0か1の値をとる0-1変数におきかえることで, 間隔尺度変数のように扱うことができる. 一般に, 個に分ける名義尺度変数は,
個の0-1変数に置き換えることができる.
0-1変数だけの多変量解析として, 各種の数量化法が提案されている.
順序だけ意味がある順序尺度変数は, 点数化によって, 間隔尺度変数にできる. たとえば, 品物に松, 竹, 梅のランクが付けられている場合, それぞれに, 3, 2, 1や5, 2, 1の数値を対応させれば, 間隔尺度変数として扱うことができる. なお, 順序尺度変数は, 順位相関係数を用いて, 解析することもできる.
比が意味を持つ比尺度変数は, その対数をとることによって, 間隔尺度変数になる.
複数の変数を扱うとき, 単位に注意する必要がある. 単位がすべて同じであれば, ほとんど問題がないが, の単位はm,
はcm,
はgのように, 異なるときは, 重み (係数)
の単位を変えることによって, 重み付きの和
多変量解析では, 単位を揃えることとばらつきを揃えることを兼ねて, 初めにその変数の標準偏差で割る変数変換がよく行われる.
- multi-variate analysisのページへのリンク