類型と表
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2021/01/13 20:11 UTC 版)
整然データの3つ目の条件(個々の観測の構成単位の類型が1つの表をなす)は、端的に言えば2つのことを含意する。 1つ目は、1つの表には種類の違う観測が入っていてはならないということである。先ほどの天気の例で言えば、表の中に天気を観測したもののほかに、ラーメン店の日々の売り上げを観測したものが入っていてはいけない。もし入っていれば、整然ではなくなる。このように類型の異なるものが1つの表に入っていれば、データ分析がしづらいことはすぐに分かるだろう。 2つ目は、同じ種類の観測が複数の表にまたがっていてはならないということである。先ほどの天気の例で言えば、6時の観測と12時の観測が別々の表に記録されていれば、それは整然とはならない。すぐに想像が付くだろうが、同じ種類の観測は、普通ひとまとめにして分析することになるので、1つの表にまとまっていた方が分析しやすいのである。複数の表にまたがっていては、簡単に分析することはできない。
※この「類型と表」の解説は、「Tidy data」の解説の一部です。
「類型と表」を含む「Tidy data」の記事については、「Tidy data」の概要を参照ください。
- 類型と表のページへのリンク