ヒストグラム
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2023/01/25 05:16 UTC 版)
工業分野では、パレート図、チェックシート、管理図、特性要因図、層別法、散布図と並んで、品質管理のためのQC七つ道具として知られている。
語源
histogram (ヒストグラム)の語源は、定かではないが、古代ギリシャ語で「なにかを直立にする」(帆船のマスト、織機のバー、ヒストグラムの縦棒など)という意味の ἱστός (istos、イストス)と、「描いたり、記録したり、書いたりすること」という意味の γράμμα (gramma、グラマ)を合わせた用語だといわれている。この用語は、イギリスの統計学者カール・ピアソンが1891年に historical diagram から創案したともいわれている[2]。
定義
日本工業規格 JIS Z 8101-1:2015 (国際規格 ISO 3534-1:2006 と同等)の「1.61 ヒストグラム」では、次のとおりに規定している[3]。
底辺の長さが級の幅(1.58)に等しく,その面積が級の度数に比例する近接する長方形からなる度数分布(1.60)のグラフ表現。
注記 1 級の幅が不均一な場合には,注意が必要である。級の幅が不均一な場合には,級の面積を級の度数に比例させるとよい。
注記 2 全ての級の幅を等しくし,長方形の高さを級の度数に比例させるのが一般的である。
ヒストグラム
ヒストグラムは、各々が互いに素である区間・階級(カテゴリ、これをビン (bins) という。ヒストグラムのグラフの柱(棒)のこと)に分類できる、観察結果の数を図にしたもの。計算する関数 mi である。ヒストグラムの図は、階級を一つ決めた時のヒストグラムを表現する方法である。階級の幅は一つの階級のデータ数が全データ数の平方根程度がよいとう見解をはじめ何種類か推奨がある(後述)[4]。基準点も0を含む場合には0を基準点にすることがある。それ以外の場合には、最小値、最大値を含む切りのよい値にする方法と、切りのよい数を中央値とする方法がある。すべての観察結果の数 n とすべての階級の数 k、ヒストグラム mi を与えて、これらには以下の式の関係が成り立つ。
これを集計すると、次のようになる。上述の通り、階級の数と幅の設定には諸説あるが、ここでは階級の数を 8、幅を 100 とした。
閲覧回数 | その回数を記録した日数 |
---|---|
0 - 99 | 1 |
100 - 199 | 2 |
200 - 299 | 4 |
300 - 399 | 5 |
400 - 499 | 4 |
500 - 599 | 7 |
600 - 699 | 7 |
700 - 799 | 1 |
[表の見方] 400 - 499 の欄が 4 となっているのは、1 日の記事「ヒストグラム」の閲覧回数が 400 回から 499 回であった日が2013年1月に 4 日あったことを意味する。
したがって、これをヒストグラムにすると、図1のようになる。
- ^ a b “ヒストグラム”. J-GLOBAL. 2020年11月27日閲覧。
- ^ Magnello 2006.
- ^ JIS Z 8101-1.
- ^ 西岡, 1.4 度数分布 p.8.
- ^ JIS Z 8101-1 : 1999, 2.5 累積度数.
- ^ 閲覧回数のデータはWikipedia article traffic statisticsによった。
- ^ たとえば Venables & Ripley 2002, § 5.6 "Density Estimation".
- ^ Microsoft Excelのヒストグラムやその他多数で採用されている。
- ^ Sturges 1926.
- ^ Scott 1979.
- ^ フリードマン=ダイアコニスの法則の出典は Freedman & Diaconis 1981。
- ^ Shimazaki & Shinomoto 2007.
- 1 ヒストグラムとは
- 2 ヒストグラムの概要
- 3 階級の個数と幅
- 4 種類
- 5 参考文献
- 6 関連項目
- ヒストグラムのページへのリンク