標本の最頻値とは? わかりやすく解説

標本の最頻値

出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2022/03/07 00:21 UTC 版)

最頻値」の記事における「標本の最頻値」の解説

標本データ最頻値は、その中で最も頻繁に出現する値を意味する例えば [1, 3, 6, 6, 6, 6, 7, 7, 12, 12, 17] という標本群の最頻値は6である。[1, 1, 2, 4, 4] というデータでは最頻値一意定まらないそのようなデータ群を「二峰性 (英: bimodal)」と呼び最頻値2つよりも多ければ「多峰性 (英: multimodal)」と呼ぶ。 連続確率分布標本は [0.935..., 1.211..., 2.430..., 3.668..., 3.874...] のようになり、正確に同じ値が出現することはないため、そのままの定義では最頻値求められない。この場合一般に、値の範囲等間隔区間分割しヒストグラム作成することで区間ごとの頻度求め区間中央の値でその区間を代表させる。したがって最頻値ヒストグラムピークの値ということになる。標本数が少な場合区間の幅をどう選択するかで値が大きく変わってくる。一般に各区間の標本数をある程度以上確保するために区間数を少なくする。もう1つの手法としてカーネル密度推定があるが、これは本質的に標本値をぼやけさせて確率密度関数連続的に推定するもので、それによって最頻値提供できる次のMATLABコード例は、標本群から最頻値計算するのである。 X = sort(x);indices = find(diff([X; realmax]) > 0); % indices where repeated values change[modeL,i] = max (diff([0; indices])); % longest persistence length of repeated valuesmode = X(indices(i)); このアルゴリズムでは、まず標本群を昇順ソートする必要がある次いでソートされたリスト離散微分係数計算し、その微分係数が正となるインデックス群 (indices) を求める(つまり、値が上がっている位置求める)。次にそのインデックス列の離散微分係数計算し、それが最大となっている位置求める(つまり、同じ値が長く続いているほどインデックスの差が大きくなり、微分係数大きくなる)。

※この「標本の最頻値」の解説は、「最頻値」の解説の一部です。
「標本の最頻値」を含む「最頻値」の記事については、「最頻値」の概要を参照ください。

ウィキペディア小見出し辞書の「標本の最頻値」の項目はプログラムで機械的に意味や本文を生成しているため、不適切な項目が含まれていることもあります。ご了承くださいませ。 お問い合わせ



英和和英テキスト翻訳>> Weblio翻訳
英語⇒日本語日本語⇒英語
  

辞書ショートカット

すべての辞書の索引

「標本の最頻値」の関連用語

1
8% |||||

標本の最頻値のお隣キーワード
検索ランキング

   

英語⇒日本語
日本語⇒英語
   



標本の最頻値のページの著作権
Weblio 辞書 情報提供元は 参加元一覧 にて確認できます。

   
ウィキペディアウィキペディア
Text is available under GNU Free Documentation License (GFDL).
Weblio辞書に掲載されている「ウィキペディア小見出し辞書」の記事は、Wikipediaの最頻値 (改訂履歴)の記事を複製、再配布したものにあたり、GNU Free Documentation Licenseというライセンスの下で提供されています。

©2024 GRAS Group, Inc.RSS