パラメータ評価とは? わかりやすく解説

Weblio 辞書 > 辞書・百科事典 > ウィキペディア小見出し辞書 > パラメータ評価の意味・解説 

パラメータ評価

出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2021/07/16 02:39 UTC 版)

DBSCAN」の記事における「パラメータ評価」の解説

どのデータマイニングタスクもパラメータ問題がある。どのパラメータ明確な方法アルゴリズム影響与える。DBSCAN では、パラメータ ε および minPts が必要とされるパラメータユーザー指定する必要があるさ。理想的には、ε の値は解くべき問題によって与えられ(たとえば、物理的な距離)、minPts は望む最小クラスターサイズである。 minPts - 大まかなやり方では、最小の minPts はデータセット次元 D から引き出され、minPts ≥ D + 1 である。minPts = 1 の低い値は意味を成さない。どの点もそのままクラスタであるからである。minPts ≤ 2 では、結果single link metric での階層クラスタリング同じになり、デンドログラム(dendrogram)は高さ ε でカットされる。それゆえ、minPts は少なくとも 3 に選ばれなければならない。しかし、より大きい値はたいていの場合ノイズ持ったデータ集合に対してより有効であり、かなりのクラスタ生じるだろう。データ集合大きくなれば、minPts の値はより大きく選ばれるべきである。 ε - ε の値は、k距離グラフ用い、 k = minPts の最近傍への距離をプロットすることで選ばれる。ε が良い値であると、このプロット強く結ばれている。ε が非常に小さい値に選ばれると、データ大部分クラスタリングされない一方大きな値が選ばれると、クラスタ併合されオブジェクト大多数同一クラスタにあることになる。一般に小さな ε 値が好ましく大まかにいって点の小片お互いにこの距離内にあるべきである。 距離関数 - 距離関数選択は ε の選択密に結合しており、結果大きな影響与える。一般にパラメータ ε が選ばれる前にデータセット対す類似度合理的な尺度最初に特定することが必要である。 OPTICS は、パフォーマンス大部分影響与え最大値で ε を置換したDBSCAN一般化見なされる。minPts は、発見される最小のクラスターサイズとなる。このアルゴリズムDBSCAN よりもずっとパラメータ化しやすい一方で結果を使うのにはもうすこし難がある。たいてい、DBSCAN生成する単純なデータパーティショニングの代わりに階層クラスタリング生成するためである。最近DBSCAN の元々の著者一人DBSCANOPTICS再訪し、階層 DBSCAN (HDBSCAN*)の洗練バージョン投稿した。これはもはや境界点考え方をもっていない。

※この「パラメータ評価」の解説は、「DBSCAN」の解説の一部です。
「パラメータ評価」を含む「DBSCAN」の記事については、「DBSCAN」の概要を参照ください。

ウィキペディア小見出し辞書の「パラメータ評価」の項目はプログラムで機械的に意味や本文を生成しているため、不適切な項目が含まれていることもあります。ご了承くださいませ。 お問い合わせ



英和和英テキスト翻訳>> Weblio翻訳
英語⇒日本語日本語⇒英語
  

辞書ショートカット

すべての辞書の索引

「パラメータ評価」の関連用語

1
4% |||||


パラメータ評価のお隣キーワード
検索ランキング

   

英語⇒日本語
日本語⇒英語
   



パラメータ評価のページの著作権
Weblio 辞書 情報提供元は 参加元一覧 にて確認できます。

   
ウィキペディアウィキペディア
Text is available under GNU Free Documentation License (GFDL).
Weblio辞書に掲載されている「ウィキペディア小見出し辞書」の記事は、WikipediaのDBSCAN (改訂履歴)の記事を複製、再配布したものにあたり、GNU Free Documentation Licenseというライセンスの下で提供されています。

©2025 GRAS Group, Inc.RSS