検索対象データ収集
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2022/04/13 20:52 UTC 版)
検索の対象とするデータの収集方針を決定する。World Wide Web上のハイパーテキストを収集して対象とする場合にはクローラ(ロボット、スパイダー)を用いて自動的な収集を行うのが一般的であるが、天文学的数量の膨大なデータが存在し、かつ急激に変化するWorld Wide Webのデータを全て網羅して収集することは事実上不可能である。そのため、いかにして網羅的に多くの対象のデータを収集するかが重要な課題となっており、World Wide Web検索エンジンのサービスでは何ページのデータか検索が可能であるかが性能の指標の一つとなっている。
※この「検索対象データ収集」の解説は、「情報検索」の解説の一部です。
「検索対象データ収集」を含む「情報検索」の記事については、「情報検索」の概要を参照ください。
- 検索対象データ収集のページへのリンク