検索エンジン 検索エンジンの概要

検索エンジン

出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2022/06/18 10:14 UTC 版)

ナビゲーションに移動 検索に移動
Google検索

狭義の検索エンジンは、ロボット型検索エンジンディレクトリ型検索エンジンメタ検索エンジンなどに分類される。広義の検索エンジンとしては、ある特定のウェブサイト内に登録されているテキスト情報の全文検索機能を備えたソフトウェア全文検索システム)等がある。

検索エンジンは、検索窓と呼ばれるボックスにキーワードを入力して検索をかけるもので、全文検索が可能なものと不可能なものとがある。検索サイトを一般に「検索エンジン」と呼ぶことはあるが、厳密には検索サイト自体は検索エンジンでない。

検索エンジン(狭義)

ロボット型検索エンジン

与えられた検索式に従って、ウェブページ等を検索するサーバ、システムのこと。検索式は、最も単純な場合はキーワードとなる文字列のみであるが、複数のキーワードにAND(「かつ」、論理積)OR(「または」、論理和)等の論理条件を組み合わせて指定することができるものが多い。

ロボット型検索エンジンの大きな特徴の一つとして、クローラ(ロボット・スパイダー)を用いることが挙げられる。このことにより、WWW上にある多数の情報を効率よく収集(日本の著作権法では複製)することができる。大規模な検索エンジンでは、80億ページ以上のページから検索が可能になっている。

収集したページの情報は、前もって解析し、索引情報(インデックス)を作成する(日本の著作権法では編集)。日本語などの言語では、自然言語処理機能が生成される索引の質に影響する。このため、多言語対応した検索エンジンの方が精度の高い検索が可能となる。

検索結果の表示順は、検索エンジンの質が最も問われる部分である。ユーザーが期待したページを検索結果の上位に表示することができなければ、ユーザーが離れてしまうからである。そのため、多くの検索エンジンが、表示順を決定するアルゴリズムを非公開にし、その性能を競っている。検索エンジン最適化業者の存在も、アルゴリズムを公開しない要因になっている。Googleは、そのアルゴリズムの一部であるPageRankを公開してきたが、やはり、多くの部分が非公開になっている。Googleの場合、創設初期におけるアルゴリズムについては、創設者自身がウェブ上で公表している論文でその一端を知ることができる。 参照 英語原文[1] 日本語の解説[2]

ウェブページの更新時刻の情報を用いて、新しい情報に限定して検索できるものや、検索結果をカテゴリ化して表示するものなど、特長のある機能を搭載したり、検索結果をユーザーへ最適化していく動きもある。

従来のウェブページを検索するだけの検索エンジンにとどまらず、最近ではインターネットショッピング専用の検索エンジンなど、特定の分野に特化した検索エンジンの開発も散見される。商品検索では、価格比較サービス日本最大手の価格.comや、ベンチャー企業が開発するQOOPIEなどある。また、職業検索エンジンとしてはCraigslistなどがある。 GoogleYahoo!インフォシークテクノラティMARSFLAGAltavistaムーターAlltheWebTeoma英語版(終了)、WiseNut英語版Inktomi(終了)、SAGOOLYahoo! JAPAN (2005.10〜2010.11[要出典]) など。

ディレクトリ型検索エンジン

人手で構築したウェブディレクトリ内を検索するサーバ、システムのこと。

人手で構築しているため、質の高いウェブサイトを検索可能。概要を人手で記入しているため、検索結果の一覧から目的のサイトを探しやすい、サイトのカテゴリ分けがされていることから、特定分野や地区などに限定したサイトを探しやすいという特長がある。

しかし、検索対象となるサイトは人手で入力するため、検索対象となるサイト数が多くできないという欠点がある。

インターネットが一般に使われるようになった初期(1990年代)のころには、ディレクトリ型が主体であったが、WWWの爆発的な拡大によって、あらゆるウェブサイトを即時にディレクトリに反映させることが事実上不可能になり、現在では主流ではなくなっている[いつ?]このため、ディレクトリ型検索エンジンでは、検索にヒットするサイトが無かった場合、ロボット型検索エンジンを用いて結果を表示するような、併用型のものが多い[いつ?]

日立国際ビジネスのHole-in-One( - 2004年11月)、Yahoo!JAPANのYahoo!カテゴリ( - 2018年3月[3])、LookSmart Japan( - 2006年6月[4])、gooのgooカテゴリー検索( - 2019年8月[5])、Open Directory ProjectことDMOZ( - 2017年3月)など。

分散型検索エンジン

P2P通信によってウェブコンテンツのインデックスを多数のピアに分散させ、P2Pネットワーク全体で各ピアの持つインデックスを共有する検索システムのこと。

ウェブのクロールは各ピアが独自に行い、インデクサーはRWI(Reverse Word Index)を作成する。作成されたインデックスの一部はDHT(分散ハッシュテーブル、Distributed Hash Table)として他のピアに分配される。

検索は自分のピアの端末からP2Pネットワーク上にある他のピアにリクエストを送信することにより行うことができる。

分散型検索エンジンの例としてはYaCyがある。YaCyは「人民による人民のためのウェブ検索」を標榜し、分散型であることにより検閲を防ぐことができるとしている。[6]

メタ検索エンジン

ひとつの検索ワードを複数の検索エンジンで検索することをメタ検索という(横断検索エンジンと呼ぶこともある)。Startpage.comなどがこれに分類される。 詳細は「メタ検索エンジン」を参照のこと。

検索エンジン(広義)

全文検索システム

与えられた文書群から、検索式(キーワードなど)による全文検索機能を提供するソフトウェア、システムの総称で、ウェブサーバに組み込んで利用されることが多い。スタンドアローン環境で用いられる個人用途のものもあり、そういったものは特に「デスクトップ検索」と呼ばれている。企業内のファイルサーバー企業内ポータルを対象とするものは「エンタープライズサーチ」と呼ばれる。


  1. ^ The Anatomy of a Large-Scale Hypertextual Web Search Engine(英語、Sergey Brin and Lawrence Page,Computer Science Department, Stanford University)
  2. ^ グーグルの検索順位決定についてーそのアルゴリズム
  3. ^ “「Yahoo!カテゴリ」終了へ 「役割終えた」”. ITmedia. (2017年6月29日). http://www.itmedia.co.jp/business/articles/1706/29/news079.html 2020年1月10日閲覧。 
  4. ^ 渡辺隆広 (2006年6月26日). “バリューコマース、「ルックスマート」を閉鎖”. SEMリサーチ. 2020年1月10日閲覧。
  5. ^ goo カテゴリー検索 サービス終了のお知らせ”. goo (2019年7月29日). 2020年1月10日閲覧。
  6. ^ Internet Watchの記事 "プライバシーが保護される分散型サーチエンジン「YaCy」~地道な開発が続く"
  7. ^ a b c d e 時実象一、都築泉、小野寺夏生 『新訂情報検索の知識と技術 第3版』情報科学技術協会、2010年、58頁。 
  8. ^ 3/3 Yahhoという検索エンジンがあった [企業のIT活用 All About]”. 2017年10月18日閲覧。
  9. ^ たとえば 検索エンジンのキャッシュは著作権侵害か?(2002.3 スラッシュドット・ジャパン)などを見よ
  10. ^ コンテンツをめぐる課題(参考資料) (PDF) (2006.11 コンテンツ専門調査会 企画ワーキンググループ(第3回) - 知的財産戦略本部)
  11. ^ http://internet.watch.impress.co.jp/www/article/2000/0803/google.htm
  12. ^ Internet Archive 検索エンジンに現れる広告サイトは2.4倍危険? - ワークスタイル - nikkei BPnet
  13. ^ Internet Archive マカフィー、「検索エンジンの安全性に関する調査報告」第3版を公開 ~毎月2億7,600 万件を超える検索がユーザを危険なサイトへ誘導~ - マカフィー株式会社
  14. ^ ITmedia エンタープライズ 検索エンジンは危険なリンクでいっぱい――McAfeeが調査報告
  15. ^ INTERNET Watch 危険な検索結果が多いサーチエンジンは米Yahoo!~米McAfee調査
  16. ^ OCN navi(サーチエンジン登録ガイド)
  17. ^ 当時のMondouのサイト(2004.10.14収集、ウェブアーカイブ)
  18. ^ ディレクトリサービス"NTT DIRECTORY"(研究開発の歴史)(NTT)
  19. ^ Hole in One - マルチメディア/インターネット事典
  20. ^ エキサイトが検索ディレクトリ「Hole-in-One」を買収(1998.7 internet watch
  21. ^ 当時のCSJ INDEXのサイト (1999.2.18収集、ウェブアーカイブ)





英和和英テキスト翻訳>> Weblio翻訳
英語⇒日本語日本語⇒英語
  

辞書ショートカット

すべての辞書の索引

検索エンジンのお隣キーワード
検索ランキング

   

英語⇒日本語
日本語⇒英語
   



検索エンジンのページの著作権
Weblio 辞書情報提供元は参加元一覧にて確認できます。

  
ウィキペディアウィキペディア
All text is available under the terms of the GNU Free Documentation License.
この記事は、ウィキペディアの検索エンジン (改訂履歴)の記事を複製、再配布したものにあたり、GNU Free Documentation Licenseというライセンスの下で提供されています。 Weblio辞書に掲載されているウィキペディアの記事も、全てGNU Free Documentation Licenseの元に提供されております。

©2022 GRAS Group, Inc.RSS