アーカイビングの難しさと限界とは? わかりやすく解説

Weblio 辞書 > 辞書・百科事典 > ウィキペディア小見出し辞書 > アーカイビングの難しさと限界の意味・解説 

アーカイビングの難しさと限界

出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2022/05/29 18:33 UTC 版)

ウェブアーカイブ」の記事における「アーカイビングの難しさと限界」の解説

Webアーカイブ収集主としてクロール頼っているため、Webクローリング難しさ影響を受ける。 ロボット排除取り決めrobots exclusion protocol)によりクローラウェブサイト一部へのアクセス拒否されることがあるウェブサイト大部分Deep Webとして隠れた領域となっていることもある。例えば、フォーム先にあるはずの結果ページなどは、クローラはリンクを辿って行き着くことができないためDeep Web領域となってしまう。 ウェブサーバー中にはクローラに対して通常のWebブラウザ対するのとは別のページ内容返すことがある。これはサーチエンジン騙してサイトへのトラフィック増やそうとする際に行われる手法一つでもある。 クローラ・トラップが、クローラページ無限に延々とダウンロードさせることがある例えば、カレンダーなど)。このためクローラ通常動的ページダウンロード数の上限を設定されている。 Webは非常に巨大なため、その大部分収集するには相当な計算機資源を必要とする。また、Web自体内容の変化速いため、サイト全体クローラ収集する前にその内容変わってしまうことさえある。 Webアーカイブ対処しなければならないのは技術的な側面だけではなく知的財産権といった法的社会的側面もある。Peter Lyman (2002)は「Web一般にパブリックドメインソースのように見られているが、これは著作権付き情報である。従って、アーキビストWebコピーする法的権利保持していない」と述べている。「インターネットアーカイブ」のようにアーカイブしたコンテンツ一般に公開しているアーカイブ中にはコンテンツ所有者一般公開希望しない場合には、アーカイブしたコンテンツ公開から外したり、削除できるようにしているところもある。また、特定の場所からのみアクセス可能にしたり、特定の決められ利用法でのみアクセス可能にしたりしているアーカイブもある。

※この「アーカイビングの難しさと限界」の解説は、「ウェブアーカイブ」の解説の一部です。
「アーカイビングの難しさと限界」を含む「ウェブアーカイブ」の記事については、「ウェブアーカイブ」の概要を参照ください。

ウィキペディア小見出し辞書の「アーカイビングの難しさと限界」の項目はプログラムで機械的に意味や本文を生成しているため、不適切な項目が含まれていることもあります。ご了承くださいませ。 お問い合わせ



英和和英テキスト翻訳>> Weblio翻訳
英語⇒日本語日本語⇒英語
  

辞書ショートカット

すべての辞書の索引

「アーカイビングの難しさと限界」の関連用語

アーカイビングの難しさと限界のお隣キーワード
検索ランキング

   

英語⇒日本語
日本語⇒英語
   



アーカイビングの難しさと限界のページの著作権
Weblio 辞書 情報提供元は 参加元一覧 にて確認できます。

   
ウィキペディアウィキペディア
Text is available under GNU Free Documentation License (GFDL).
Weblio辞書に掲載されている「ウィキペディア小見出し辞書」の記事は、Wikipediaのウェブアーカイブ (改訂履歴)の記事を複製、再配布したものにあたり、GNU Free Documentation Licenseというライセンスの下で提供されています。

©2025 GRAS Group, Inc.RSS