IT用語辞典バイナリ |
インターネットアーカイブ
インターネットアーカイブとは、インターネット上に公開されたWebページを保存し、サーバー上から削除されたコンテンツも閲覧できるサービスの名称である。
インターネットアーカイブは、2001年10月からサービスがスタートし、1996年10月以降に公開された膨大な量のWebページを保存している。利用者は、インターネットアーカイブのWebサイトにアクセスすれば無償で利用できる。
インターネット上に公開される情報は、頻繁に更新される一方で、サーバーの廃止やコンテンツの削除によるリンク切れも少なくないが、インターネットアーカイブを利用すれば、過去にさかのぼって情報を検索・閲覧することができる。
なお、同様のサービスとして、アフィリティーが提供している「ウェブ魚拓」がある。
参照リンク
Internet Archive - (英文)
| 各種Webサービス: | All About プロファイル All About エンジェルライン インターネットアーカイブ インターネットバンキング インターネット放送 オンライン翻訳サービス |
ウィキペディア |
インターネット・アーカイブ
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2011/12/03 16:54 UTC 版)
(Internet_Archive から転送)
| URL | www.archive.org |
|---|---|
| 営利性 | no |
| タイプ | 電子図書館 |
| 使用言語 | 英語 |
| 運営者 | ブリュースター・ケール |
| 設立日 | 1996年 |
| アレクサ ランキング |
インターネット・アーカイブ(Internet Archive)は、Web・マルチメディア資料のアーカイブを運営している団体である。本部はカリフォルニア州サンフランシスコのプレシディオに置かれている。
アーカイブには、「WWWのスナップショット」と呼ばれる、ある時点において収集されたウェブページのコピー(ウェブアーカイブ)や、ソフトウェア・映画・本・録音データ(バンド等の許可によるライブ公演の録音も含む)などがある。アーカイブは、その資料を無償で研究者や歴史家などに提供している。
目次 |
歴史
アーカイブは1996年にブリュースター・カールによって設立された。
公式サイトによれば、その使命は以下のとおりである:
- 大抵の社会はその文化、歴史遺産の保存を重視している。そのような資料が無ければ、文明はその成功または失敗から学ぶための手段も記憶も持てない。我等の文化は現在電子形態での資料を大量に生産している。アーカイブの使命は、これらの電子資料の保存を支援し、研究者・歴史家・学界のためのインターネットライブラリを構築することにある。アーカイブはアメリカ議会図書館やスミソニアン博物館などの他機関との恊働も行う。
人類の知識と遺産を保存してそのコレクションを公開するというその目標からか、アレクサンドリア図書館に例えられることもある。
ウェイバックマシン
ウェイバックマシンが提供しているサイト例:
インターネットアーカイブは、アレクサ・インターネットのデータを元にした「ウェイバックマシン (Wayback Machine)」も運営している。このウェブアーカイブサービスを使えばウェブページのアーカイブ時点の情報を見ることができる。アーカイブはこれを「3次元インデックス」と呼んでいる。
ウェイバックマシンのアーカイブは徐々に増加し公開されている。アーカイブされたものの公開までには半年から一年かかっている。永続的に資料を保存し、すぐにそれを参照するための代わりとなるサイトとして、Archive-It systemなどもある。ウェイバックマシンが保持しているデータ容量は、2001年時点ではおよそ100テラバイトに過ぎなかったが、2004年時点ではおよそ1ペタバイトであり、月に20テラバイトの割合で増加を続けている。この増加率は2003年の報告の増加率月あたり12テラバイトのおよそ倍の速度になる。またこれは、議会図書館など世界最大規模の図書館の文書量をはるかに上回るものである。そして2009年の段階ではデータ総量は約2ペタバイトとなっている。
このデータのコピーは新アレクサンドリア図書館でも保存されている。
「ウェイバックマシン」という名称はロッキー・アンド・ブルウィンクル・ショーの一シーンからとられた。このアニメシリーズは学者風の蝶ネクタイをした犬のピーボディ先生と人間の助手シャーマンが「ワバックマシン (WABAC machine)」と呼ぶタイムマシンを使って歴史上の有名な事件にちょっかいを出すというコメディアニメである。
公的な保存とは別途、個人のレベルでも、特定の個人がインターネット上に運営していたWebサイト、Blogを個人の死後も管理、保存することがどのようにして可能か、といった話題もWeb Magazine、Web ニュースなどに出てくるようになった。保険会社などが遺言の執行と合わせて、こうしたサービスを行っているようなものはないが、難病での闘病生活をおくった人のドキュメントやさまざまな公益的で共有すべき内容を持ったもの(人権、環境、社会問題、女性、健康と福祉、情報公開、特殊な個人的体験など)、オンラインソフトウェアの開発サイトなどが、関係者によって保存、維持されている例はある。こうしたものには、Webサイトを保存しているものと、故人を追悼するためのものとが混在している。
ただし、閉鎖された過去のサイトがすべて完全に見られるわけではなく、HTMLファイル以外は保存されないこともある。保存に成功したサイトであっても、年数経過によりアーカイブ上からでも見られなくなることがある。
2009年後半以降ほとんどのサイトが保存されていないと言われがちであったが、最近は保存され公開されるようになった。
Recall サーチエンジン
またInternet Archiveのデータベース的側面としては、現在の特定URLを必要とする形以外のアクセス方法として、2003年9月、Internet Archiveに保存されたウェブページ全体を対象にした検索エンジン「Recall」のベータ版が公開された。検索した単語の頻度をグラフ化して表示する機能があり(2byte文字は未対応)、ネットワーク上の流行調査などに有益なものだったが、2004年9月中旬に停止した。これは「Recall」の開発者であったAnna Pattersonがプロジェクトから離れたためである。Internet Archiveのフォーラムでは新たな検索システムの構築を望む声が多くあがっており、動向が注目される。
コレクション
動画、書籍、録音の多くがパブリックドメインにあるか、クリエイティブ・コモンズのライセンスで提供されている。音楽部門には、コンサートでの演奏の録音を許可しているアーティストや演奏家(グレイトフル・デッド、ストリング・チーズ・インシデント、トード・ザ・ウェット・スプロケット、311、fugaziなど)による音源とともに、独立系ミュージシャンの音源も数多く含まれている。
- ^ “archive.org - Site Information from Alexa”. 2010年8月26日閲覧。
- ^ CNETの記事
- ^ archive.orgのフォーラムへの投稿
- ^ LawMemeの記事
- ^ Wrath of Deadheads stalls Web crackdown, ニューヨーク・タイムズの記事 (インターナショナル・ヘラルド・トリビューンサイト内)
- ^ Phil Lesh's Hotline, 論争に対する2005年11月30日付コメント
- ^ Good News and an Apology: GD on the Internet Archive, ブリュースター・カールによるarchive.org内のフォーラムへの投稿
- 1 インターネット・アーカイブの概要
- 2 オープンライブラリ
- 3 論争
- 4 ホスティング環境