インターネットアーカイブ
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2023/09/15 15:06 UTC 版)
ホスティング環境
ネット上のすべてのデータを収拾するサイトである性格上、そのホスティング環境は巨大なものである。2009年まではHDD4台を搭載した800台のLinuxクラスターで運用していたが、2009年春にサン・マイクロシステムズのSun Fire X4500 63台のクラスターに変更された。OSはSolaris10で、1台あたり1テラバイトHDDを48台搭載(=総計3ペタバイト)、ファイルシステムはZFSを採用していた。施設には専用のSun Modular Datacenterを使用していて、全データが輸送用コンテナひとつに収まっていた[21]。これはその後次第にPetaboxと呼ばれる独自設計のラックマウント型Linuxサーバークラスターに置き換えられ、現在はPetaboxの第二世代が稼働中である[22]。カリフォルニアベイエリアに3つのデータセンター拠点を持つ。
対応ブラウザ
閲覧するウェブブラウザについて、2019年8月頃からInternet Explorerで保存一覧を見ることができなくなっている。Google Chromeでは従来通り閲覧可能。
脚注
関連項目
- Archive Team
- Heritrix - Internet Archiveのクローラ。
- リンク切れ(デッドリンク、死にリンク)
- クローラ(ロボット)
- 電子図書館
- デジタルアーカイブ - 実際のものを電子的に保存すること。
- ウェブ魚拓
- archive.is
外部リンク
- 公式ウェブサイト (英語)
- Internet Archive: Wayback Machine (英語)
- Internet Archive: Projects (英語)
- 公式ブログ (英語)
- Internet Archive Mirror (英語) - 新アレクサンドリア図書館にあるインターネットアーカイブ。
- Internet Archive “Wayback Machine” - ともに国際インターネット保存コンソーシアムに加盟している国立国会図書館による紹介。
注釈
- ^ 中黒を入れた「インターネット・アーカイブ」という表記も見られるほか、日本語でも「Internet Archive」と表記することもある。たとえば、ともに国際インターネット保存コンソーシアムに加盟している国立国会図書館による紹介では表題では「Internet Archive」、本文では「インターネットアーカイブ」と表記しており、本文冒頭で "Internet Archive" を併記している[1]。また、同じく国立国会図書館による国際インターネット保存コンソーシアムの紹介では「インターネットアーカイブ」、「インターネット・アーカイブ」の両表記が混在している[2]。
- ^ a b 国立国会図書館による紹介ではカナ表記は使用しておらず、「Wayback Machine」と表記している[1]。
- ^ インターネットアーカイブではウェブページを、有効なHTMLドキュメント、プレーンテキスト、PDFと定義している。[4]
出典
- ^ a b “Internet Archive “Wayback Machine””. インターネット資料収集保存事業. 国立国会図書館 (2016年11月22日). 2017年8月9日閲覧。
- ^ “International Internet Preservation Consortium (IIPC)”. インターネット資料収集保存事業. 国立国会図書館 (2013年1月29日). 2017年8月9日閲覧。
- ^ “10,000,000,000,000,000 bytes archived!”. Internet Archive Blogs. Internet Archive. 2019年1月10日閲覧。
- ^ “Defining Web pages, Web sites and Web captures”. Internet Archive Blogs. Internet Archive (2016年10月23日). 2023年9月16日閲覧。
- ^ a b “Wayback Machine”. web.archive.org (2022年10月1日). 2022年10月18日閲覧。 “Explore more than 742 billion web pages saved over time (時間の経過とともに保存された 7,420 億を超える Web ページを探索する)”
- ^ “Wayback Machine”. web.archive.org (2022年9月1日). 2022年10月18日閲覧。 “Explore more than 728 billion web pages saved over time (時間の経過とともに保存された 7,280 億を超える Web ページを探索する)”
- ^ “Internet Archive “Wayback Machine””. 国立国会図書館インターネット資料収集保存事業. 国立国会図書館 (2016年11月22日). 2017年9月24日時点のオリジナルよりアーカイブ。2017年9月24日閲覧。
- ^ “出版社がInternet Archiveを提訴。オープンライブラリーで「故意に大量の著作権侵害」と主張 - Engadget 日本版”. Engadget JP. 2020年6月2日時点のオリジナルよりアーカイブ。2022年1月27日閲覧。
- ^ 株式会社インプレス (2020年6月4日). “Internet Archive、米国の複数の出版社から著作権侵害で訴えられる。その理由は【やじうまWatch】”. INTERNET Watch. 2022年1月27日閲覧。
- ^ “Wayback Machine APIs”. Internet Archive. 2019年1月10日閲覧。
- ^ Campbell, Ian Carlos (2020年11月19日). “The Internet Archive is now preserving Flash games and animations”. The Verge. 2020年11月20日時点のオリジナルよりアーカイブ。2020年11月19日閲覧。
- ^ “Net archive silences Scientology critic - CNET News”. CBS Interactive.. 2012年7月16日時点のオリジナルよりアーカイブ。2019年1月10日閲覧。
- ^ “Internet Archive Forums: exclusions from the Wayback Machine”. Internet Archive. 2019年1月10日閲覧。
- ^ “LawMeme - Sherman, Set the Wayback Machine for Scientology”. Yale University. 2006年4月24日時点のオリジナルよりアーカイブ。2019年1月10日閲覧。
- ^ Gelman, Lauren (2004年11月17日). “Internet Archive’s Web Page Snapshots Held Admissible as Evidence” (英語). The Center for Internet and Society. 2022年12月20日閲覧。
- ^ Wrath of Deadheads stalls Web crackdown, ニューヨーク・タイムズの記事 (インターナショナル・ヘラルド・トリビューンサイト内)[リンク切れ]
- ^ Phil Lesh. “PhilLesh.net - Hotline”. 2012年2月20日時点のオリジナルよりアーカイブ。2019年1月10日閲覧。
- ^ “Internet Archive Forums: Good News and an Apology: GD on the Internet Archive”. Internet Archive. 2019年1月10日閲覧。
- ^ a b c Leo Kelion (2017年8月9日). “Bollywood blocks the Internet Archive”. BBC News (BBC) 2017年9月24日閲覧。
- ^ “The 'Internet Archive' was blocked on orders from Madras High Court”. tech2 (Firstpost). (2017年8月11日) 2017年9月24日閲覧。
- ^ “Sun puts Internet Archive in a box, but will it stay there?”. Ars Technica. 2019年1月10日閲覧。
- ^ “Internet Archive: Petabox”. Internet Archive. 2019年1月10日閲覧。
固有名詞の分類
- インターネット・アーカイブのページへのリンク