ウェイバックマシン
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2023/04/13 05:42 UTC 版)
ウェイバックマシン(Wayback Machine)は、インターネット上のWorld Wide Webやその他情報を扱うデジタルアーカイブ。アメリカ合衆国カリフォルニア州サンフランシスコにある非営利団体のインターネットアーカイブが2001年にサービスを開始した。
- ^ “WayBackMachine.org WHOIS, DNS, & Domain Info – DomainTools”. WHOIS. 2020年5月14日時点のオリジナルよりアーカイブ。2016年3月13日閲覧。
- ^ “InternetArchive.org WHOIS, DNS, & Domain Info – DomainTools”. WHOIS. 2020年5月12日時点のオリジナルよりアーカイブ。2016年3月13日閲覧。
- ^ Notess, Greg R. (March–April 2002). “The Wayback Machine: The Web's Archive”. Online 26: 59–61.
- ^ “The Wayback Machine”, Frequently Asked Questions, オリジナルのSeptember 18, 2018時点におけるアーカイブ。 2018年9月18日閲覧。
- ^ a b "20,000 Hard Drives on a Mission | Internet Archive Blogs". blog.archive.org (英語). 2018年10月20日時点のオリジナルよりアーカイブ。2018年10月15日閲覧。
- ^ Green, Heather (2002年2月28日). “A Library as Big as the World”. BusinessWeek. オリジナルの2011年12月20日時点におけるアーカイブ。
- ^ Tong, Judy (2002年9月8日). “Responsible Party – Brewster Kahle; A Library Of the Web, On the Web”. New York Times. オリジナルの2011年2月20日時点におけるアーカイブ。 2011年8月15日閲覧。
- ^ Cook, John (2001年11月1日). “Web site takes you way back in Internet history”. Seattle Post-Intelligencer. オリジナルの2014年8月12日時点におけるアーカイブ。 2011年8月15日閲覧。
- ^ “Wayback Goes Way Back on Web”. Wired. (October 28, 2001). オリジナルのOctober 16, 2017時点におけるアーカイブ。 2017年10月16日閲覧。.
- ^ a b c Arora, Sanjay K.; Li, Yin; Youtie, Jan; Shapira, Philip (May 5, 2015). “Using the wayback machine to mine websites in the social sciences: A methodological resource” (英語). Journal of the Association for Information Science and Technology 67 (8): 1904–1915. doi:10.1002/asi.23503. ISSN 2330-1635.
- ^ a b c d e f g Kalev Leetaru (28 January 2016). "The Internet Archive Turns 20: A Behind the Scenes Look at Archiving the Web". Forbes. 2017年10月16日時点のオリジナルよりアーカイブ。2017年10月16日閲覧。
- ^ Kahle, Brewster. "Archiving the Internet". Scientific American – March 1997 Issue. 2012年4月3日時点のオリジナルよりアーカイブ。2011年8月19日閲覧。
- ^ Jeff Kaplan (27 October 2014). "Archive-It: Crawling the Web Together". Internet Archive Blogs. 2017年10月12日時点のオリジナルよりアーカイブ。2017年10月16日閲覧。
- ^ a b "Worldwide Web Crawls". Internet Archive. 2017年10月19日時点のオリジナルよりアーカイブ。2017年10月16日閲覧。
- ^ "Wide Crawl Number 13". Internet Archive. 2017年10月19日時点のオリジナルよりアーカイブ。2017年10月16日閲覧。
- ^ "Internet Archive: Petabox". archive.org (英語). 2018年10月25日閲覧。
- ^ Kanellos, Michael (2005年7月29日). “Big storage on the cheap”. CNET News.com. オリジナルの2007年4月3日時点におけるアーカイブ。 2007年7月29日閲覧。
- ^ "Internet Archive and Sun Microsystems Create Living History of the Internet". サン・マイクロシステムズ. 25 March 2009. 2009年3月26日時点のオリジナルよりアーカイブ。2009年3月27日閲覧。
- ^ Mearian, Lucas (2009年3月19日). “Internet Archive to unveil massive Wayback Machine data center”. Computerworld.com. オリジナルの2009年3月23日時点におけるアーカイブ。 2009年3月22日閲覧。
- ^ "Updated Wayback Machine in Beta Testing". Archive.org. 2011年8月23日時点のオリジナルよりアーカイブ。2011年8月19日閲覧。
- ^ "Beta Wayback Machine, in forum". Archive.org. 2014年4月17日時点のオリジナルよりアーカイブ。2014年4月16日閲覧。
- ^ "Internet Archive Forums: 6th pair of racks go into service: over 2PB of data space used". archive.org (英語). 2016年10月24日時点のオリジナルよりアーカイブ。2018年10月25日閲覧。
- ^ "Wayback Machine: Now with 240,000,000,000 URLs | Internet Archive Blogs". Blog.archive.org. 9 January 2013. 2014年4月14日時点のオリジナルよりアーカイブ。2014年4月16日閲覧。
- ^ Rossi, Alexis (25 October 2013). "Fixing Broken Links on the Internet". archive.org. San Francisco, CA, US: Collections Team, the Internet Archive. 2014年11月7日時点のオリジナルよりアーカイブ。2015年3月25日閲覧。
We have added the ability to archive a page instantly and get back a permanent URL for that page in the Wayback Machine. This service allows anyone – wikipedia editors, scholars, legal professionals, students, or home cooks like me – to create a stable URL to cite, share or bookmark any information they want to still have access to in the future.
- ^ The VirusTotal Team (25 March 2015). "207.241.226.190 IP address information". virustotal.com. Dublin 2, Ireland: VirusTotal. 2014年7月14日時点のオリジナルよりアーカイブ。2015年3月25日閲覧。
2015-03-25: Latest URLs hosted in this IP address detected by at least one URL scanner or malicious URL dataset. ... 2/62 2015-03-25 16:14:12 [complete URL redacted]/Renegotiating_TLS.pdf ... 1/62 2015-03-25 04:46:34 [complete URL redacted]/CBLightSetup.exe
- ^ Advisory provided by Google (25 March 2015). "Safe Browsing Diagnostic page for archive.org". google.com/safebrowsing. Mountain View, CA, US: Google. 2015年4月6日時点のオリジナルよりアーカイブ。2015年3月25日閲覧。
2015-03-25: Part of this site was listed for suspicious activity 138 time(s) over the past 90 days. ... What happened when Google visited this site? ... Of the 42410 pages we tested on the site over the past 90 days, 450 page(s) resulted in malicious software being downloaded and installed without user consent. The last time Google visited this site was on 2015-03-25, and the last time suspicious content was found on this site was on 2015-03-25. ... Malicious software includes 169 trojan(s), 126 virus, 43 backdoor(s).
- ^ "Internet Archive Frequently Asked Questions". 2009年10月21日時点のオリジナルよりアーカイブ。2015年1月17日閲覧。
- ^ "Internet Archive Frequently Asked Questions". 18 December 2014. 2014年12月18日時点のオリジナルよりアーカイブ。2018年12月13日閲覧。
- ^ "Can the manipulation of big data change the way the world thinks?". The National. 2017年1月12日時点のオリジナルよりアーカイブ。2017年5月14日閲覧。
- ^ Crockett, Zachary (2018年9月28日). “Inside Wayback Machine, the internet’s time capsule” (英語). The Hustle. オリジナルの2018年10月2日時点におけるアーカイブ。 2018年10月26日閲覧。
- ^ Heffernan, Virginia (2018年9月18日). “Things Break and Decay on the Internet—That's a Good Thing” (英語). WIRED. オリジナルの2018年9月25日時点におけるアーカイブ。 2018年10月26日閲覧。
- ^ “Donate to the Internet Archive: Digital Library of Free & Borrowable Books, Movies, Music & Wayback Machine” (英語). adafruit. 2020年12月2日時点のオリジナルよりアーカイブ。2020年12月2日閲覧。
- ^ “Wayback Machine”. web.archive.org. 2023年3月4日閲覧。
- ^ "Archive.org Site Info". Alexa Internet. 2013年10月28日時点のオリジナルよりアーカイブ。2013年10月29日閲覧。
- ^ "Archive.org Site Overview". Alexa Internet. 2015年4月9日時点のオリジナルよりアーカイブ。2015年4月9日閲覧。
- ^ michelle (9 May 2014). "Wayback Machine Hits 400,000,000,000!". Internet Archive. 2014年8月26日時点のオリジナルよりアーカイブ。2015年3月25日閲覧。
- ^ "Internet Archive Wayback Machine". Internet Archive. 2015年2月13日時点のオリジナルよりアーカイブ。2015年3月25日閲覧。 出典には意味のあるタイトルを入力してください。 (説明)
- ^ Some sites are not available because of Robots.txt or other exclusions Archived April 15, 2011, at the Wayback Machine.
- ^ How can I remove my site's pages from the Wayback Machine? Archived April 17, 2014, at the Wayback Machine.
- ^ Cox, Joseph (2018年5月22日). “The Wayback Machine Is Deleting Evidence of Malware Sold to Stalkers”. オリジナルの2018年5月23日時点におけるアーカイブ。 2018年5月23日閲覧。
- ^ "Recommendations for Managing Removal Requests And Preserving Archival Integrity". University of California. 14 December 2002. 2017年9月18日時点のオリジナルよりアーカイブ。2017年9月14日閲覧。
- ^ "Retroactive robots.txt removal of past crawls AKA Oakland Archive Policy". Internet Archive. 7 July 2014. 2017年10月10日時点のオリジナルよりアーカイブ。2017年9月14日閲覧。
- ^ Mark Graham (17 April 2017). "Robots.txt meant for search engines don't work well for web archives". Internet Archive Blogs. 2017年4月17日時点のオリジナルよりアーカイブ。2017年4月16日閲覧。
- ^ "Archivierung des Internets: Internet Archive ignoriert künftig robots.txt" (ドイツ語). heise online. 2017年4月27日時点のオリジナルよりアーカイブ。2017年5月14日閲覧。
- ^ "Suchmaschinen: Internet Archive will künftig Robots.txt-Einträge ignorieren – Golem.de" (ドイツ語). 2017年6月19日時点のオリジナルよりアーカイブ。2017年5月14日閲覧。
- ^ "Internet Archive will ignore robots.txt files to keep historical record accurate". Digital Trends. 24 April 2017. 2017年5月16日時点のオリジナルよりアーカイブ。2017年5月14日閲覧。
- ^ Sampath Kumar, B.T.; Prithviraj, K.R. (October 21, 2014). “Bringing life to dead: Role of Wayback Machine in retrieving vanished URLs” (英語). Journal of Information Science 41 (1): 71–81. doi:10.1177/0165551514552752. ISSN 0165-5515.
- ^ a b c d "Wayback Machine Won't Censor Archive for Taste, Director Says After Olympics Article Scrubbed". 2017年1月6日時点のオリジナルよりアーカイブ。2017年5月14日閲覧。
- ^ "What the Web Said Yesterday". The New Yorker. 2015年1月25日時点のオリジナルよりアーカイブ。2017年5月14日閲覧。
- ^ "The March for Science began with this person's 'throwaway line' on Reddit". Washington Post. 2017年4月23日時点のオリジナルよりアーカイブ。2017年4月23日閲覧。
- ^ "Are scientists going to march on Washington?". The Washington Post. 2017年1月31日時点のオリジナルよりアーカイブ。2017年1月31日閲覧。
- ^ Foley, Katherine Ellen. "The global March for Science started with a single Reddit thread". Quartz. 2017年4月24日時点のオリジナルよりアーカイブ。2017年4月23日閲覧。
- ^ "Internet Archive Frequently Asked Questions". Internet Archive. 2 April 2014. 2014年4月2日時点のオリジナルよりアーカイブ。2018年11月23日閲覧。
- ^ "Internet Archive Frequently Asked Questions". archive.org (英語). 2018年11月23日閲覧。
- ^ a b Bates, Mary Ellen (2002). “The Wayback Machine”. Online 26: 80.
- ^ a b "Internet Archive Frequently Asked Questions". archive.org (英語). 2013年4月20日時点のオリジナルよりアーカイブ。2018年10月18日閲覧。
- ^ a b c Lloyd, Howard (October 2009). "Order to Disable Robots.txt" (PDF). 2011年5月13日時点のオリジナル (PDF)よりアーカイブ。2009年10月15日閲覧。
- ^ Cortes, Antonio (October 2009). "Motion Opposing Removal of Robots.txt". 2010年10月27日時点のオリジナルよりアーカイブ。2009年10月15日閲覧。
- ^ Gelman, Lauren (17 November 2004). "Internet Archive's Web Page Snapshots Held Admissible as Evidence". Packets. 2 (3). 2011年4月30日時点のオリジナルよりアーカイブ。2007年1月4日閲覧。
- ^ Howell, Beryl A. (February 2006). "Proving Web History: How to use the Internet Archive" (PDF). Journal of Internet Law: 3–9. 2010年7月5日時点のオリジナル (PDF)よりアーカイブ。2008年8月6日閲覧。
- ^ Wynn W. Coggins (Fall 2002). "Prior Art in the Field of Business Method Patents – When is an Electronic Document a Printed Publication for Prior Art Purposes?". USPTO. 2012年9月21日時点のオリジナルよりアーカイブ。2020年7月20日閲覧。
- ^ "Debunking the Wayback Machine". 2010年6月29日時点のオリジナルよりアーカイブ。2020年7月20日閲覧。
- ^ Bahr, Martin (2002). "The Wayback Machine und Google Cache - eine Verletzung deutschen Urheberrechts?". JurPC (ドイツ語). doi:10.7328/jurpcb/20021719. 2009年8月23日時点のオリジナルよりアーカイブ。2020年7月20日閲覧。
- ^ "Internet Archive FAQ". Archive.org. 2014年4月17日時点のオリジナルよりアーカイブ。2014年4月16日閲覧。
- ^ Bowman, Lisa M (2002年9月24日). “Net archive silences Scientology critic”. CNET News.com. オリジナルの2012年5月15日時点におけるアーカイブ。 2007年1月4日閲覧。
- ^ Jeff (23 September 2002). "exclusions from the Wayback Machine" (Blog). Wayback Machine Forum. Internet Archive. 2007年2月11日時点のオリジナルよりアーカイブ。2007年1月4日閲覧。 Author and Date indicate initiation of forum thread.
- ^ Miller, Ernest. "Sherman, Set the Wayback Machine for Scientology". LawMeme. Yale Law School. 2012年11月16日時点のオリジナル (Blog)よりアーカイブ。2007年1月4日閲覧。
- ^ Dye, Jessica (2005). “Website Sued for Controversial Trip into Internet Past”. EContent. 28 (11): 8–9.
- ^ Bangeman, Eric (August 31, 2006). “Internet Archive Settles Suit Over Wayback Machine”. Ars technica. オリジナルのNovember 5, 2007時点におけるアーカイブ。 2007年11月29日閲覧。.
- ^ a b Internet Archive v. Shell, 505 F.Supp.2d 755 at justia.com, 1:2006cv01726 (Colorado District Court August 31, 2006) (“'April 25, 2007 Settlement agreement announced.' Filing 65, 2007-04-30: '...therefore ORDERED that this matter shall be DISMISSED WITH PREJUDICE...'”).
- ^ a b Babcock, Lewis T., Chief Judge (13 February 2007). "Internet Archive v. Shell Civil Action No. 06cv01726LTBCBS" (PDF). 2014年1月25日時点のオリジナルよりアーカイブ (PDF)。2015年3月25日閲覧。
1) Internet Archive's motion to dismiss Shell's counterclaim for conversion and civil theft (Second Cause of Action) is GRANTED, 2) Internet Archive's motion to dismiss Shell's counterclaim for breach of contract (Third Cause of Action) is DENIED; 3) Internet Archive's motion to dismiss Shell's counterclaim for Racketeering under RICO and COCCA (Fourth Cause of Action) is GRANTED.
- ^ Claburn, Thomas (2007年3月16日). “Colorado Woman Sues To Hold Web Crawlers To Contracts”. New York, NY, US: InformationWeek, UBM Tech, UBM LLC. オリジナルの2014年9月4日時点におけるアーカイブ。 2015年3月25日閲覧. "Computers can enter into contracts on behalf of people. The Uniform Electronic Transactions Act (UETA) says that a 'contract may be formed by the interaction of electronic agents of the parties, even if no individual was aware of or reviewed the electronic agents' actions or the resulting terms and agreements.'"
- ^ Samson, Martin H., Phillips Nizer LLP (2007). "Internet Archive v. Suzanne Shell". internetlibrary.com. Internet Library of Law and Court Decisions. 2014年8月3日時点のオリジナルよりアーカイブ。2015年3月25日閲覧。
More importantly, held the court, Internet Archive's mere copying of Shell's site, and display thereof in its database, did not constitute the requisite exercise of dominion and control over defendant's property. Importantly, noted the court, the defendant at all times owned and operated her own site. Said the Court: 'Shell has failed to allege facts showing that Internet Archive exercised dominion or control over her website, since Shell's complaint states explicitly that she continued to own and operate the website while it was archived on the Wayback machine. Shell identifies no authority supporting the notion that copying documents is by itself enough of a deprivation of use to support conversion. Conversely, numerous circuits have determined that it is not.'
- ^ brewster (25 April 2007). "Internet Archive and Suzanne Shell Settle Lawsuit". archive.org. Denver, CO, USA: Internet Archive. 2010年12月5日時点のオリジナルよりアーカイブ。2015年3月25日閲覧。
Both parties sincerely regret any turmoil that the lawsuit may have caused for the other. Neither Internet Archive nor Ms Shell condones any conduct which may have caused harm to either party arising out of the public attention to this lawsuit. The parties have not engaged in such conduct and request that the public response to the amicable resolution of this litigation be consistent with their wishes that no further harm or turmoil be caused to either party.
- ^ Conger, Kate. "Backing up the history of the internet in Canada to save it from Trump". TechCrunch. 2016年12月27日時点のオリジナルよりアーカイブ。2017年5月14日閲覧。
- ^ "Where to find what's disappeared online, and a whole lot more: the Internet Archive". Public Radio International. 2017年3月28日時点のオリジナルよりアーカイブ。2017年5月14日閲覧。
- ^ Chirgwin, Richard. "There's no Wayback in Russia: Putin blocks Archive.org". 2016年10月7日時点のオリジナルよりアーカイブ。2017年5月14日閲覧。
- ^ "Russia won't go Wayback, blocks the Internet Archive". Digital Trends. 26 June 2015. 2016年4月17日時点のオリジナルよりアーカイブ。2017年5月14日閲覧。
- ^ "Help Us Keep the Archive Free, Accessible, and Reader Private | Internet Archive Blogs". 2017年5月21日時点のオリジナルよりアーカイブ。2017年5月14日閲覧。
- ^ Herb, Ulrich. "Die Trump-Angst grassiert" (ドイツ語). heise online. 2016年12月7日時点のオリジナルよりアーカイブ。2017年5月14日閲覧。
- ^ LaFrance, Adrienne. "The Internet's Dark Ages". The Atlantic. 2017年5月7日時点のオリジナルよりアーカイブ。2017年5月14日閲覧。
- ^ LaFrance, Adrienne. "The Human Fear of Total Knowledge". The Atlantic. 2016年12月2日時点のオリジナルよりアーカイブ。2017年5月14日閲覧。
- ^ "The Entire Internet Will Be Archived In Canada to Protect It From Trump" (英語). Motherboard. 2017年5月16日時点のオリジナルよりアーカイブ。2017年5月14日閲覧。
ウェイバックマシン
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2022/02/17 09:52 UTC 版)
「インターネットアーカイブ」の記事における「ウェイバックマシン」の解説
詳細は「ウェイバックマシン」を参照 ウェイバックマシン (Wayback Machine)はインターネットアーカイブが保存するウェブアーカイブを閲覧することのできるサービスである。インターネットアーカイブのもっともよく知られたサービスの一つであり、ときに「インターネットアーカイブ」がウェイバックマシンと同義に使われることもある他、「ウェイバックマシン」がその背景のWebクローリングを含んだ意味で使われることもある。ウェイバックマシンを使えば、ウェブページが保存された時点の状態を閲覧することができ、また「Save Page」にURLを貼り付けることで、そのページをその場でインターネットアーカイブのウェブアーカイブに保存できる。インターネットアーカイブはウェイバックマシンの技術を「3次元インデックス」と呼んでいる。 ウェイバックマシンで閲覧可能なウェブアーカイブは、1996年のサービス開始当時はアレクサ・インターネットから提供されたデータが元であったが、インターネットアーカイブは2010年後半から独自の大規模Webクローリングを開始し、現在では自身で収集したデータが半分以上を占める。以前はデータ収集から公開まで半年から一年かかっていたが、独自のWebクローリングと2013年の技術革新により、数時間から一日で公開されるようになった。また「Save Page」で保存されたものは即時に閲覧可能である。 ウェイバックマシンが保持しているデータ量は、2001年時点ではおよそ100テラバイトに過ぎなかったが、2004年時点で1ペタバイトに達し、月に20テラバイトの割合で増加を続けている。2003年に報告された増加率は月あたり12テラバイトであったので、1年でおよそ倍の速度になった。これは、議会図書館など世界最大規模の図書館の文書量をはるかに上回るものである。そして2012年にはデータ総量は10ペタバイトを超えた。保存されたページ数(厳密には「ページ」ではない画像やスクリプトなども含む)では、2015年6月現在で4820億に達し、一週間あたりおよそ10億ページの割合で増加中である。このデータのコピーは新アレクサンドリア図書館にも保存されている。 ウェイバックマシンの過去のページの再生表示は、様々な理由により不完全であることがある。例えば、アレクサ・インターネットから提供されるデータにはHTMLファイルしか含まれていないため、2010年以前のアーカイブはページの画像などが表示されないものが大半である。またWebクローリングの技術的制約により、Webページの再生に必要なデータ全てが収集されないことや、Webページの再生表示技術の制約などによりページ表示が正常に行われないことなどは、特に最近の高度に動的なWebページではよく見られる。また、ウェブページを構成するスクリプトや画像などの部品はページのHTMLと同時点で収集されたものとは限らず、1年以上の時間差があることも稀ではない。さらに、いったん収集されたWebアーカイブが、関係者の要請やrobots.txtの配置によりウェイバックマシンから取り除かれることもある。 「ウェイバックマシン」という名称はロッキー・アンド・ブルウィンクル・ショー(英語版)の一シーンからとられた。このアニメシリーズは学者風の蝶ネクタイをした犬のピーボディ先生と人間の助手シャーマンが「ウェイバックマシン (WABAC machine)」と呼ぶタイムマシンを使って歴史上の有名な事件にちょっかいを出すというコメディアニメである。 公的な保存とは別途、個人のレベルでも、特定の個人がインターネット上に運営していたWebサイト、Blogを個人の死後も管理、保存することがどのようにして可能か、といった話題もWeb Magazine、Web ニュースなどに出てくるようになった。保険会社などが遺言の執行と合わせて、こうしたサービスを行っているようなものはないが、難病での闘病生活をおくった人のドキュメントやさまざまな公益的で共有すべき内容を持ったもの(人権、環境、社会問題、女性、健康と福祉、情報公開、特殊な個人的体験など)、オンラインソフトウェアの開発サイトなどが、関係者によって保存、維持されている例はある。こうしたものには、Webサイトを保存しているものと、故人を追悼するためのものとが混在している。
※この「ウェイバックマシン」の解説は、「インターネットアーカイブ」の解説の一部です。
「ウェイバックマシン」を含む「インターネットアーカイブ」の記事については、「インターネットアーカイブ」の概要を参照ください。
- ウェイバックマシンのページへのリンク