archive.is

archive.is(又名為archive.today)是一個私人資助的网页存档網站,[1][2]資料中心位於歐洲法國的北部-加来海峡[3]這個網站典藏檔案館使用Apache HadoopApache Accumulo軟體。它可以一次取回一個類似於WebCite的小於50MB的頁面,並能收錄Google地圖Twitter

archive.is
archive.is網站截圖
网站类型
數位圖書館
语言多语言
网址
商业性质
注册
推出时间2012年2012
现状線上

archive.is会根据版權所有者的合乎數位千年版權法案(DMCA)的撤除請求移除已存檔的頁面。[4]

它每次請求都會擷取網頁的文字內容,載入不含活動元素或指令碼的Web 2.0網站或由JavaScript產生的圖片與框架內容。 截圖是1024×768像素,沒有快顯畫面。[5][6]

截至2015年,archive.is還支援了Memento ProjectAPI[7][8]並且開發了Firefox瀏覽器[9]與Chrome瀏覽器[10]擴充功能

封鎖

在2015年7月21日,網站管理者們封鎖了芬蘭的IP位址,他们在其Twitter上聲稱,这麼做是為了避免與芬蘭政府的糾紛升級。他們拒絕提供額外的資訊。[11]此網站也被中華人民共和國當局與哈薩克斯坦當局封鎖。此站同樣被OpenDNS封鎖。[12]

易名

archive.is曾多次更換網域名稱。

從建站初期至2014年4月14日是使用「Archive.is」(首字母為大寫)。

在2014年4月15日時,該網站的名稱已更名為「archive.today」(首字母為小寫)。[13][14]

在2015年春季又改回了「archive.is」(首字母為小寫)。[15][16]

使用案例

這個檔案館会被一些作者或駭客活動分子使用。

  • 有些在线用户(例如玩家门成員)使用它查看他们反对的网站的内容以避免向其贡献网站流量[17]
  • 朱利安·阿桑奇《當Google遇上維基解密》(When Google Met WikiLeaks)的一書中[18]使用了archive.is保留線上引文。[19]
  • 叙利亚电子军為了證明他們入侵網站而使用它。[20]

評論

有別於比如網際網路檔案館時光機Internet Archive Wayback Machine)的主动性網路蜘蛛,archive.is每次只擷取網站的一個頁面,所以不遵守「Robots排除標準」。 [21]

從法律上講,archive.today與網際網路檔案館時光機有很大不同。互联网档案馆的时光机抓取网页时遵循通常的Robots指令,这种指令可以阻止其抓取特定的网页。然而,网站无法阻止archive.today的用户对其制作站点镜像。

參見

參考文獻

  1. pseric. . Free.co.tw. 2015-06-27 [2015-07-26]. (原始内容存档于2015-06-27).
  2. Martin Brinkmann. . GHacks. 2015-04-22 [2015-06-13]. (原始内容存档于2015-10-12).
  3. . Stat Radar. [2013-05-08]. (原始内容存档于2013-07-27).
  4. . [2015-07-17]. (原始内容存档于2015-07-21).
  5. . archive.today. [2013-05-08]. (原始内容存档于2012-06-28).
  6. . archive.today. [2013-05-08]. (原始内容存档于2013-04-20).
  7. Nelson, Michael L. . Research and Teaching Updates. Web Science and Digital Libraries Research Group at Old Dominion University. 2013-07-09 [2013-09-17]. (原始内容存档于2013-07-27).
  8. "archive.is" 页面存档备份,存于 Memento Protocol Information. Memento Development Group. Retrieved 17 September 2013.
  9. . addons.mozilla.org. [2019-06-29]. (原始内容存档于2019-06-25).
  10. . chrome.google.com. [2019-06-29]. (原始内容存档于2019-06-29).
  11. archive.today. . 2015-07-21 [2015-07-22]. (原始内容存档于2015-10-21).
  12. Jared. . 2015-07-24 [2019-06-29]. (原始内容存档于2018-12-28).
  13. archive.is - webpage capture - Google 2014年4月14日 11:21:06 GMT (Peeep.usのキャッシュ 页面存档备份,存于
  14. archive.today - webpage capture - Google 2014年4月18日 17:40:45 GMT (Peeep.usのキャッシュ 页面存档备份,存于
  15. . megalodon.jp. [2015年7月19日]. (原始内容存档于2015年6月28日).
  16. . megalodon.jp. [2015年7月19日]. (原始内容存档于2015年6月28日).
  17. Koebler, Jason. . 2014-10-29 [2019-06-29]. (原始内容存档于2019-06-29).
  18. . [2015-07-17]. (原始内容存档于2015-07-21).
  19. user, Debian. . 2014-10-24 [2015-07-17]. (原始内容存档于2016-01-14).
  20. . 2015-06-14 [2015-07-17]. (原始内容存档于2015-06-11).
  21. Dascalescu, Dan. . Wiki.dandascalescu.com. 2013-02-18 [2013-10-03]. (原始内容存档于2015-10-12).

外部連結

This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.