Archive.is

✍ dations ◷ 2024-11-05 17:30:10 #Archive.is
archive.is(又名为archive.today)是一个私人资助的网页存档网站, 数据中心位于欧洲法国的北部-加来海峡。 这个网站典藏(英语:Web archiving)档案馆使用Apache Hadoop与Apache Accumulo(英语:Apache Accumulo)软件。它可以一次取回一个类似于WebCite的小于50MB的页面,并能收录Google地图与Twitter。archive.is会根据著作权所有者的合乎数字千年著作权法案(DMCA)的撤除请求移除已归档的页面。它每次请求都会捕捉网页的文字内容,加载不含活动元素或脚本的Web 2.0网站或由JavaScript产生的图片与框架内容。 截图是1024×768像素,没有弹出窗口。截至2015年,archive.is还支持了Memento Project(英语:Memento Project)的API,并且开发了Firefox浏览器与Chrome浏览器的插件。在2015年7月21日,网站管理者们屏蔽了芬兰的IP地址,他们在其Twitter上声称,这么做是为了避免与芬兰政府的纠纷升级。他们拒绝提供额外的信息。此网站也被中国当局与哈萨克斯坦当局屏蔽。此站同样被OpenDNS屏蔽。archive.is曾多次更换域名。从建站初期至2014年4月14日是使用“Archive.is”(首字母为大写)。在2014年4月15日时,该网站的名称已更名为“archive.today”(首字母为小写)。在2015年春季又改回了“archive.is”(首字母为小写)。这个档案馆会被一些作者或黑客活动分子(英语:hacktivists)使用。有别于比如互联网档案馆时光机(Internet Archive Wayback Machine)的主动性网络蜘蛛,archive.is每次只捕捉网站的一个页面,所以不遵守“Robots排除标准”。从法律上讲,archive.today与互联网档案馆时光机有很大不同。互联网档案馆的时光机抓取网页时遵循通常的Robots指令,这种指令可以阻止其抓取特定的网页。然而,网站无法阻止archive.today的用户对其制作站点镜像。

相关

  • 真核生物真核生物(学名:Eukaryota)是其细胞具有细胞核的单细胞生物和多细胞生物的总称,它包括所有动物、植物、真菌和其他具有由膜包裹着的复杂亚细胞结构的生物,而不包括细菌和古菌,因它
  • 无性繁殖无性生殖是指生物体不以透过生殖细胞的结合方式,也就是不经由减数分裂来产生配子,直接由母体细胞分裂后产生出新个体的生殖方式。主要分为孢子繁殖(英语:Sporogenesis)、分裂生殖
  • 生物圈生物系统层级关系:生物圈 > 生态系统 > 群落 > 种群 > 个体生物圈(Biosphere)是指地球上所有生态系的统合整体,是地球的一个外层圈,其范围为海平面上下垂直10公里。它包括地球上
  • 空气空气是指地球大气层中的气体混合。它主要由78%的氮气、21%氧气、还有1%的稀有气体和杂质组成的混合物。空气的成分不是固定的,随着高度的改变、气压的改变,空气的组成比例也会
  • 协助自杀协助自杀(英语:Assisted Suicide)是指在另一个人的协助下自杀。 该术语有时特指“医生辅助自杀(Physician-Assisted Suicide)”,指由医生或其他医疗保健提供者所协助的自杀。如果
  • 苄青霉素苄青霉素(英语:Benzylpenicillin),也称青霉素G(penicillin G),是一种窄谱青霉素类抗生素,用于静脉注射或肌肉注射治疗儿童的各种细菌感染。通常直接用青霉素指苄青霉素。苄青霉素被
  • 抽动障碍抽动障碍(英文:Tics、Tic Disorder),为一种精神疾病。其被DSM定义为一类机动的或发声的行为障碍,包括各类抽动(突然的、急促的、不规律的、刻板的、无意识的运动)。其定义与ICD-10
  • 蛋白质A蛋白质A(英语:Protein A)为金黄色葡萄球菌表面上发现的一种表面蛋白,大小约为42 kDa。该蛋白由 spa 基因转译而成,并由DNA的拓朴结构、包内渗透压,以及一个名为ArlS-ArlR的双单元
  • 重商主义重商主义(英语:mercantilism)是在16世纪到18世纪之间盛行的经济理论、经济政策。重商主义是民族主义在经济上的一种形式。它的目标是最大限度的使国家富足与强盛,借由获取并留下
  • 各国人均国内生产总值地图这是一份按照人均国内生产总值(以购买力平价计算)排列的国家或地区列表。