网站时光机

✍ dations ◷ 2025-02-23 06:23:52 #译名请求,互联网的历史,1996年建立的网站,在线存档

网站时光机(英语:Wayback Machine)是万维网或互联网上传播的其他信息的一个数字文件网站,是美国加利福尼亚州旧金山的非营利组织——互联网档案馆最重要的服务之一。

网站时光机由互联网档案馆的创始人布鲁斯特·卡利和Bruce Gilliat(英语:Bruce Gilliat)于2001年推出,以解决网站在维护或关闭时无法查看内容的问题,此外还能查看网页的历史存档版本,创始人Kahle和Gilliat希望以此能为整个互联网提供“普遍获取所有知识”的途径。

Wayback Machine这个名称源于动画片The Rocky and Bullwinkle Show(英语:The Rocky and Bullwinkle Show)中的“WABAC机器(英语:WABAC machine) ”(发音为 ),这是一个时间旅行设备。在动画片的皮博迪的不可能的历史一集中,角色使用这一机器来见证、参与甚至改变历史上的著名事件。

网站时光机于1996年开始存档缓存网页,目标是在五年后将服务公之于众。从1996年到2001年,信息保存在数字磁带上,Kahle偶尔允许研究人员和科学家使用数据库。2001年,互联网档案馆成立五周年时,加州大学伯克利分校举行了网站时光机的公布仪式。当Wayback Machine推出时,它已经存档了超过100亿个页面。

如今,数据存储在互联网档案馆的大型Linux节点聚类上。有时会重新访问并存档网站的新版本(参见下文技术细节)。如果网站允许网络时光机“爬虫索引”网站并保存数据,则也可以通过在搜索框中输入网站的URL手动捕获网站。

网络时光机已经开发了软件用于“爬虫索引”并下载所有可公开访问的万维网页面、Gopher层次结构、Usenet公告板系统和可下载软件。这些“爬虫”收集的信息并不能包括因特网上所有可用的信息,因为许多数据受发布者限制或存储在不可访问的数据库中。为了克服部分缓存网站的不一致性,2005年,互联网档案馆开发了Archive-It.org,使得机构和内容创作者可以自愿收集和保存数字内容,并创建数字档案馆。

爬虫索引来自各种来源,其中一些是从第三方导入的,而另一些是由存档内部生成的。自2010年以来,"Worldwide Web Crawls"一直在运行,并捕获全球网站。

相关

  • 乌当区乌当区是中华人民共和国贵州省贵阳市东北部的一个市辖区。东经106°30'-107°03',北纬26°55'-26°33'。乌当区下辖6个镇、2个民族乡、5个社区服务中心:东风镇、水田镇、羊昌
  • HC≡CH乙炔,俗称电石气,是炔烃化合物系列中体积最小的一员,主要作工业用途,特别是烧焊金属方面。与氧气组成切割套装时,俗称风煤,风指压缩氧气,煤指乙炔。乙炔于1836年由英国科学家艾德蒙
  • 藤黄藤黄(英语:gamboge)是一种黄色颜料,产于柬埔寨、越南、泰国、印度等地。其拉丁文名称gambogium即源于柬埔寨(Gambogia)一词。藤黄取自热带金丝桃科植物的树脂,常用的包括藤黄属植物
  • 1068年
  • 印刷术印刷是指将影像或文字原稿迅速大量复制的一种技术。一般使用印刷机将油墨印在纸张上,它是出版的基本组成部分。印刷机是能够在承印物上印刷的机械。活字印刷术被称为中国古代
  • 朱莉·安德鲁斯朱莉·安德鲁斯女爵士,DBE(英语:Dame Julie Andrews,原名:茱莉亚·伊丽莎白·威尔士Julia Elizabeth Wells; 1935年10月1日-)是英国女演员、歌手和作家。她曾获奥斯卡金像奖、英国电
  • 宁远宁远可以指:
  • 质量摩尔浓度在化学中,溶液的重量摩尔浓度(也可称质量摩尔浓度或重量克分子浓度,英语:molality,用b或m表示)是指溶质物质的量 n s
  • 流通市场起源于古时人类对于固定时段或地点进行交易的场所的称呼,而此交易场所是那些需要经常进行物品交换的人,为了减少搜寻成本所自发形成的。词中的“市”指的并非“城市”,而是
  • 沪昆高铁.mw-parser-output .RMbox{box-shadow:0 2px 2px 0 rgba(0,0,0,.14),0 1px 5px 0 rgba(0,0,0,.12),0 3px 1px -2px rgba(0,0,0,.2)}.mw-parser-output .RMinline{float:none