Archive-It

✍ dations ◷ 2025-11-13 08:00:26 #Archive-It
互联网档案馆(英语:Internet Archive)是一个非营利性的数字图书馆组织。成立于1996年,由Alexa创始人布鲁斯特·卡利创办。提供数字数据如网站、音乐、动态图像、和数百万书籍的永久性免费存储及获取。迄至2012年10月,其信息储量达到10PB。除此之外,该档案馆也是网络开放与自由化的倡议者之一。其数据是由自带的网络爬虫自动搜集的,其网站典藏(英语:Web archiving)档案馆网站时光机,抓取了超过1500亿的网页。其年度预算约为1000万美元,来源则是其网页爬虫服务、合作关系、赞助以及卡利-奥斯丁基金会。总部位于旧金山里奇蒙德区,此地雇员只有数十人,大部分雇员工作于书籍扫描中心,在红木城也有数据中心。该数据库是国际互联网保存联盟(英语:International Internet Preservation Consortium)成员,2007年被加利福尼亚州选为官方指定图书馆。档案馆收集的数据是各种各样的。截止2015年年初,互联网档案馆共收录了2400款MS-DOS游戏。1996年,卡利(Brewster Kahle)在创建盈利性的Alexa Internet时同时也创立了互联网档案馆;同年10月开始收集存储数据。不过,直到2001年开发了“时光机”前,这些数据都无法访问。1999年末扩展收集范围。2012年8月,宣布将在其现存的130万文件的下载选项中加入BitTorrent。因为通过两个文件数据中心协调,这成为从该档案馆下载数据的最快方法。2013年11月6日,档案馆在里奇蒙德区的总部失火,损坏了许多设备和一些附近的公寓,预计损失达到60万美元。网站时光机是互联网档案馆最重要的服务之一。其名取自一部名为The Rocky and Bullwinkle Show(英语:The Rocky and Bullwinkle Show)的美国卡通片,时光机允许人们去搜索和访问其网页存档。在一些国家和地区,时光机这个术语的使用已经非常普遍,“时光机”和“互联网档案馆”甚至开始被当做同义词使用。(亿)Archive-it是一款帮助机构和个人创建存档的工具。一旦目标网站的URL被输入并保存且该网站允许互联网档案馆所使用的Robots.txt访问,该网页将会成为时光机的一部分。截至2014年3月 (2014-03),Archive-it在美国的46个州和其他16个国家共有超过275个机构是其合作伙伴,共有超过74亿个网页的在线存档。互联网档案馆收集了世界各地的数字化图书以及各大图书馆和文化遗产机构的特殊藏品。互联网档案馆在5个国家经营着33个图书扫描中心,其活动受图书馆和基金会的财政支持。截至2013年7月 (2013-07),档案馆共收集了440万本书,每月的下载量超过1500万。截至2008年11月 (2008-11),档案馆共有100万个网络文本,总大小高达0.5PB,涵盖了原始照相图像、裁剪和歪斜的图像、PDF文件和原始OCR数据。(2015年11月27日)(2015年11月27日)(2015年11月27日)(2015年11月27日)除了上述内容之外,互联网文件库还收集了大量的数字媒体,这些数字媒体均符合美国公共领域或CC授权协议。这些媒体文件均会根据媒体类型(moving images、audio、text、etc.)被组织成集合,并根据各项标准被分入子集合。例如大都会艺术博物馆提供的相关资料就会被分入一个子集,当前该集合相关资料的数量已经超过了140,000个。每个主集合都含有一个“社区”子集合(以前被称为“开源”)用于存储公众的贡献。音频档案包括音乐,有声读物,新闻广播,旧时广播的节目和各种其他音频文件。该系列中有超过200,000个免费数字录音。子集包括有声读物和诗歌,播客,非英语音频等。Live Music Archive子集包括来自独立音乐家的超过170,000个音乐会录音,以及更为成熟的艺术家和音乐合奏,以及关于录制他们的音乐会的宽松规则,例如Grateful Dead,以及最近的The Smashing Pumpkins。此外,Jordan Zevon还允许互联网档案馆收藏他父亲Warren Zevon的音乐会录音。Zevon系列从1976年至2001年不等,包含126场音乐会,包括1,137首歌曲。此系列包含大约3,000件布鲁克林博物馆的物品。死机或数据库出错时,可于新亚历山大图书馆镜像网站查询1996至2007年的备份数据。

相关

  • 遗传性代谢缺陷遗传性代谢缺陷(英语:Inborn error of metabolism)在新陈代谢过程中,除了制造出营养外,如果身体未能将食物其他部分成功代谢成为可以从排泄器官(如消化系统,泌尿系统及排汗系统、呼
  • 50S50核糖体亚基是原核细胞内70S核糖体中的较大亚基。该亚基由一条5S rRNA、一条23S rRNA及约34个核糖体蛋白质分子构成,在原核翻译中负责在tRNA转运来的氨基酸分子之间形成肽键
  • 脉翅目广翅亚目 Megaloptera 蛇蛉亚目 Raphidioptera 蛟蛉亚目 Planipennia脉翅目(学名:Neuroptera)包括草蛉、蚁蛉、长角蛉等,属于完全变态的昆虫。这个目的成虫有两对膜状的的翅膀,前
  • 蕈类蕈类(注音:ㄒㄩㄣˋㄌㄟˋ;拼音:xùn lèi),通称蘑菇、菇类,是大型、高等的真菌,子实体通常肉眼可见。菌丝具横隔壁,将菌丝分隔成多细胞。不过,蘑菇一词通常是对蘑菇属(Agaricus)部分食
  • 转化生长因子β乙型转化生长因子(Transforming Growth Factor Beta, TGF-β)是存在于每个人体内的免疫调节因子,帮助改善过敏体质、调节免疫系统正常发展。TGF-β有三种异构物,其中‘TGF-β2’
  • 阿拉伯文字阿拉伯文字是一种用于书写阿拉伯语、曼丁哥语方言、中库尔德语、卢尔语、波斯语、乌尔都语、普什图语及其他亚非语言的书写系统。在16世纪还被用于书写西班牙语。阿拉伯文字
  • 麦粒肿麦粒肿(英语:Hordeolum,亦称Stye),又称为针眼、偷针㽿(“㽿”,南京官话:ko1,苦禾切),是眼睑下一种皮脂腺的感染。这导致眼睑边缘出现红肿,眼睑外侧或内侧可能会受到影响。麦粒肿的形成通
  • 山形大学山形大学(日语:やまがただいがく,英语:Yamagata University)位于山形县的日本国立大学。在日本通常被称呼为山大(やまだい,Yamadai)。现在为独立法人。山形大学
  • 尸皮尸皮(英语:cadaveric skin),是cadaveric skin的直接翻译,医学上也是称为尸皮或捐赠皮,是处理烧烫伤敷皮种类的一种,主要目的在于保护伤口、避免感染及协助伤者皮肤愈合、生成,而非一
  • 赫尔伯特·傅利曼赫伯特·弗里德曼(英语:Herbert Friedman,1916年6月21日-2000年9月9日),美国天文学家,太阳物理学、探空火箭、高层大气物理学和天文学应用的先驱,他也是一位政治家和大众科学传播者