HTTrack

✍ dations ◷ 2025-11-09 16:50:58 #HTTrack

HTTrack是一个自由、开源的网络爬虫以及离线浏览器。它的作者是泽维尔·罗奇（Xavier Roche），在GNU通用公共许可协议（GPL）下发布。

用户可以通过HTTrack把互联网上的网站页面下载到本地计算机上。在默认设置下，HTTrack对网站页面的下载结果是按照原始站点相对链接的结构来组织的。用网页浏览器打开这个被下载下来的网站（也称作镜像）的页面，就可以离线浏览了。

HTTrack也能对已经镜像过的站点进行更新。或者是对中断了的工作断点续传。可以通过选项和过滤器（include/exclude）配置HTTrack的方方面面。它还集成有帮助系统。它有一个基本的命令行版本和两个GUI（为Windows设计的WinHTTrack和为Unix-like系统设计的WebHTTrack）；命令行版本可以和Shell脚本（Shell script）以及cron联用。

HTTrack使用网络爬虫下载网站。对于有robots.txt的网站，如果不在程序运行时取消限制，默认设置下的程序不会把网站完全镜像。HTTrack能跟随基本的JavaScript，或者Applet、Flash中的链接，但是对于复杂的链接（使用函数和表达式创建的链接）或者服务器端的Image Map（英语：Image Map）则无能为力。

在许多Unix-like系统下，只需要用包管理工具安装httrack即可。例如Debian使用

sudo aptitude install httrack

一个使用例子：

httrack "http://www.all.net/" -O "/tmp/www.all.net" "+*.all.net/*" -v

它的意思是：以http://www.all.net/ 为起始URL，输出到/tmp/www.all.net文件夹，范围是www.all.net域名下的所有文件，并显示所有错误信息（verbose）。更详细的信息请看官网上的Users Guide。

相关

园林工具园艺工具是从事园艺工作或作为兴趣般的业余性活动时使用的工具。部分工具于农耕时亦会使用。最早手动工具由木材、燧石和骨头所组成，然而，工具为了使能更加持久高效切削，后来慢
国际金融中心国际金融中心（英语：Financial centre），指以第三级产业经济为主；以金融业服务业为中心的全球城市，这个全球城市必须拥有跨国公司和国际大银行的总部设立，要有活跃的外汇市场、股票市
杨学明杨学明（1962年10月－），中国物理化学家。中国科学院大连化学物理研究所研究员。生于浙江德清。1982年7月毕业于浙江师范大学物理系，1986年1月获中国科学院大连化学物理研究所硕士学
密文窃取在密码学中，密文窃取（CTS）是一种使用分组密码操作模式的通用方法，该操作模式允许处理不能均匀分割成块的消息，而不会导致密文的扩展，代价是稍微增加了复杂性。窃取密文是一种使用
坂东市坂东市（日语：坂東市／ばんどうし */?）是位于茨城县西南部的一市。2005年3月22日，岩井市与猿岛郡猿岛町合并成为坂东市。
戴伯韬戴伯韬（1907年7月15日－1981年3月6日），曾用名戴邦杰、戴白韬，化名白征东、戴邦，笔名白桃、许宗实，江苏丹阳人，中国教育家，中国共产党党员。戴伯韬投身于教育事业，为近现代中国教材和教
唐廷波唐廷波（1973年11月－），辽宁喀左人，汉族，中国共产党党员。中华人民共和国政治人物、第十三届全国人民代表大会辽宁地区代表。2018年2月24日，当选为第十三届全国人大代表。
苏珊娜·邦菲利奥苏珊娜·邦菲利奥（意大利语：Susanna Bonfiglio，1974年9月8日－），意大利前女子篮球运动员。她曾代表意大利国家队参加1996年夏季奥林匹克运动会篮球比赛，结果获得第八名。
吉亚斯丁·巴勒班吉亚斯丁·巴勒班（乌尔都语：غیاث الدین بلبن‎‎；？－1287年），是印度库特布沙希王朝第9位苏丹。他是前一位苏丹纳斯尔的维齐尔，他减少了叛逆的贵族的力量，并提高了苏丹的地位。尽管只有少量的军事成就，但他却是伊勒杜迷失至阿拉乌丁·卡尔吉之间最强大的统治者。他原是中亚钦察玉里伯里部人，是一位贵族之子。他幼年时被蒙古人俘获带到加兹尼卖为奴隶。他被卖给一位来自伊拉克巴士拉的苏非霍加·贾拉勒丁，被改名为巴哈·乌德丁。在1220年他被带到印度德里苏丹伊勒杜迷失处。他最初的工作是为苏丹带水壶，但很快就被
托尼·图雷克托尼·图雷克（德语：Toni Turek，1919年1月18日－1984年5月11日），德国前男子足球运动员，场上位置是守门员。他曾代表西德国家队参加1954年国际足联世界杯，结果队伍获得冠军。