离线浏览(Offline Browsing,又称脱机浏览,俗称扒站)是指用户将网络的共享文件或网页文件存储至本地,便于浏览存储文件。用户有可能会因为以下原因而需要离线浏览:
离线浏览在网费昂贵而且稍后读软件不够普及(类似Pocket和Safari中内置的阅读列表)时可以方便于阅览,但是在网费低廉同时又有大量优秀的稍后读软件时,离线浏览仍然有其需要的地方。
扒站软件的原理是利用服务器提供给客户端的源代码为基础并分析其中的连接和文件来完成过程。完成下载整个网站的时间,则跟网站的深度、网站的文件数目、网站的文件大小有关。如果网站的结构越深越复杂,所需要下载的时间则越多。
比较优秀的扒站软件会分析其中重复的链接,可以在条件中设置排除或者是要抓取的网站目录、文件类型或者是文件名称,从中以比较快的方式分析结构纳入抓取调度,如果结构非常的复杂,则还需要用户电脑的运算速度所影响。
而网站的文件数目、文件大小则影响下载的速度,增加速度的方式可经由用户网络环境的速度、或者是网络连线的数目去做调整,越大的网络速度、越多的网络连线数目可以有效的增加扒站的速度。
网络上的共享文件或文件夹可以被指定为允许离线浏览。使用这种方式可以使你在网络接断开后,仍然能看到可以离线浏览的文件和新创建的文件,重新连接网络后,“同步管理器”将根据离线时所作的更改来更新网络文件。要注意到是在首次使用时,要先对本地脱机文件进行相关的设置。
因特网上的网页甚至整个网站也可以被指定为允许离线浏览。你可以提前下载因特网上的网页或网站到本地磁盘,以便离线时浏览。
离线浏览网页就是在连接到因特网时快速打开感兴趣的网页,这样在断开连接时就可对刚刚打开过的网页进行离线浏览,任何支持临时文件的浏览器均可以用这种方式。这种离线浏览的方式可以有效节省连接到因特网的时间,在网费比较昂贵时应用比较广泛。但是必需要提前手工打开要浏览的网页,在想要离线浏览的东西比较多时显得效率比较低下。
离线浏览网站就是在连接到因特网时将整个网站或网站的一部分下载到本地,在断开网络时就可对下载下来的网站进行离线浏览,这种方式需要使用专门的软件,这类软件通常被称作离线网页浏览器(Offline Browser)。
使用Internet Explorer的收藏夹,可以将任意网站指定为可离线浏览的网站。并可以指定可离线浏览内容的数量,以及制定自动同步内容的计划,是一种比较简便的方式。
使用专业的离线浏览器(如Webzip、Teleport)允许你用更加定制的方式将网站下载到本地,软件内置多线程可以获得更快的下载速度,并且支持将下载的网站保存成一个文件,加快检索的速度的同时减少所占的空间。甚至可以将网站镜像保存在移动介质中,供完全没有网络连接到计算机使用。
使用扒站软件会将整个网站的数据内容复制回自己本机硬盘里,因为扒站软件时常一次发出许多的连线数,使得服务器的硬件资源无法承受,且占去网站的带宽,导致连线速度变的很缓慢,甚至是服务器主机死机,导致真正有浏览网站的需求的网友无法连上网站。
限制带宽的缺点是,倘若网站有提供文件下载,那么用户可能会不满文件的下载速度。
屏蔽IP地址是经由网站服务器的LOG档或者是服务器防火墙去分析不正常且频繁的浏览要求。
例如:一个IP地址瞬间同时开启许多页面(一般正常的浏览者不可能在一段时间内达到每秒数个页面同时浏览,发生这种状况则非常有可能是被扒站)