您现在的位置是:首页 > 网站制作 > 推荐工具推荐工具

网页抓取工具

A Xing2020-07-25【推荐工具】人已围观

简介teleport ultra 破解版是一款实用简单的网页资源下载器,通过该软件,用户可以监控某一个网页的所有资源,并将其下载到自己的电脑上,您可以自定义下载的内容,包括图片、文字、flash动画等资源,也可以将整个网页上的内容全部一次性下载,方便你设计自己的网页作品;teleport ultra中文版提供资源搜索功能,您可以创建多个搜索项目,包括项目类型文件,背景图像,声音文件,甚至是ZIP文件或程序,都可以搜索到,其运行的速度非常快,几分钟就能扫描整个网页,需要的朋友可以下载体验!

 teleport ultra 破解版是一款实用简单的网页资源下载器,通过该软件,用户可以监控某一个网页的所有资源,并将其下载到自己的电脑上,您可以自定义下载的内容,包括图片、文字、flash动画等资源,也可以将整个网页上的内容全部一次性下载,方便你设计自己的网页作品;teleport ultra中文版提供资源搜索功能,您可以创建多个搜索项目,包括项目类型文件,背景图像,声音文件,甚至是ZIP文件或程序,都可以搜索到,其运行的速度非常快,几分钟就能扫描整个网页,需要的朋友可以下载体验!

软件功能

 Teleport Pro的大哥Teleport Ultra拥有Pro的直观界面和易于使用的基于项目的设计 - 但它也可以在一个项目中扫描多达26万个地址。像Teleport Pro一样,Teleport Ultra可以在一个项目中处理多个服务器,大大提高其吞吐量。然而,其较大的数据库可以处理更大的网站和更多的服务器,使您能够在单个项目中下载更多信息。

 Teleport Ultra还是一个增强功能的webspider,具有Teleport Pro缺乏的探索,过滤和重写功能。

 •完全下载一个网站,使您能够以更快的速度“离线浏览”网站如果您要浏览网站

 •创建一个完整的重复,或“镜像”的网站,完成子目录结构和所有所需文件

 •搜索某个类型(和大小)文件的网站

 •从Internet自动下载文件列表

 •浏览从中央网站链接的每个网站

 •在网站上搜索关键字

 •列出网站上的所有页面和文件没有更多的等待慢页面下载。没有更多的点击链接几个小时,只找到垃圾你的踪迹的尽头Teleport可以完全自动化您的网站搜索,镜像,发布和下载任务

软件特色

 使用正则表达式指定包含的以及排除的区域进行爬网

 指定用于爬行具有多个名称的服务器的域别名

 借助浏览器的Cookie缓存,让您对浏览器执行复杂身份验证,然后使用Teleport进行爬网

 将自定义HTTP标头注入到服务器请求中

 同步脱机副本,以便自动删除旧文件和孤儿

 重写链接到未解决的文件时,可以使用可自定义的消息

 控制HTML标记并使用原始URL注入元标记并检索日期/时间戳

 可以抓取HTTPS(安全)服务器

使用说明

 要使用Teleport,您可以创建一个包含Internet上文件的一个或多个地址的项目文件。您还给Teleport一些规则,定义它将遵循的链接以及它将检索哪些文件。你呢发送蜘蛛的任务,在文件菜单上选择开始命令,或按开始按钮在工具栏上。

 一旦激活,Teleport蜘蛛将会读取您的项目的起始地址并检索它的任何文件找到那里然后它读取该页面上的所有链接,遵循这些链接,获取这些页面上的文件,直到它用完的地方去。

 您可以告诉Teleport仅检索某些类型的文件,并仅遵循某些类型的链接。对于例如,您可以指示它仅检索jpg和gif文件,世界上通常的图形文件类型万维网。你也可以指示它只跟踪与起始地址相同的域内的链接,甚至设置其“深度”的搜索。你的“程序”蜘蛛的行为将决定它有多远,怎么样需要很长时间,它将获得什么类型的文件。

 Teleport蜘蛛是非常灵活的。它有许多可定制的探索参数来指定哪些类型的链接要跟踪和哪些类型的文件要检索。大多数时候,你可以让新建项目向导为您设置项目的勘探参数。新项目向导将会通常选择最适合大多数传送任务的参数。

 Teleport使用特殊的搜索算法快速搜索网页,识别和分类其链接然后检索与“项目属性”表中指定的文件类型相匹配的所有文件。

 Teleport从项目的第一个起始地址开始。 Teleport蜘蛛仔细检查p年龄,提取其所有链接及其对嵌入式数据的所有引用。如果您设置了文件类型规范,Teleport则会检索与该页面相匹配的每个文件您所请求的文件类型。如果您没有指定任何类型,Teleport只会检索每个文件。每检索的文件存储在项目子目录中,它始终以您的项目命名。如果你有要求Teleport获取“嵌入式”文件,例如出现在网页上的图形和声音,Teleport也会得到那些。

 Telep ort spider然后将页面的链接分类到其他页面。如果一个链接指向一个页面p roject的Exploration Depth,或者如果它指向排除的域中的页面,它将被丢弃。那蜘蛛依次访问其余页面;检查它们的链接和文件;检索他们的文件;分类链接...等等

 如果您的项目有多个起始地址,Teleport蜘蛛将重复上述过程起始地址。

 随着Telepo rt蜘蛛探索每个新页面,它将页面的添加项插入项目图。您可以点击项目图中的任何一个年龄选择它。检索到该页面的文件将显示在文件中列表。

teleportultra.zip
d62b1315e5dd71133911463a22b85837.zip (1015.85 KB)

Tags:网页   抓取工具   抓取   工具

很赞哦! ()

文章评论