爬山虎采集器下载爬山虎数据采集器 v3.0.4.5 官方安装版下载-脚本之家

下载

热门排行

简介

爬山虎数据采集器 v3.0.4.5 官方安装版

爬山虎采集器简单易学，通过可视化界面，鼠标点击即可抓取数据。内置一套高速浏览器内核，加上HTTP引擎模式，实现快速采集数据。爬山虎采集器能够采集互联网99%的网站，包括单页应用Ajax加载等等动态类型网站，需要的朋友赶紧下载吧。

功能介绍

　　向导模式

　　简单易用，轻松通过鼠标点击自动生成脚本

　　定时运行

　　可按照计划定时运行，无需人工

　　独创高速内核

　　自研的浏览器内核，速度飞快，远超对手

　　智能识别

　　对于网页中的列表、表单结构（多选框下拉列表等）能够智能识别

　　广告屏蔽

　　定制的广告屏蔽模块，兼容AdblockPlus语法，可添加自定义规则

　　多种数据导出

　　支持Txt 、Excel、MySQL、SQLServer、SQlite、Access、网站等

软件特色

　　一键提取数据

　　简单易学，通过可视化界面，鼠标点击即可抓取数据

　　快速高效

　　内置一套高速浏览器内核，加上HTTP引擎模式，实现快速采集数据

　　适用各种网站

　　能够采集互联网99%的网站,包括单页应用Ajax加载等等动态类型网站

使用流程

　　1、输入采集网址

　　打开软件，新建任务，输入需要采集的网站地址。

　　2、智能分析，全程自动化提取数据

　　进入到第二步后，爬山虎采集器全自动智能分析网页，并且从中提取出列表数据。

　　3、导出数据到表格、数据库、网站等

　　运行任务，将采集到的数据导出为Csv、Excel以及各种数据库，支持api导出。

常见问题

　　问：如何过滤列表中的前N个数据？

　　1.有时我们需要对采集到的列表进行过滤，比如过滤掉第一组数据（在采集表格时，过滤掉表格列名）

　　2.点击列表模式菜单中的，设置列表xpath

　　问：如何抓包获取Cookie，并且手动设置？

　　1.首先，使用谷歌浏览器打开要采集的网站，并且登陆。

　　2.然后按下 F12,会出现开发者工具，选择 Network

　　3.然后按下F5，刷新下页面，选择其中一个请求。

　　4.复制完成后，在爬山虎采集器中，编辑任务，进入第三步，指定HTTP Header。

更新日志

　　3.0.2.8

　　2021/6/24

　　修复部分系统下任务结束时异常退出问题

　　修复编辑器中脚本命令一直等待问题

　　优化默认导出路径，记录上次保存目录

　　修复数据处理-文本替换不能保存换行问题

爬山虎采集器v3.0.2.7更新：

　　1、修复分页的采集优先级

　　2、提前检验xpath和正则的正确性

　　3、其他使用了Inputbox的验证修改

　　4、增加数据处理-前后缀

　　5、修复英文系统下乱码问题

　　6、修复小分辨率下，窗口超过屏幕问题

　　7、新增路由拨号和adsl拨号功能

　　8、对等待命令增加等待某元素

　　9、修复form的解析

　　10、任务列表按时间顺序排列

　　11、完善探测列表数据（列表就是a元素

　　12、修复下载文件无后缀问题

　　13、新增高级过滤功能

　　14、添加鼠标和键盘的模拟操作

　　15、增大滚动页数