Blue Flower

爬山虎采集器v2是由合肥简数科技出品的一款新一代智能化采集系统。它是一款简单易用的网页数据采集软件,一看免费的网页爬虫工具。同时还可以生成Excel表格、api数据库文件等内容,完全能够帮助您管理自己网站数据信息,如果您需要对某个指定网页数据进行采集,使用它就可以完全帮您解决。该软件能够采集互联网上的大部分网站数据,并且将数据导出为各种格式的文件或者数据库,比如csv、excel、mysql、sqlserver、sqlite、access,甚至可以通过指定接口发布到你的网站。爬山虎采集器v2采用可视化界面,一键采集,无需编程,智能分析,有需求的用户请下载使用!
202209130408262345790000

软件特色

知识兔1、向导模式
简单易用,轻松通过鼠标点击自动生成脚本
2、定时运行
可按照计划定时运行,无需人工
3、独创高速内核
自研的浏览器内核,速度飞快,远超对手
4、智能识别
对于网页中的列表、表单结构(多选框下拉列表等)能够智能识别
5、广告屏蔽
定制的广告屏蔽模块,兼容AdblockPlus语法,可添加自定义规则
6、多种数据导出
支持Txt 、Excel、MySQL、SQLServer、SQlite、Access、网站等

爬山虎采集器v2新功能

知识兔1、路由拨号功能
原理是通过脚本自动登陆到路由器中,找到其中的网络的连接、断开功能,先断开网络,再重新连接从而实现切换IP。 界面和操作与编辑采集前脚本类似。
202209130408265676750001
2、ADSL 拨号
支持本地ADSL拨号,以及动态IP拨号(淘宝上有很多卖的),以及重拨。
202209130408267953820002
3、高级过滤功能
通过设置一些条件过滤掉指定类型的数据,条件包括(不得包含、必须包含、数字小于、数字大于、日期大小等)
202209130408270349030003

更新日志

知识兔v3.0.3.7版本
新增数据处理-净化HTML
新增数据处理- html转纯文本
新增数据处理- OCR
新增智能识别功能,识别列表、正文、json数据
新增实时导出
新增 OCR管理
修复数据处理 空格的问题
添加删除运行历史记录
优化json的检测
修复脚本命令 运行js jq问题
脚本命令添加PDF、截图
脚本命令新增采集后运行
图片下载支持data:格式
粘贴header支持curl 格式
优化下载体验本地化界面,增加预览
v3.0.3.1版本
1、修复分页的采集优先级
2、提前检验xpath和正则的正确性
3、其他使用了Inputbox的验证修改
4、增加数据处理-前后缀
5、修复英文系统下乱码问题
6、修复小分辨率下,窗口超过屏幕问题
7、新增路由拨号和adsl拨号功能
8、对等待命令增加等待某元素
9、修复form的解析
10、任务列表按时间顺序排列
11、完善探测列表数据(列表就是a元素
12、修复下载文件无后缀问题
13、新增高级过滤功能
14、添加鼠标和键盘的模拟操作
15、增大滚动页数>

下载仅供下载体验和测试学习,不得商用和正当使用。

下载体验

请输入密码查看内容!

如何获取密码?

 

点击下载