Blue Flower

网络数据采集器通常是用来批量采集网页,论坛等的内容,直接保存到数据或发布到网络的一种信息化工具。后羿采集器 for mac版是由“前谷歌技术团队”打造的一款适用于macOS系统的网络数据采集软件,采用了最先进的人工智能技术,用户只需要在页面上输入网页地址就能够通过智能识别要抽取的数据和分页,简直就是最简单的网页采集方式。该软件全程可视化操作,点选修改要抽取的数据等,简单的操作方式即使是电脑初学者也能够轻易使用。后羿采集器拥有多种采集模式(智能和高级采集,满足不同采集需求),任何网站都能采,包括XPATH,JSON,HTTP和POST等。
后羿采集器 for mac版

后羿采集器 操作方式

知识兔1、输入正确的网址
输入了正确的网址,这个采集任务就成功了一半。后羿采集器支持单网址和多网址采集,也支持从本地TXT文件中导入网址。
2、选择页面类型及设置分页
在智能模式下,后羿采集器会默认按照列表类型进行识别,如果您输入的是单页类型,此时会出现识别错误;或者由于其他原因,即使是列表类型的网页,智能识别也出现了偏差(知识兔会一直进行优化智能识别功能)。此时您可以手动选择页面类型和设置分页,从而辅助软件识别出正确的结果。
3、预登录
在数据采集过程中,知识兔有时候会遇到需要登录才能查看内容的网页,这时知识兔需要用到预登录功能,登录成功之后就能进行正常的数据采集。
4、切换浏览器模式
在数据采集过程中,可以使用不同的浏览器模式来优化采集效果,具体使用场景需要根据实际情况来判断。
5、设置提取字段
智能模式下,软件会自动识别网页中的数据并展示到采集结果预览窗口,用户可以根据自己的需求对字段进行设置。
6、采集任务的基础设置
在启动采集任务之前,知识兔需要对采集任务进行设置,包括一些基础设置和防屏蔽设置。
7、采集任务的高级设置:定时采集
定时采集功能属于采集任务的高级设置,该功能可实现在用户设置的时间周期内,在固定的时间点开启和停止数据采集任务。如果您设置了定时采集,请保证软件一直处于工作状态(不能关机)。
8、采集任务的高级设置:自动入库
自动入库功能属于采集任务的高级设置,该功能可实现在数据采集的同时,自动发布采集结果到数据库,而无需等到任务结束才能够导出数据。自动入库功能搭配定时采集功能,能够极大的节约时间,提高工作效率。
9、采集任务的高级设置:下载图片
下载图片属于采集任务的高级设置,该功能可以实现在采集数据的同时,将网页上的图片下载到本地。
10、查看采集结果及导出数据
如果您未使用自动入库功能,则需要手动导出采集结果。完成上述设置之后,知识兔就可以启动采集任务了。在设置任务的过程中,采集任务会被自动保存,在采集任务结束之后,用户可以查看采集结果并导出数据。后羿采集器对采集结果导出不做任何限制,无需积分,完全免费,大家可以放心使用。
202209130411072134800001

软件特色

知识兔1、智能采集
智能分析并抽取列表/表格数据,并且能自动识别分页。 免配置一键采集各种网站,包括分页、滚动加载、登录采集、AJAX等等。
2、多种数据导出
一键导出采集的所有数据。支持CSV, EXCEL和HTML等,同时也支持导出数据到数据库。
3、云端账号
采集任务自动保存到云端,不用担心任务丢失。一个账号多终端操作,可随时随地创建和修改采集任务等。
4、跨平台支持
后羿采集器支持各种操作系统,包括Windows, Mac和Linux。 不管是个人采集,还是团队/企业使用,都能满足您的各种需求。

更新日志

知识兔v3.6.2版本
修复正则处理的问题>

下载仅供下载体验和测试学习,不得商用和正当使用。

下载体验

请输入密码查看内容!

如何获取密码?

 

点击下载