后羿采集器 操作方式
1、输入正确的网址输入了正确的网址,这个采集任务就成功了一半。后羿采集器支持单网址和多网址采集,也支持从本地TXT文件中导入网址。
2、选择页面类型及设置分页
在智能模式下,后羿采集器会默认按照列表类型进行识别,如果您输入的是单页类型,此时会出现识别错误;或者由于其他原因,即使是列表类型的网页,智能识别也出现了偏差(知识兔会一直进行优化智能识别功能)。此时您可以手动选择页面类型和设置分页,从而辅助软件识别出正确的结果。
3、预登录
在数据采集过程中,知识兔有时候会遇到需要登录才能查看内容的网页,这时知识兔需要用到预登录功能,登录成功之后就能进行正常的数据采集。
4、切换浏览器模式
在数据采集过程中,可以使用不同的浏览器模式来优化采集效果,具体使用场景需要根据实际情况来判断。
5、设置提取字段
智能模式下,软件会自动识别网页中的数据并展示到采集结果预览窗口,用户可以根据自己的需求对字段进行设置。
6、采集任务的基础设置
在启动采集任务之前,知识兔需要对采集任务进行设置,包括一些基础设置和防屏蔽设置。
7、采集任务的高级设置:定时采集
定时采集功能属于采集任务的高级设置,该功能可实现在用户设置的时间周期内,在固定的时间点开启和停止数据采集任务。如果您设置了定时采集,请保证软件一直处于工作状态(不能关机)。
8、采集任务的高级设置:自动入库
自动入库功能属于采集任务的高级设置,该功能可实现在数据采集的同时,自动发布采集结果到数据库,而无需等到任务结束才能够导出数据。自动入库功能搭配定时采集功能,能够极大的节约时间,提高工作效率。
9、采集任务的高级设置:下载图片
下载图片属于采集任务的高级设置,该功能可以实现在采集数据的同时,将网页上的图片下载到本地。
10、查看采集结果及导出数据
如果您未使用自动入库功能,则需要手动导出采集结果。完成上述设置之后,知识兔就可以启动采集任务了。在设置任务的过程中,采集任务会被自动保存,在采集任务结束之后,用户可以查看采集结果并导出数据。后羿采集器对采集结果导出不做任何限制,无需积分,完全免费,大家可以放心使用。
软件特色
1、智能采集智能分析并抽取列表/表格数据,并且能自动识别分页。 免配置一键采集各种网站,包括分页、滚动加载、登录采集、AJAX等等。
2、多种数据导出
一键导出采集的所有数据。支持CSV, EXCEL和HTML等,同时也支持导出数据到数据库。
3、云端账号
采集任务自动保存到云端,不用担心任务丢失。一个账号多终端操作,可随时随地创建和修改采集任务等。
4、跨平台支持
后羿采集器支持各种操作系统,包括Windows, Mac和Linux。 不管是个人采集,还是团队/企业使用,都能满足您的各种需求。
更新日志
v3.6.2版本修复正则处理的问题>
下载仅供下载体验和测试学习,不得商用和正当使用。
下载体验