软件功能
一、规则配置简单 采集功能强大1、可视化自定义采集流程
全程问答式引导、可视化操作、自定义采集流程
自动记录和模拟网页操作顺序
高级设置满足更多采集需求
2、点选抽取网页数据
鼠标点击选择要爬取的网页内容、操作简单
可选择抽取文本、链接、属性、html标签等
3、运行批量采集数据
软件按照采集流程和抽取规则自动批量采集
快速稳定,实时显示采集速度和过程
可切换软件后台运行,不打扰前台工作
4、导出和发布采集的数据
采集的数据自动表格化,自由配置字段
支持数据导出到Excel等本地文件
和一键发布到CMS网站/数据库/微信公众号等媒体
二、支持采集不同类型的网站
电商类、生活服务类、社交媒体、新闻论坛、地方网站......
强大浏览器内核,99%以上网站都能采!
三、全平台支持 全免费 可视化操作
支持所有操作系统:Windows+Mac+Linux
采集和导出全免费,无限制放心用
可视化配置采集规则,傻瓜式操作
四、功能强大,箭速迭代
智能识别网页数据,导出数据方式多样
软件定期更新升级,不断添加新功能
客户的满意是对知识兔最大的肯定!
使用后羿采集器如何采集百度搜索结果数据?
步骤1:创建采集任务1)启动后羿采集器,进入主界面,点击创建任务按钮创建 "向导采集任务"
2)输入百度搜索的URL,包括三种方式
1、手动输入:在输入框中直接输入URL,多个URL时须要换行分割
2、点击从文件中读取方式:用户选择一个存放URL的文件,文件中可以有多个URL地址,地址须要换行分割。
3、批量添加方式:通过添加并调整地址参数生成多个有规律的地址
步骤2:定制采集过程
1)点击创建后自动打开第一个URL进而进入向导设置,此处选择列表页,点击下一步
2)填写搜索关键字和选择输入关键字的输入框,点击下一步
3)进入第一个关键字搜索结果页面后,点击设置搜索按钮,点击下一步
4)点选列表块中第一块元素
5)再点击结果列表块中另外一块元素,此时自动选中列表块。点击下一步
6)选择下一页按钮,选中选择下一页选项,然后点击页面中的下一页按钮填充第一个输入框,第二个数据框可以调节采集运行中点击下一页按钮的次数。理论上次数越多,采集到的数据越多。点击下一步
7)选择要采集的字段:在焦点框中点选要抽取的元素后点击下一步
8)选择不进入详情页。点击保存或保存并运行
步骤3:数据采集及导出
1)采集任务运行中
2)采集完成后,选择“导出数据”可以把数据都导出到本地文件
3)选择“导出方式”,将采集好的数据导出,这里可以选择excel作为导出为格式
4)采集数据导出后如下图
更新日志
v3.6.2版本修复正则处理的问题>
下载仅供下载体验和测试学习,不得商用和正当使用。
下载体验