官方介绍
八爪鱼数据采集系统以完全自主研发的分布式云计算平台为核心,可以在很短的时间内,轻松从各种不同的网站或者网页获取大量的规范化数据,帮助任何需要从网页获取信息的客户实现数据自动化采集,编辑,规范化,摆脱对人工搜索及收集数据的依赖,从而降低获取信息的成本,提高效率。功能介绍
1、可以采集包括QQ邮箱、邮箱、淘宝ID、评价信息、简历信息、电话号码、新闻资讯等各种网页数据。2、可以对任何网站进行采集:点击,登陆,翻页,甚至识别验证码,当网页出错误,或者多套模版完全不一样的时候,还可以根据不同情况做不同的处理
3、云采集,关机也可以:配置好采集任务,就可以关机了,任务可以在云端执行,数量庞大的企业云,24*7不间断运行,再也不用担心IP被封,网络中断了,还能瞬间采集大量数据
八爪鱼采集器应用范围
1. 金融数据,如季报,年报,财务报告, 包括每日最新净值自动采集;2. 各大新闻门户网站实时监控,自动更新及上传最新发布的新闻;
3. 监控竞争对手最新信息,包括商品价格及库存;
4. 监控各大社交网站,博客,自动抓取企业产品的相关评论;
5. 收集最新最全的职场招聘信息;
6. 监控各大地产相关网站,采集新房二手房最新行情;
7. 采集各大汽车网站具体的新车二手车信息;
8. 发现和收集潜在客户信息;
9. 采集行业网站的产品目录及产品信息;
更新日志
v8.4.6版本迭代功能
优化数据预览刷新机制
优化全部字段面板
Bug修复
修复复制粘贴步骤的问题
修复数据预览二级面板点选按钮异常问题
修复自动识别后登录显示异常问题
修复修改循环步骤方式页面异常跳转问题
修复字段预览显示排序不正确问题
v8.4.0版本
本地采集模块
本地采集浏览器技术升级
解决浏览器造成闪屏、串屏、采集面板前置导致影响电脑其他应用使用情况
解决电脑睡眠重新启动后无法继续采集、卡死等问题
自定义任务编辑模块
自定义任务页面浏览器技术升级
数据预览区块编辑结构调整
新增了纵向字段编辑模式
新增页面和提取步骤层级结构
优化流程图、网页、数据预览三个模块之间的联动关系
优化视觉界面和交互
修复设置去重字段,去重状态显示错误的问题。
定时入库模块
新增窗口缩放、搜索功能、任务名排序
实现启停状态的筛选>
下载仅供下载体验和测试学习,不得商用和正当使用。
下载体验