Blue Flower

无人值守免费自动采集器(简称ET)从设计之初即以提高软件自动化程度为突破口,以达到无人值守,24小时自动工作的目的,经过测试,ET可以长期自动运行,即使以年为时间单位。无人值守免费自动采集器独立于网站,不消耗宝贵的服务器WEB处理资源,可以在服务器工作,也可以在站长工作机工作。
无人值守免费自动采集器使用网站本身的数据发布接口或程序代码处理、发布信息内容,不直接操作网站数据库,避免了任何因ET造成数据安全问题的可能性。采集信息时,ET则使用标准HTTP端口,不会造成网络安全漏洞。除了一般采集工具所具有的功能外,ET通过对图片水印、防盗链、分页采集、回复采集、登录采集、自定项、UTF-8、UBB、模拟发布……的支持,使用户能灵活的实现各种采发需求。
无人值守免费自动采集器

特色

1、设定好方案,即可24小时自动工作,不再需要人工干涉 
2、与网站分离,通过独立制作的接口,可以支持任何网站或数据库 
3、灵活强大的采集规则不仅仅是采集文章,可采集任何类型信息 
4、小巧、低耗和良好的稳定性非常适合运行于服务器 
5、所有规则都可以导入导出,灵活的资源重用 
6、采用FTP上传文件,稳定、安全 
7、下载上传支持断点续传 
8、高速伪原创 

采集

1、可选择倒序、顺序、随机采集文章 
2、支持自动列表网址 
3、支持对数据分布在多层页面的网站进行采集 
4、自由设定采集数据项,并可单独过滤整理每个数据项 
5、支持分页内容采集 
6、支持任意格式、类型的文件(包括图片、视频)下载 
7、可突破防盗链文件 
8、支持动态文件网址分析 
9、支持对需登录访问的网页的采集 
10、可设定关键词采集 
11、可设定防止采集的敏感词 
12、可设置图片水印 

发布

1、支持发布带回复的文章,可广泛用于论坛、博客等项目 
2、与采集数据分离的发布参数项,可自由对应采集数据或预设数值,极大增强发布规则的重用性 
3、支持随机选用发布账号 
4、支持任意发布项语言翻译 
5、支持编码转换、支持UBB代码 
6、文件上传可选择好自动建立年月日子目录 
7、模拟发布支持对无法安装接口的网站进行发布操作 
8、方案可定时工作 
9、防止网络运营商劫持HTTP功能 
10、可手动进行单项采集发布 
11、详尽的工作流程监视、信息反馈,让您迅速了解工作状态

更新日志

无人值守免费自动采集器v3.5.7更新日志
1、新增:自动分词模块,可用于自动提取关键词/TAG。
2、新增;数据项可以选择指定内容模式,支持引用其他数据项、随机字符串等预设内容。
3、优化:采集配置按照列表页、采集页、数据项的从属关系优化了界面。
4、优化:数据项现在可以选择是否使用翻译了,以方便对翻译内容进行整理。
5、优化:数据项现在可以独立选择是否修正网址了。
6、新增:采集页和数据分页的网址合成现在可以引用数据项,适应更复杂的网址合成。
7、优化:方案间隔时间从系统设置窗口移到制订方案窗口,可以为每个方案单独设置间隔时间了。
v3.1.4更新日志(2017-6-9)
1、修正:上一版中数据项不允许为空失效的问题。
v3.1.3更新日志(2017-6-2)
1、新增:数据项现在可以设置后置数据整理组,在完成数据项的包括翻译在内的各项操作后进行第二次加工。
2、新增:翻译增加‘待翻译数据项’栏,可以指定需要翻译的数据项名称。
3、修正:多列表测试时结果显示不完整的问题。
>

下载仅供下载体验和测试学习,不得商用和正当使用。

下载体验

请输入密码查看内容!

如何获取密码?

 

点击下载