电脑技术学习

Dedecms采集系统使用指南

admin
小蜜蜂采集器提供DedeCMS V3正式版导库模版

DedeCMS V3正式版用户请下载使用

http://bc.downreg.com/down/cms/DedeCMSV3.rar;使用前请先看说明

安装/使用前言:
BC是DownReg.COM全职团队开发的产品,非兼职行为产品;
BC专职开发团队目前已扩展到7人,能为您提供免费的:远程安装支持、采集规则配置支持、内容导库配置支持;若需获取支持请至官方论坛留言。
----------------------------------------
小蜜蜂采集器:文章采集、图片采集、Flash采集利器

欢迎使用不受目标语言限制、不选存储对象数据库的在线采集器,Google、Baidu搜索排名第一,完全免费,放心使用。

应用环境:基于PHP Mysql ZEND Optimizer的WEB系统
当前版本:V1.508 释放时间:06.05.08 17:12
旧版本用户升级请参考升级文件目录下说明文件操作!!!

更新说明:
☆新增功能
1、可采集需要用户登录才能浏览的目标
2、内容入库新增模拟提交方式,理论上支持任何目标,不受目标程序语言、数据库类别限制。
3、平台设计采用模块方式,方便后续功能扩展
4、增加采集结果标题相同过滤
5、支持自定义入库间隔时间,不受虚拟主机并发数限制
6、支持采集结果人工筛选,并提供“空标题、空内容的快速过滤删除
7、支持UTF-8转换到GB2312,可采集内容字符格式为UTF-8的目标
8、增加****部分网站防采功能
9、新增DedeCMS V3、PHP168 CMS、PHPWIND、Discuz完整入库支持
☆修正功能
1、更改采集链接算法
2、支持限制PHP FOPEN函数功能的虚拟主机
3、更改FALSH的采集算法
4、更改图片采集算法
5、优化分页采集功能
6、提升对规则包含非凡字符的支持
7、采集过程目标URL加密,避免参数冲突

适用范围:
1、采集目标不限,无所谓HTML、PHP、ASP、JAVA页面;
2、采集对象支持:文章、图片、Flash;
3、完美的内容入库解决方案,小蜜蜂采集器提供2种入库方式:数据库直导和模拟提交。
1)数据库直导方式支持任何基于Mysql数据库存储信息的内容治理系统;
2)模拟提交方式理论上支持任何目标,不受目标程序语言、数据库类别限制;实际使用效果受目标应用程序影响。

功能介绍:
1、支持文章内容分页采集;
2、支持UTF-8转换到GB2312,可采集内容字符格式为UTF-8的目标;
3、支持把文章内容保存到本地;
4、支持站点+栏目治理方式,使采集治理一目了然;
5、支持文章链接替换功能;
6、支持采集器设置无限过滤功能;
7、支持文章内图片采集保存到本地,自动替换文件名避免重复;
8、支持文章内FLASH文件采集保存到本地;
9、支持限制PHP FOPEN函数功能的虚拟主机;
10、支持采集结果人工筛选,并提供“空标题、空内容的快速过滤删除;
11、支持全站配置规则导入、导出;
12、支持栏目配置规则导入、导出,提供规则复制功能简化设置;
13、提供导库规则导入、导出;
14、支持CMS导库
  程序包内含PHPCMS、DedeCms(织梦) V2/V3、PHP168 CMS、mephpcms系统导库规则及操作指南说明;
15、支持PHPWIND、Discuz论坛导库,程序包内含2大论坛导库规则及操作指南说明;
16、支持自定义入库间隔时间,躲避虚拟主机并发数限制。

以下非凡功能仅“小蜜蜂采集器拥有:
1、支持采集过程断点续采功能,不受浏览器意外关闭影响,重新启动后不会重复采集;
2、支持自动对比过滤功能,对已采集的链接系统不会进行重复采集和入库;