如何织梦dedecms采集文章详细介绍方法

2017-04-13 21:00:21 dedecms

是用

织梦

建站的时候,经常会遇到采集文章。要是手动的添加文章需要花费大量的时间,那么使用采集规则如何来采集文章呢

第一步:进入后台 找到 “采集”-》采集节点管理     然后 “新增节点”

新增节点

第二步:单击 “确定”之后 填写相关的参数。

到需要采集的页面右击查看源文件,知道采集的文章的编码格式。

今天我们使用

笔记部落

的网站开源CMS教程来举例 http://www.wangjinhai119.com/kyjc/

到这个页面右击查看得知编码格式utf-8的。节点名称:开源CMS教程,编码格式uft-8

单击下一页 我们得知前两页的网址规则是:

http://www.wangjinhai119.com/kyjc/list_3_1.html

http://www.wangjinhai119.com/kyjc/list_3_2.html

其他的页面都一样不一样的就是后面的 1、2数字不相同

所以在匹配的网址把1修改*

若是大家采集的没有规则的话。就选择 

手工指定网址列表

第三步:列表网址获取规则写完之后,下面我们来写文章网址匹配规则

若链接含有图片选择 “采集为缩率图”

文章网址匹配规则

点击保存设置进入下一步,可以看到我们获得的文章网址

说明我们获取到正确了

第四步:过滤内容。选择“常用规则”选择对应的进行过滤就可以,然后保存并且开始采集。采集完成就可以了

 

采集完成

 最后一步   导出数据完成