采集配置教程 · ptcms安装教程

安装了ptcms4.2.8小说程序以后，很多小伙伴不知道怎么配置采集教程，今天来介绍一下具体的采集方法。 ![](https://img.kancloud.cn/f9/62/f96231b5f716a8c851e2bc69e340c716_1351x543.png) 导入采集规则，选择新站点，添加新书打勾。其他默认（以后如果因为源站改动规则失效，可以找人写下那个失效站点的规则，然后导入，选择这个老站点，覆盖掉对应的站点和规则就行） ![](https://img.kancloud.cn/05/7b/057b146fd30881651065ed9ac5d7d371_1348x527.png) 点击测试，先测试下规则能不能用，再加入后台任务计划。采集时间间隔默认是600，我嫌时间太长，设置成60。 ![](https://img.kancloud.cn/ae/13/ae13313066ce84123665563527e51d93_1006x484.png) ![](https://img.kancloud.cn/e0/9c/e09c4ab5551df912f361d009b193a3ae_1357x553.png) 然后启动运行就行，我这里已经是开启的了，如果提示主线进程状态失败，时间也是1970，采集不了的，那说明你还没配置cron。直接看这篇第10步有说明。 ![](https://img.kancloud.cn/32/50/3250cbc473238a90f2806fb31e85efab_1034x509.png) 现在就能自动采集了，但是因为ptcms的特性，自动采集每天也就几百，有的人网站刚建好，小说太少，嫌慢，希望自己先主动采集多少本，后面再挂着自动采集，现在来说明下 ![](https://img.kancloud.cn/4e/24/4e243fdd68efaf0e38618923e54c1fbe_1157x544.png) 一般选用后台离线采集，选择规则，自定义页面，填入要采集的页面，比如说https://www.biquge.info/paihangbang\_postdate/1.html 这个页面，是第一页，第二页只是后面的1变成2。可以用\[page\]这个页码代码来代替比如说 https://www.biquge.info/paihangbang\_postdate/\[page\].html 比如我要采集这个页面的1-5页，就可以如下图这样写。好了教程就到这里，我没用里面的书号采集，书号采集容易出现采集到废的小说或很多没封面的。 ![](https://img.kancloud.cn/36/9e/369eaba68329060d09a28a52843caf6e_951x550.png) 关于网站的基础配置教程可以参考这篇设置。