网址采集也就是万能采集,只要您会编写采集规则,可以采集任何一个网站的内容。
![](https://box.kancloud.cn/22c95c89655e9491a04a923d2d86116c_895x708.png)
“请输入栏目页的网址”,这里的栏目页是指链接列表页,这个功能内置了2套通用采集算法,如果“算法1”和“算法2”的采集结果都不好,你可以自己编写采集规则,采集的时候指定您编写的采集规则即可。
* * * * *
下面以采集网易新闻为例给大家演示一下
我们想采集“网易社会”新闻,下面一步一步教大家如何操作。
第一步:我们要找到“网易社会”这个栏目地址并复制出来
![](https://box.kancloud.cn/980fc3acbe17608222a1d71132316bc0_806x640.png)
* * * * *
第二步:把复制的栏目地址粘贴进去。
![](https://box.kancloud.cn/a6599a016e018c94dcf30c9be6fda4a8_847x640.png)
* * * * *
第四步:分析内容页网址必须含的字符
![](https://box.kancloud.cn/a1b7103982b56b0e4a78fe3e8a4d5a90_988x640.png)
* * * * *
第五步:把内容页网址中必须包含的字符串填写进去。
![](https://box.kancloud.cn/91e35b379767a09c851de0cf6bdd65fd_976x640.png)
* * * * *
第六步:采集成功之后,在结果内容那里,网址都是“必须包含字符串”
![](https://box.kancloud.cn/a7af9ba7c8c9a6f9e74b0c6316ca3faf_814x599.png)
> 众大云采集官方网站:http://www.csdn123.net/
>