企业🤖AI智能体构建引擎,智能编排和调试,一键部署,支持私有化部署方案 广告
网址采集也就是万能采集,只要您会编写采集规则,可以采集任何一个网站的内容。 ![](https://box.kancloud.cn/22c95c89655e9491a04a923d2d86116c_895x708.png) “请输入栏目页的网址”,这里的栏目页是指链接列表页,这个功能内置了2套通用采集算法,如果“算法1”和“算法2”的采集结果都不好,你可以自己编写采集规则,采集的时候指定您编写的采集规则即可。 * * * * * 下面以采集网易新闻为例给大家演示一下 我们想采集“网易社会”新闻,下面一步一步教大家如何操作。 第一步:我们要找到“网易社会”这个栏目地址并复制出来 ![](https://box.kancloud.cn/980fc3acbe17608222a1d71132316bc0_806x640.png) * * * * * 第二步:把复制的栏目地址粘贴进去。 ![](https://box.kancloud.cn/a6599a016e018c94dcf30c9be6fda4a8_847x640.png) * * * * * 第四步:分析内容页网址必须含的字符 ![](https://box.kancloud.cn/a1b7103982b56b0e4a78fe3e8a4d5a90_988x640.png) * * * * * 第五步:把内容页网址中必须包含的字符串填写进去。 ![](https://box.kancloud.cn/91e35b379767a09c851de0cf6bdd65fd_976x640.png) * * * * * 第六步:采集成功之后,在结果内容那里,网址都是“必须包含字符串” ![](https://box.kancloud.cn/a7af9ba7c8c9a6f9e74b0c6316ca3faf_814x599.png) > 众大云采集官方网站:http://www.csdn123.net/ >