企业🤖AI智能体构建引擎,智能编排和调试,一键部署,支持私有化部署方案 广告
###1.10数据采集 采集器免费版下载地址:[url]http://pan.baidu.com/s/1i39ZL6t[/url] 一、下载入库规则文件。 火车采集器的入库规则是可以自己制作的,为了便于理解和测试,本站已经做好了一个文章入库规则在火车采集器的Module目录里。 二、设置采集规则。 方法这里不用介绍了,详细参考火车采集器的帮助http://help.locoy.com/。 三、发布内容设置。 1、选择“工具”菜单中的“web发布配置管理” 2、编辑规则文件。 ![](https://box.kancloud.cn/2016-03-07_56dd0a81756e6.png) 如上图所示,必须修改username和password值,这里的账号和密码填写后台管理员登陆的账号和密码。 3、选择在线发布模板,就是(步骤一)下载的规则文件,配置如下图所示。 ![](https://box.kancloud.cn/2016-03-07_56dd0a8196012.png) 登录方式选择“不需要登录”。 只要能获取到栏目列表就配置成功了,保险起见还是来测试发布一下吧,没什么问题那就保存。 然后随便填写一个配置名称,再保存配置。 4、启用“Web在线发布到网站”,添加发布配置,选择刚刚保存的名字,再获取列表,如下图。 ![](https://box.kancloud.cn/2016-03-07_56dd0a81bf845.png) 配置完成。 四、开始采集。 选择建立的任务,选择“采网址”、“采内容”、“发布”选项,再点开始任务即可。 ![](https://box.kancloud.cn/2016-03-07_56dd0a81db681.png) 采集完成之后,进入管理后台,内容管理,采集发布的内容是“未审核”状态,这里可以编辑再发布。 ![](https://box.kancloud.cn/2016-03-07_56dd0a821718b.png) 建议:网站上线后,不需要采集时可以删除controllers目录下的ImportController.php采集文件。