### 1.10数据采集
采集器免费版下载地址:[url][http://pan.baidu.com/s/1i39ZL6t[/url](http://pan.baidu.com/s/1i39ZL6t[/url)]
一、下载入库规则文件。
火车采集器的入库规则是可以自己制作的,为了便于理解和测试,本站已经做好了一个文章入库规则在火车采集器的Module目录里。
二、设置采集规则。
方法这里不用介绍了,详细参考火车采集器的帮助http://help.locoy.com/。
三、发布内容设置。
1、选择“工具”菜单中的“web发布配置管理”
2、编辑规则文件。
![](https://box.kancloud.cn/2016-04-06_5704d0083b92e.png)
如上图所示,必须修改username和password值,这里的账号和密码填写后台管理员登陆的账号和密码。
3、选择在线发布模板,就是(步骤一)下载的规则文件,配置如下图所示。
![](https://box.kancloud.cn/2016-04-06_5704d00864ce4.png)
登录方式选择“不需要登录”。
只要能获取到栏目列表就配置成功了,保险起见还是来测试发布一下吧,没什么问题那就保存。
然后随便填写一个配置名称,再保存配置。
4、启用“Web在线发布到网站”,添加发布配置,选择刚刚保存的名字,再获取列表,如下图。
![](https://box.kancloud.cn/2016-03-07_56dd0a81bf845.png)
配置完成。
四、开始采集。
选择建立的任务,选择“采网址”、“采内容”、“发布”选项,再点开始任务即可。
![](https://box.kancloud.cn/2016-04-06_5704d008a356d.png)
采集完成之后,进入管理后台,内容管理,采集发布的内容是“未审核”状态,这里可以编辑再发布。
![](https://box.kancloud.cn/2016-04-06_5704d008cecbd.png)
建议:网站上线后,不需要采集时可以删除controllers目录下的ImportController.php采集文件。