ThinkChat2.0新版上线,更智能更精彩,支持会话、画图、阅读、搜索等,送10W Token,即刻开启你的AI之旅 广告
### 1.10数据采集 采集器免费版下载地址:[url][http://pan.baidu.com/s/1i39ZL6t[/url](http://pan.baidu.com/s/1i39ZL6t[/url)] 一、下载入库规则文件。 火车采集器的入库规则是可以自己制作的,为了便于理解和测试,本站已经做好了一个文章入库规则在火车采集器的Module目录里。 二、设置采集规则。 方法这里不用介绍了,详细参考火车采集器的帮助http://help.locoy.com/。 三、发布内容设置。 1、选择“工具”菜单中的“web发布配置管理” 2、编辑规则文件。 ![](https://box.kancloud.cn/2016-04-06_5704d0083b92e.png) 如上图所示,必须修改username和password值,这里的账号和密码填写后台管理员登陆的账号和密码。 3、选择在线发布模板,就是(步骤一)下载的规则文件,配置如下图所示。 ![](https://box.kancloud.cn/2016-04-06_5704d00864ce4.png) 登录方式选择“不需要登录”。 只要能获取到栏目列表就配置成功了,保险起见还是来测试发布一下吧,没什么问题那就保存。 然后随便填写一个配置名称,再保存配置。 4、启用“Web在线发布到网站”,添加发布配置,选择刚刚保存的名字,再获取列表,如下图。 ![](https://box.kancloud.cn/2016-03-07_56dd0a81bf845.png) 配置完成。 四、开始采集。 选择建立的任务,选择“采网址”、“采内容”、“发布”选项,再点开始任务即可。 ![](https://box.kancloud.cn/2016-04-06_5704d008a356d.png) 采集完成之后,进入管理后台,内容管理,采集发布的内容是“未审核”状态,这里可以编辑再发布。 ![](https://box.kancloud.cn/2016-04-06_5704d008cecbd.png) 建议:网站上线后,不需要采集时可以删除controllers目录下的ImportController.php采集文件。