**[Crawler](https://git.oschina.net/apollozhu/org.iipg.crawler)**
网络爬虫,使用模板文件进行数据抽取,使用HurricaneDB进行数据存储。
```
git@git.oschina.net:apollozhu/org.iipg.crawler.git
```
![](https://box.kancloud.cn/726b976e5ab1f12be23db714920f2e1a_1034x321.png)
**[Crawler RCP](https://git.oschina.net/apollozhu/org.iipg.crawler-gui)**
Eclipse RCP客户端,用于抓取指定页面并分析,生成抓取模板,该模板可被后台抓取爬虫使用。
```
git@git.oschina.net:apollozhu/org.iipg.crawler-gui.git
```
![](https://box.kancloud.cn/83cea192100801a965f7f73968a28a6a_1029x568.png)
**[WebCrawler模板](https://git.oschina.net/apollozhu/webcrawler)**
网络爬虫使用的模板文件示例。
```
git@git.oschina.net:apollozhu/webcrawler.git
```
![](https://box.kancloud.cn/49a02d430e27362cd51734a4aacbbb33_1027x295.png)
**[聚合新闻页面](https://git.oschina.net/apollozhu/site.crawler)**
展示网络爬虫抓取的新闻内容,使用Ajax直接访问Solr服务。
```
git@git.oschina.net:apollozhu/site.crawler.git
```
![](https://box.kancloud.cn/1b7b6eb2ee6ffff69f7d505cafe0279e_1036x665.png)