企业🤖AI智能体构建引擎,智能编排和调试,一键部署,支持私有化部署方案 广告
**[Crawler](https://git.oschina.net/apollozhu/org.iipg.crawler)** 网络爬虫,使用模板文件进行数据抽取,使用HurricaneDB进行数据存储。 ``` git@git.oschina.net:apollozhu/org.iipg.crawler.git ``` ![](https://box.kancloud.cn/726b976e5ab1f12be23db714920f2e1a_1034x321.png) **[Crawler RCP](https://git.oschina.net/apollozhu/org.iipg.crawler-gui)** Eclipse RCP客户端,用于抓取指定页面并分析,生成抓取模板,该模板可被后台抓取爬虫使用。 ``` git@git.oschina.net:apollozhu/org.iipg.crawler-gui.git ``` ![](https://box.kancloud.cn/83cea192100801a965f7f73968a28a6a_1029x568.png) **[WebCrawler模板](https://git.oschina.net/apollozhu/webcrawler)** 网络爬虫使用的模板文件示例。 ``` git@git.oschina.net:apollozhu/webcrawler.git ``` ![](https://box.kancloud.cn/49a02d430e27362cd51734a4aacbbb33_1027x295.png) **[聚合新闻页面](https://git.oschina.net/apollozhu/site.crawler)** 展示网络爬虫抓取的新闻内容,使用Ajax直接访问Solr服务。 ``` git@git.oschina.net:apollozhu/site.crawler.git ``` ![](https://box.kancloud.cn/1b7b6eb2ee6ffff69f7d505cafe0279e_1036x665.png)