Solr是一款优秀的基于Lucene的全文检索服务器,它对Lucene进行了扩展,提供了非常丰富的查询语言,并对查询进行了性能优化。
## 1 Solr是什么?
Solr是一款优秀的基于Lucene的全文检索服务器,它对Lucene进行了扩展,提供了非常丰富的查询语言,并对查询进行了性能优化。
## 2 下载与安装Solr
由于当前Solr已经到了5.x版本,而Nutch1.10支持的最高版本是4.x,因此,需要到http://archive.apache.org/dist/lucene/solr/下载Solr的4.x的历史版本。本教程使用的版本是4.10.4,下载的软件包名为solr-4.10.4.zip。下载Solr:
~~~
wget http://archive.apache.org/dist/lucene/solr/4.10.4/solr-4.10.4.zip
~~~
解压:
~~~
unzip solr-4.10.4.zip
~~~
得到文件夹solr-4.10.4,将Nutch目录下的runtime/local/conf/schema-solr4.xml拷贝到solr的配置文件目录example/solr/collection1/conf下:
~~~
cp apache-nutch-1.10/runtime/local/conf/schema-solr4.xml solr-4.10.4/example/solr/collection1/conf
~~~
删除solr原schema.xml文件:
~~~
rm –f solr-4.10.4/example/solr/collection1/conf/schema.xml
~~~
将schema-solr4.xml改名为schema.xml:
~~~
mv solr-4.10.4/example/solr/collection1/conf/ schema-solr4.xml solr-4.10.4/example/solr/collection1/conf/ schema.xml
~~~
到此,Solr就配置完毕了,进入solr-4.10.4/example目录:
~~~
cd solr-4.10.4/example
~~~
启动Solr:
~~~
java –jar start.jar
~~~
此时就可以通过浏览器访问8983端口,查看Solr的控制界面:
http://192.168.1.11:8983/solr