问题导读
1、什么是中文分词器?
2、如何加入一个新的fieldType配置项?
本文接上一篇
Solr学习(一)Tomcat7上部署solr4.5.1(Win7)
1 下载分词器:
下载中文分词器(IK Analyzer 2012FF_hf1.zip ):http://ik-analyzer.googlecode.co ... er%202012FF_hf1.zip
2 加入到Solr:
(1)将IKAnalyzer2012FF_u1.jar 复制到 E:\apache-tomcat-7.0.47\webapps\solr\WEB-INF\lib 目录下面。(即Tomcat的Webapps的Solr目录)
(2)在E:\apache-tomcat-7.0.47\webapps\solr\WEB-INF 下面创建目录classes,并将IKAnalyzer.cfg.xml 和 stopword.dic 复制到这个目录。
(3)配置之前从解压的Solr拷贝出来的solr文件夹下的配置文件。 即E:\SOLR_HOME\solr\collection1\conf目录下面的schema.xml配置文件。
随便找一个fieldType配置项的后面,加入一个新的fieldType配置项。
- <!-- IKAnalyzer 中文分词器配置 -->
- <fieldType name="text" class="solr.TextField">
- <analyzer class="org.wltea.analyzer.lucene.IKAnalyzer">
- </analyzer>
- </fieldType>
复制代码
这就OK了,在浏览器中输入 http://localhost:80/solr/#/collection1/analysis
可以看到这个界面:
在【field value(index)】中输入“我觉得我马上就要成功了,吃葡萄不吐葡萄皮。” ,下面下拉框选择text,然后点击analysis values按钮,如下图:
|