本帖最后由 pig2 于 2014-5-16 13:23 编辑
问题导读:
1.如何使Solr自动生成UUID ?
2.生成自动id,需要修改那两个文件?
3.修改文件之后,还需要做什么修改才能生效?
Solr基于Lucene的索引,而索引中的最基本的单元式Document,在Solr中,管理每一个Document(更新、删除、查询),基本都会用到对应的ID,类似关系数据表中的主键。但是,如果我希望Solr能够自动生成这个唯一的ID,有时候也省去了不少的工作,而只需要在Solr中进行配置即可。
下面,通过实例来说明,如何配置Solr支持的UUID。首先,示例的schema.xml对应的表结构,如图所示:
在Solr中配置生成唯一UUID,需要修改两个配置文件:
schema.xml schema.xml文件的配置内容,增加如下类型配置:
- <fieldType name="uuid" class="solr.UUIDField" indexed="true" />
复制代码
再增加ID字段的类型,如下所示: - <field name="id" type="uuid" indexed="true" stored="true" multiValued="false" required="true" />
复制代码
这样还不够,还需要指定在更新索引的时候,使用这个更新策略,即配置一个requestHandler元素。
solrconfig.xml
配置solrconfig.xml文件,修改更新索引的requestHandler 配置,内容如下所示: - <requestHandler name="/update" class="solr.UpdateRequestHandler">
- <lst name="defaults">
- <str name="update.chain">dispup</str>
- </lst>
- </requestHandler>
复制代码
上面的update.chain就是我们实际要指定的使用UUID进行更新的策略的配置,如下所示:- <updateRequestProcessorChain name="dispup">
- <processor class="solr.UUIDUpdateProcessorFactory">
- <str name="fieldName">id</str>
- </processor>
- <processor class="solr.LogUpdateProcessorFactory" />
- <processor class="solr.DistributedUpdateProcessorFactory" />
- <processor class="solr.RunUpdateProcessorFactory" />
- </updateRequestProcessorChain>
复制代码
经过上面两步配置,在进行索引的时候,就不需要指定Document所要求的ID了,完全有Solr自动生成这个ID字符串。下面看看,我们配置后,生成的Document的信息,示例如下所示:
- <response>
- <lst name="responseHeader">
- <int name="status">0</int>
- <int name="QTime">1</int>
- </lst>
- <result name="response" numFound="86773" start="0">
- <doc>
- <int name="log_id">6410</int>
- <long name="start_time">87318</long>
- <long name="end_time">88282</long>
- <int name="prov_id">1</int>
- <int name="city_id">105</int>
- <int name="area_id">0</int>
- <int name="idt_id">5100</int>
- <int name="cnt">29</int>
- <int name="net_type">5</int>
- <int name="time_type">1</int>
- <int name="time_id">20130810</int>
- <str name="id">4cb43476-eb96-498e-a3a0-8d13c0a6c8c5</str>
- <long name="_version_">1443405623457742848</long>
- </doc>
- <doc>
- <int name="log_id">6410</int>
- <long name="start_time">87318</long>
- <long name="end_time">88282</long>
- <int name="prov_id">1</int>
- <int name="city_id">105</int>
- <int name="area_id">0</int>
- <int name="idt_id">5101</int>
- <int name="cnt">29</int>
- <int name="net_type">5</int>
- <int name="time_type">1</int>
- <int name="time_id">20130810</int>
- <str name="id">faef555d-1587-489e-889a-c7c696607d3b</str>
- <long name="_version_">1443405623459840000</long>
- </doc>
- </result>
- </response>
复制代码
可见,正好满足我们的需要了。
|