分享

基于lucene的案例开发5:搜索索引

本帖最后由 nettman 于 2015-4-16 22:42 编辑
问题导读

1.如何实现搜索索引?
2.如何实现检索索引,获取符合条件的前10条记录 ?
3.那个类用于读取索引?







接上篇
基于lucene的案例开发4:创建索引

  此事例中的索引数据来自于上一篇博客创建的索引,索引中包含两篇文档,每一篇文档中有两个域 name 、 content 。


索引搜索demo

      还是老样子在介绍之前先看一个简单索引搜索 demo程序。


  1. /**   
  2. *@Description:  索引检索demo
  3. */   
  4. package com.lulei.lucene.study;   
  5.   
  6. import java.io.File;  
  7.   
  8. import org.apache.lucene.analysis.Analyzer;  
  9. import org.apache.lucene.analysis.standard.StandardAnalyzer;  
  10. import org.apache.lucene.document.Document;  
  11. import org.apache.lucene.index.DirectoryReader;  
  12. import org.apache.lucene.queryparser.classic.QueryParser;  
  13. import org.apache.lucene.search.IndexSearcher;  
  14. import org.apache.lucene.search.Query;  
  15. import org.apache.lucene.search.TopDocs;  
  16. import org.apache.lucene.store.Directory;  
  17. import org.apache.lucene.store.FSDirectory;  
  18. import org.apache.lucene.util.Version;  
  19.    
  20. public class SearchIndex {  
  21.   
  22.     public static void main(String[] args) {  
  23.         Directory directory = null;  
  24.         try {  
  25.             //索引硬盘存储路径  
  26.             directory = FSDirectory.open(new File("D://study/index/testindex"));  
  27.             //读取索引  
  28.             DirectoryReader dReader = DirectoryReader.open(directory);  
  29.             //创建索引检索对象  
  30.             IndexSearcher searcher = new IndexSearcher(dReader);  
  31.             //指定分词技术,这里采用的语言处理模块要和创建索引的时候一致,否则检索的结果很不理想  
  32.             Analyzer analyzer = new StandardAnalyzer(Version.LUCENE_43);  
  33.             //创建查询query,搜索词为“空间向量”  
  34.             QueryParser parse = new QueryParser(Version.LUCENE_43, "content", analyzer);  
  35.             Query query = parse.parse("空间向量");  
  36.             //检索索引,获取符合条件的前10条记录  
  37.             TopDocs topDocs = searcher.search(query, 10);  
  38.             if (topDocs != null) {  
  39.                 System.out.println("总共查找到 " +  topDocs.totalHits + " 条符合条件的记录");  
  40.                 //循环输出记录内容  
  41.                 for (int i = 0; i < topDocs.scoreDocs.length; i++) {  
  42.                     Document doc = searcher.doc(topDocs.scoreDocs[i].doc);  
  43.                     System.out.println("第" + (i + 1) + "条内容为--\tname:\t" + doc.get("name") + "\tcontent:\t" + doc.get("content"));  
  44.                 }  
  45.             }  
  46.             //关闭资源  
  47.             dReader.close();  
  48.             directory.close();  
  49.         } catch (Exception e) {  
  50.             e.printStackTrace();  
  51.         }  
  52.     }  
  53. }  
复制代码


上述demo程序运行结果截图如下:
20150119221243663.png

      可以看出关键词 “空间向量” 的搜索结果为索引中的第二个文档,可以通过document.get方法可以获取对应的域值。

搜索索引核心类
      在上述索引搜索过程中,用到了几个核心类:Directory、DirectoryReader、IndexSearcher、Analyzer、Query、TopDocs,上一篇介绍过的核心类这里就不再继续介绍了,这里就介绍一下之前没有介绍过的类。

DirectoryReader

      DirectoryReader用于读取索引,创建的dReader对象用于创建用于搜索的IndexSearcher对象。

IndexSearcher

      IndexSearcher用于索引的搜索,这个类公开了几个搜索方法,它是连接索引的中心环节;可以将IndexSearcher类看做成一个以只读打开索引的类,关于IndexSearcher的更深层次的内容,将在后面博客中介绍。

Query
      Lucene中含有许多具体Query(查询)子类,Query子类有:TermQuery、BooleanQuery、PhraseQuery、PrefixQuery、PhrasePrefixQuery、TermRangQuery、NumericRangeQuery、FilteredQuery、SpanQuery等,这些子类也将会在以后的博客中一一介绍。

TopDocs
      TopDocs类是一个简单的指针容器,指针一般指向前N个排名的搜索结果,搜索结果即匹配查询条件的文档。

      到目前为止,我们可以用Lucene实现一个简单的索引创建、搜索事例,在后面的几篇博客中,我将会逐一介绍分词技术、Query众多子类、IndexSearcher的搜索API等,这几部分可以通过源代码的阅读来理解。



相关内容:
基于lucene的案例开发1:lucene初始认知

基于lucene的案例开发2:索引数学模型

基于lucene的案例开发3:索引文件结构

基于lucene的案例开发4:创建索引

基于lucene的案例开发5:搜索索引

基于lucene的案例开发6:分词器介绍

基于lucene的案例开发7:Query查询

基于lucene的案例开发8:IndexSearcher中检索方法

基于lucene的案例开发9:案例初识

基于lucene的案例开发10:搜索后台基础,JsonUtil & XmlUtil类介绍

基于lucene的案例开发11:项目常用类ClassUtil & CharsetUtil介绍

基于lucene的案例开发12:数据库连接池

基于lucene的案例开发13:实现实时索引基本原理

基于lucene的案例开发14:实时索引管理类IndexManager

基于lucene的案例开发15:实时索引的检索

基于lucene的案例开发16:实时索引的修改

基于lucene的案例开发17:查询语句创建PackQuery

基于lucene的案例开发18:纵横小说更新列表页抓取

基于lucene的案例开发19:纵横小说简介页采集

基于lucene的案例开发20:纵横小说章节列表采集

基于lucene的案例开发21:纵横小说阅读页采集
出处:http://blog.csdn.net/xiaojimanman/article/details/42836309

已有(2)人评论

跳转到指定楼层
feng01301218 发表于 2015-4-7 13:20:02
回复

使用道具 举报

zhujun182104906 发表于 2015-4-10 14:07:14
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

推荐上一条 /2 下一条