用户组:游客
本帖最后由 pig2 于 2015-4-20 00:35 编辑 问题导读: 1、lucene搜索分页有哪两种方式? 2、不做缓存如何查询数据? 3、luc ...
问题导读: 1、构建索引的过程是怎样的? 2、lucene与关系型数据库它们俩从索引和模糊查询方面,两者的区别是什么? 3、什么 ...
本帖最后由 gefieder 于 2015-4-19 22:40 编辑 问题导读: 1、如何使用lucene对硬盘上的文件建立索引? 2、如何在索引文件中 ...
问题导读 1.Apache Nutch使用什么语言开发的? 2.为什么要将对应版本Nutch下的插件复制到我们的项目中来? 3.如何建立种子 ...
本帖最后由 nettman 于 2015-4-16 22:43 编辑 问题导读: 1、阅读页的信息如何采集? 2、如果鼠标右键无法查看网页源代码, ...
本帖最后由 nettman 于 2015-4-16 22:35 编辑 问题导读: 1、如果查看网页源代码时,发现页面已经把鼠标右键操作屏蔽了,还有 ...
问题导读 1.什么是结构化数据? 2.什么是非结构化数据? 3.如何对非结构化数据实现索引? 4.如何进行索引检索? ...
问题导读: 1、如何采集简介页内容? 2、采集时,如何获取标签和字数字段? 3、如何对获取的html代码做进一步处理? ...
本帖最后由 nettman 于 2015-4-16 22:37 编辑 问题导读: 1、CrawlListPageBase类功能是什么? 2、用HttpClient 模拟浏览器 ...
本帖最后由 nettman 于 2015-4-16 22:36 编辑 问题导读: 1、如何进行通配符检索? 2、如何定义范围搜索? 3、PackQuery类 ...
本帖最后由 nettman 于 2015-4-16 22:39 编辑 问题导读: 1、实时索引基本原理是什么? 2、ConfigBean类都定义了索引的哪些 ...
本帖最后由 nettman 于 2015-4-16 22:38 编辑 问题导读: 1、实时索引中的IndexWriter的操作都是委托给TrackingIndexWriter来 ...
本帖最后由 nettman 于 2015-4-16 22:38 编辑 问题导读: 1、检索结果的数据结构是怎样的? 2、如何利用实时索引去检索数据 ...
本帖最后由 nettman 于 2015-4-16 22:39 编辑 问题导读: 1、如何利用lucene来实现索引的管理? 2、如何实现索引的单例模式 ...
本帖最后由 pig2 于 2015-4-14 00:38 编辑 问题导读 1.lucene索引结构是层次结构,主要有哪几个层次? 2.索引的最小单位是 ...
问题导读 1.ClassUtil类中的方法的作用是什么? 2.CharsetUtil类工具类用途是什么? 3.如何使用第三方jar包检测文件的编码 ...
本帖最后由 nettman 于 2015-4-16 22:41 编辑 问题导读 1.在lucene中哪一个类用来对搜索结果做收集、自定义排序、过滤等? ...
本帖最后由 xioaxu790 于 2014-12-7 20:16 编辑 问题导读 1、什么是Solr Client,有哪些支持语言? 2、Solr的工作过程分为 ...
问题导读 1.solr为什么需要额外的分词器? 2.分词器如何配置? solr本身对中文分词的处理不是太好,所以中 ...
问题导读 1.StandardAnalyzer有什么优点和缺点? 2.基于Lucene的第三方中文分词是什么技术? 3.IKAnalyzer分词技术有什么缺 ...
本帖最后由 nettman 于 2015-4-16 22:42 编辑 问题导读 1.如何实现搜索索引? 2.如何实现检索索引,获取符合条件的前10条 ...
本帖最后由 nettman 于 2015-4-16 22:42 编辑 问题导读 1.如何指定索引分词技术? 2.如何把文档写到索引中? 3.创建索引 ...
问题导读 1.什么是文档、词元、域? 2.影响一个词元在一篇文档中的重要性主要有哪两个因素? 3.空间向量模型(VSM)可以表 ...
问题导读 1.如何实现构建RAMDirectory,将索引放入内存中? 2.自定义分词:3.0 ,4.x有什么不同? 3. 4.x 如何实现构建多索 ...
导读 本文主要是对代码的一些介绍及需要一些准备工作 项目结构: 效果图:需要建立索引的文件(我们需要 ...
问题导读 1.使用CSVRequestHandler过程中,如何避免空行出现的异常? 2.solr是如何导入csv文件的? 3.字段里面本来就有逗 ...
问题导读1.Lucene 5.0更新了哪些内容?2.Lucene已实现了为每个segment和每次提交都存储了唯一的id作用是什么? 近日,Apa ...
问题导读 1.Solr、ES在大索引上存在什么问题? 2. Hermes在索引上发生了怎样的改进? Hermes与开 ...
问题导读 1、什么是中文分词器? 2、如何加入一个新的fieldType配置项? 本文接上一篇 Solr学习(一)Tomcat7上 ...
本帖最后由 坎蒂丝_Swan 于 2015-1-23 17:43 编辑 问题导读 1.本文使用的是什么框架?2.IKAnalyzer与中文分词方法有什么不同 ...
本版积分规则 发表帖子
查看 »