数据在千万级别上进行全文检索有哪些技术

数据在千万级别上，更加某些条件进行查询，请问有什么技术可以实现？现在用的是solr，但是感觉solr现在也比较慢了，还有其他的技术吗？

jixianqiuxue · 发表于 2015-3-9 16:51:21

1. lucene (solr, elasticsearch 都是基于它）

2. sphinx

ld512870 · 发表于 2015-3-9 22:33:37

elasticsearch 简单易用。天生分布式。

fly2015 · 发表于 2015-3-10 11:07:59

我们现在用的全文检索是elasticsearch

hery · 发表于 2015-3-10 11:42:09

fly2015 发表于 2015-3-10 11:07
我们现在用的全文检索是elasticsearch

查询速度快吗？？我们每次从10万数据中根据指定的条件进行查询，以后的数据量还会更大

karo_lee · 发表于 2015-3-10 15:36:42

solr没那么不堪啊，我存10亿数据，速度过得去啊

hery · 发表于 2015-3-11 10:06:40

karo_lee 发表于 2015-3-10 15:36
solr没那么不堪啊，我存10亿数据，速度过得去啊

可能是我们的查询条件比较多，所以影响速度，

karo_lee · 发表于 2015-3-11 16:52:18

本帖最后由 karo_lee 于 2015-3-11 16:56 编辑

hery 发表于 2015-3-11 10:06
可能是我们的查询条件比较多，所以影响速度，

试试HBasene注意HBase后面加了ne就是 HBase+lucene。
solr的请求基本都封装为了http，如果是http服务效率不好呢绕过它，直接透过lucene的API进行查询。
但是solr云的方式部署进行了负载均衡，效率不会太差的吧。
我这边的应用查询条件最多20个左右，10个solr节点，每个节点的数据1亿左右。
但是索引不是写在本地磁盘，是写在hdfs上的。
10万数据太少了，要不就是机器实在不行。
我孤陋寡闻，实时查询技术除了solr&lucene 和根据hbase行健查询外，真不晓得有别的什么技术了。有大神知道的望赐教。

hery · 发表于 2015-3-13 10:00:43

karo_lee 发表于 2015-3-11 16:52
试试HBasene注意HBase后面加了ne就是 HBase+lucene。
solr的请求基本都封装为了http，如果是http服务效 ...

好的，谢谢你的回答

图文精华

数据在千万级别上进行全文检索有哪些技术

已有(8)人评论

最佳新人

活跃会员

热心会员

推荐 /2