分享

数据在千万级别上进行全文检索有哪些技术

hery 发表于 2015-3-9 16:35:00 [显示全部楼层] 回帖奖励 阅读模式 关闭右栏 8 75873
数据在千万级别上,更加某些条件进行查询,请问有什么技术可以实现?现在用的是solr,但是感觉solr现在也比较慢了,还有其他的技术吗?

已有(8)人评论

跳转到指定楼层
jixianqiuxue 发表于 2015-3-9 16:51:21
1. lucene  (solr, elasticsearch 都是基于它)

2. sphinx


回复

使用道具 举报

ld512870 发表于 2015-3-9 22:33:37
elasticsearch 简单易用。天生分布式。
回复

使用道具 举报

fly2015 发表于 2015-3-10 11:07:59
我们现在用的全文检索是elasticsearch
回复

使用道具 举报

hery 发表于 2015-3-10 11:42:09
fly2015 发表于 2015-3-10 11:07
我们现在用的全文检索是elasticsearch

查询速度快吗??我们每次从10万数据中根据指定的条件进行查询,以后的数据量还会更大

回复

使用道具 举报

karo_lee 发表于 2015-3-10 15:36:42
solr没那么不堪啊,我存10亿数据,速度过得去啊
回复

使用道具 举报

hery 发表于 2015-3-11 10:06:40
karo_lee 发表于 2015-3-10 15:36
solr没那么不堪啊,我存10亿数据,速度过得去啊

可能是我们的查询条件比较多,所以影响速度,

回复

使用道具 举报

karo_lee 发表于 2015-3-11 16:52:18
本帖最后由 karo_lee 于 2015-3-11 16:56 编辑
hery 发表于 2015-3-11 10:06
可能是我们的查询条件比较多,所以影响速度,

试试HBasene注意HBase后面加了ne就是 HBase+lucene。
solr的请求基本都封装为了http,如果是http服务效率不好呢绕过它,直接透过lucene的API进行查询。
但是solr云的方式部署进行了负载均衡,效率不会太差的吧。
我这边的应用查询条件最多20个左右,10个solr节点,每个节点的数据1亿左右。
但是索引不是写在本地磁盘,是写在hdfs上的。
10万数据太少了,要不就是机器实在不行。
我孤陋寡闻,实时查询技术除了solr&lucene 和根据hbase行健查询外,真不晓得有别的什么技术了。有大神知道的望赐教。
回复

使用道具 举报

hery 发表于 2015-3-13 10:00:43
karo_lee 发表于 2015-3-11 16:52
试试HBasene注意HBase后面加了ne就是 HBase+lucene。
solr的请求基本都封装为了http,如果是http服务效 ...

好的,谢谢你的回答
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

推荐上一条 /2 下一条