搜索
搜 索
本版
文章
帖子
用户
图文精华
hadoop-2.6.0+zookeeper-3.4.6+hbase-1.0.0+hive-1.1.0完全分布 ...
首页
Portal
专题
BBS
面试
办公|编程助手
更多
登录
注册
用户组:游客
主题
帖子
云币
我的帖子
我的收藏
我的好友
我的勋章
设置
退出
导读
淘贴
博客
群组
社区VIP
APP下载
今日排行
本周排行
本周热帖
本月排行
本月热帖
会员排行
About云-梭伦科技
»
专题
›
交流区
›
技术交流
›
HBase
›
根据几万个字段,rowkey过滤查询问题
0
3
0
分享
根据几万个字段,rowkey过滤查询问题
neilyo
发表于 2016-8-11 23:19:54
[显示全部楼层]
阅读模式
关闭右栏
3
9914
小弟有一个job,要根据几万个userid,从几百万数据中查询出各行数据,rowkey中包含了userId,根据rowkey过滤查询,但是速度好慢,七八万个userId 要跑10个小时,,,,我是在java代码中起了30个线程,每次根据userid过滤查询一条,这样的话几万个userid就要查几万次,内存24G,3台集群, 实在是太慢了。。。请教下有没有好的解决方法。。。 或者需要配合别的工具一起使用查询吗 比如phoenix。。。
谢谢大家
回复
使用道具
举报
提升卡
置顶卡
沉默卡
喧嚣卡
变色卡
千斤顶
显身卡
已有(3)人评论
电梯直达
正序浏览
desehawk
发表于 2016-8-12 11:24:21
没太明白楼主的需求或则说为啥有这样的需求。方法有多种:
1最简单的优化集群
2创建二级索引
3与solr整合
回复
使用道具
举报
显身卡
qcbb001
发表于 2016-8-12 16:37:22
楼主可以试试单个rowkey查询
如果单个比较慢,说明需要优化
回复
使用道具
举报
显身卡
ideeper
发表于 2016-8-24 09:59:10
必须二级索引,你可以研究一下基于solr二级索引查询。过滤器很慢的
回复
使用道具
举报
显身卡
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
本版积分规则
发表回复
回帖后跳转到最后一页
活跃会员
经常参与各类话题的讨论,发帖内容较有主见
热心会员
经常帮助其他会员答疑
优秀版主
活跃且尽责职守的版主
发表新帖
neilyo
新手上路
关注
主题
帖子
粉丝
TA的主题
根据几万个字段,rowkey过滤查询问题
2016-8-11
24小时热文
Docker+容器与容器云(第2版)
docker容器实战:原理、架构与应用
Docker基础与实战
kafka面试题精选
Nebula Flink Connector 在实时 ETL 的实践
关闭
推荐
/2
中文版ChatGPT
1.无需魔法 2.提高编程效率 3.提高文档能力
查看 »
新手帮助
新手帮助:注册遇到问题,领取资源,加入铁粉群,不会使用搜索,如何获取积分等
查看 »
意见
反馈