搜索
搜 索
本版
文章
帖子
用户
图文精华
hadoop-2.6.0+zookeeper-3.4.6+hbase-1.0.0+hive-1.1.0完全分布 ...
首页
Portal
专题
BBS
面试
更多
登录
注册
用户组:游客
主题
帖子
云币
我的帖子
我的收藏
我的好友
我的勋章
设置
退出
导读
淘贴
博客
群组
社区VIP
APP下载
今日排行
本周排行
本周热帖
本月排行
本月热帖
会员排行
About云-梭伦科技
»
专题
›
交流区
›
技术交流
›
HBase
›
疑问解答
›
关于rowkey设计的问题
0
1
0
分享
关于rowkey设计的问题
ighack
2019-7-19 10:46:16
发表于
疑问解答
[显示全部楼层]
阅读模式
关闭右栏
1
2813
本帖最后由 ighack 于 2019-7-19 11:14 编辑
我的查询条件一般是时间。按网上说的我可以用时间做一个rowkey如果
20190719101401
20190719101402
20190719101403
20190719101404
20190719101405
20190719101406
20190719101407
查询的的时候用
setStartRow(
20190719101401),setEndRow(
20190719101407)
但这样会造成数据集中到一个HRegionServer
有说可以加一个前缀
byte prefix =
(byte) (Long.hashCode(timestamp) %
HRegionServer的数量);
就会变成
020190719101401
120190719101402
220190719101403
020190719101404
120190719101405
220190719101406
020190719101407
那我在做查询的时候是不是这样设啊
setStartRow(
020190719101401),setEndRow(
220190719101407)
这样查询会有不会有问题啊。比如丢数据
020190719101407这个值会不会查不出来啊
还有一种情况如果我把状态也拼到rowkey中(拼在最后一位)
0201907191014011
1201907191014021
2201907191014031
0201907191014042
1201907191014051
2201907191014062
0201907191014071
0201907191014082
0201907191014092
0201907191014101
那么我该如果设范围呢(只要状态为1的数据)
setStartRow(
0201907191014011),setEndRow(
0201907191014101)
这样做吗?
回复
使用道具
举报
提升卡
置顶卡
沉默卡
喧嚣卡
变色卡
千斤顶
显身卡
已有(1)人评论
电梯直达
正序浏览
hyj
发表于 2019-7-19 13:55:00
可以尝试用RowFilter过滤掉前缀
使用可参考
hbase RowFilter如何根据rowkey查询以及实例实现代码
http://www.aboutyun.com/forum.php?mod=viewthread&tid=8895
回复
使用道具
举报
显身卡
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
本版积分规则
发表回复
回帖后跳转到最后一页
发表新帖
ighack
中级会员
关注
10
主题
71
帖子
7
粉丝
TA的主题
spark排序以后写入单个文件
2020-12-9
flink 报AppendStreamTableSink requires that Table has only insert changes
2020-5-25
关于flink1.10中kafka写入的问题
2020-5-15
flink连kafka的json格式怎么执行SQL
2020-5-15
hadoop设为高可用,datanode节点看不全
2020-5-13
24小时热文
矩阵分析引论罗家洪(第四版)
互联网大厂年终福利曝光:看看别人家老板怎
像高手一样发言:七种常见工作场景的说话之
携程允许员工春节回乡办公2个月
数据治理实施方案
关闭
推荐
/2
中文版ChatGPT
1.无需魔法 2.提高编程效率 3.提高文档能力
查看 »
新手帮助
新手帮助:注册遇到问题,领取资源,加入铁粉群,不会使用搜索,如何获取积分等
查看 »
意见
反馈