分享

hbase的rowkey设计问题

ld512870 发表于 2016-5-6 09:32:11 [显示全部楼层] 回帖奖励 阅读模式 关闭右栏 3 7631
最近需要用hbase存储一些数据。设计的一个hbase表中有两种数据。一种:序列号_时间_汉字   一种:汉字_时间_序列号    序列号为ab5d这种数据    现在表中应该有20亿左右的数据。这个还没有count。查询的时候出现一种情况。我通过scan设置startrow和stoprow来查询数据。现在发现我在通过设置start和stop为序列号_时间的这种方式的时候,查询非常快。全都是毫秒级响应。但是当我突然设置start和stop为汉字_时间这种的时候,首次查询会非常慢。达到了30s的响应。之后在查询其他的汉字_时间的时候就又非常快了。这是为什么呢?

已有(3)人评论

跳转到指定楼层
muyannian 发表于 2016-5-6 10:15:37
本帖最后由 muyannian 于 2016-5-6 10:21 编辑

中文start和stop,楼主是怎么确定范围的,感觉不好确定啊
回复

使用道具 举报

s060403072 发表于 2016-5-6 11:55:49
是不是做缓存处理了。
start和stop为序列号_时间的这种方式比较好些
回复

使用道具 举报

dahaian 发表于 2016-5-6 16:46:38
你是直接把中文存进去的?中文是不支持字典排序的,所以要转成英文后才能存进rowkey,只有英文和数字支持字典排序。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

推荐上一条 /2 下一条