搜索
搜 索
本版
文章
帖子
用户
图文精华
hadoop-2.6.0+zookeeper-3.4.6+hbase-1.0.0+hive-1.1.0完全分布 ...
首页
Portal
专题
BBS
面试
办公|编程助手
更多
登录
注册
用户组:游客
主题
帖子
云币
我的帖子
我的收藏
我的好友
我的勋章
设置
退出
导读
淘贴
博客
群组
社区VIP
APP下载
今日排行
本周排行
本周热帖
本月排行
本月热帖
会员排行
About云-梭伦科技
»
专题
›
交流区
›
技术交流
›
hbase的rowkey设计问题
0
3
0
分享
hbase的rowkey设计问题
ld512870
发表于 2016-5-6 09:32:11
[显示全部楼层]
阅读模式
关闭右栏
3
7632
About云VIP帮助找工作和提升
最近需要用hbase存储一些数据。设计的一个hbase表中有两种数据。一种:序列号_时间_汉字 一种:汉字_时间_序列号 序列号为ab5d这种数据 现在表中应该有20亿左右的数据。这个还没有count。查询的时候出现一种情况。我通过scan设置startrow和stoprow来查询数据。现在发现我在通过设置start和stop为序列号_时间的这种方式的时候,查询非常快。全都是毫秒级响应。但是当我突然设置start和stop为汉字_时间这种的时候,首次查询会非常慢。达到了30s的响应。之后在查询其他的汉字_时间的时候就又非常快了。这是为什么呢?
回复
使用道具
举报
提升卡
置顶卡
沉默卡
喧嚣卡
变色卡
千斤顶
显身卡
已有(3)人评论
电梯直达
正序浏览
muyannian
发表于 2016-5-6 10:15:37
本帖最后由 muyannian 于 2016-5-6 10:21 编辑
中文start和stop,楼主是怎么确定范围的,感觉不好确定啊
回复
使用道具
举报
显身卡
s060403072
发表于 2016-5-6 11:55:49
是不是做缓存处理了。
start和stop为序列号_时间的这种方式比较好些
回复
使用道具
举报
显身卡
dahaian
发表于 2016-5-6 16:46:38
你是直接把中文存进去的?中文是不支持字典排序的,所以要转成英文后才能存进rowkey,只有英文和数字支持字典排序。
回复
使用道具
举报
显身卡
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
本版积分规则
发表回复
回帖后跳转到最后一页
最佳新人
积极上进,爱好学习
活跃会员
经常参与各类话题的讨论,发帖内容较有主见
发表新帖
ld512870
高级会员
关注
64
主题
207
帖子
7
粉丝
TA的主题
Flink动态加载代码,动态加载SQL方案
2019-3-27
关于HBASE的rowkey设计
2018-4-26
Spark Struct Streaming spark-sql-kafka-0-10_2.11版本问题
2018-3-16
npm install 报错。
2018-1-31
如何解决matplotlib的饼图pie中重叠问题
2018-1-29
24小时热文
Flink CDC:新一代实时数据集成框架
蚂蚁面试就是不一样
如何高效学习
人情世故速查速用大全集
框架思维
关闭
推荐
/2
中文版ChatGPT
1.无需魔法 2.提高编程效率 3.提高文档能力
查看 »
新手帮助
新手帮助:注册遇到问题,领取资源,加入铁粉群,不会使用搜索,如何获取积分等
查看 »
意见
反馈