搜索
搜 索
本版
文章
帖子
用户
图文精华
hadoop-2.6.0+zookeeper-3.4.6+hbase-1.0.0+hive-1.1.0完全分布 ...
首页
Portal
专题
BBS
面试
办公|编程助手
更多
登录
注册
用户组:游客
主题
帖子
云币
我的帖子
我的收藏
我的好友
我的勋章
设置
退出
导读
淘贴
博客
群组
社区VIP
APP下载
今日排行
本周排行
本周热帖
本月排行
本月热帖
会员排行
About云-梭伦科技
»
专题
›
交流区
›
技术交流
›
HBase
›
请教:HBase 协处理器的使用问题
1
1
0
分享
请教:HBase 协处理器的使用问题
lmqian
发表于 2017-10-21 20:07:56
[显示全部楼层]
阅读模式
关闭右栏
1
4312
应用场景:每分钟会向同一个表中插入一条数据,现在需要计算整个表中相邻两分钟之间的数据差值,尽量做到实时,即插入一条数据就立即算出与上一分钟数据的差值。
我首先想到的是RegionObserver, 使用postPut方法实现计算,现在有两个问题请教高手:
1. Put操作和prePost、postPut方法是不是同步关系,意味着,整个put花费时间等于prePut,put 和 postPut时间之和?那这就严重降低了客户端写数据的吞吐量了.....
2. 测试中发现一个情况,写少量数据的时候,客户端put操作和postPut操作的数量上是相同的,但是发现数据量大了之后,从日志来看,postPut方法执行的次数远超过客户端put的数量,这是什么原因?
回复
使用道具
举报
提升卡
置顶卡
沉默卡
喧嚣卡
变色卡
千斤顶
显身卡
已有(1)人评论
电梯直达
正序浏览
einhep
发表于 2017-10-21 21:53:30
这个用spark,应该更好一点。使用spark streaming的时间窗口求差值
回复
使用道具
举报
显身卡
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
本版积分规则
发表回复
回帖后跳转到最后一页
发表新帖
lmqian
注册会员
关注
3
主题
7
帖子
3
粉丝
TA的主题
请教:HBase 协处理器的使用问题
2017-10-21
使用YCSB测试HBase的问题
2017-10-14
求助:时间序列的数据,求相邻时间点的差值
2017-9-29
24小时热文
kafka面试题精选
Nebula Flink Connector 在实时 ETL 的实践
Apache Doris 用户案例集
国家电网公司主数据管理系统技术规范
企业的主数据建设方法论与实践
关闭
推荐
/2
中文版ChatGPT
1.无需魔法 2.提高编程效率 3.提高文档能力
查看 »
新手帮助
新手帮助:注册遇到问题,领取资源,加入铁粉群,不会使用搜索,如何获取积分等
查看 »
意见
反馈