分享
HBase数据入库缓慢,一个包原来的入库时间是700-800ms之间, 现在有的一个包能达到一分钟左右,一个包大小为20M左右

微信图片_20180319121911.png

微信图片_20180319121915.png

已有(3)人评论

跳转到指定楼层
easthome001 发表于 2018-3-19 13:41:19
是什么插入方式,是put,还是bulkload,还是什么方式
回复

使用道具 举报

翱翔于天变 发表于 2018-3-19 14:12:45
easthome001 发表于 2018-3-19 13:41
是什么插入方式,是put,还是bulkload,还是什么方式

大神你好,这是写的API,应该是批量插入的,我没操作,人家公司的集群,不知道代码是什么,就知道他出了问题。 知道如何解决吗

回复

使用道具 举报

desehawk 发表于 2018-3-19 14:56:34
翱翔于天变 发表于 2018-3-19 14:12
大神你好,这是写的API,应该是批量插入的,我没操作,人家公司的集群,不知道代码是什么,就知道他出了 ...

如果是批量更新,可以考虑关闭 setWriteToWAL,这样可以获得 5%到10%性能优势
缺点:Region宕了,还没flush到fstore的数据也就丢了rowkey

rowkey是如何设计的,如果过于集中,也会造成楼主的情况。

还可以在配置方面加强:
1、memstore大小、数量可以增加。特别是在大批量随机put的情况下
2、storefile合并不要太频繁
3、split需要减少,所以需要在put前与创建region(参照前面第一条)
通过以上配置可以减小 tps波动,以及flush、compact、split造成的卡死

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

推荐上一条 /2 下一条