Scan的效率怎么提高？？

我在map方法里需要查找hbase中的记录，代码如下：

Scan scan = new Scan();
scan.setCaching(500);
scan.setCacheBlocks(true);

scan.setStartRow((icdevice_id + "," + start).getBytes());
scan.setStopRow((icdevice_id + "," + end).getBytes());

ResultScanner rs = table.getScanner(scan);
for (Result result : rs) {
业务代码
}

map方法主要耗时的就是这一段代码，花费时间最低4ms，最高可能会到400ms。这个表中有278万条记录。

不知道有什么方法可优化读表的操作？

我又在想是不是把数据存储在hbase中本来就是不合理的选择。愁

出河种花 · 发表于 2017-5-17 16:59:20

求解 T T 最后要计算的数据很大而且集群的机器又都是要报废的机器，性能不好，不能把时间都花在hbas读取上

jixianqiuxue · 发表于 2017-5-17 19:56:25

出河种花发表于 2017-5-17 16:59
求解 T T 最后要计算的数据很大而且集群的机器又都是要报废的机器，性能不好，不能把时间都花在hbas读取 ...

优化的方法很多，下面仅供楼主参考
1.开启bloomfilter

2.hbase对于内存有特别的嗜好，在硬件允许的情况下配足够多的内存给它。
通过修改hbase-env.sh中的
export HBASE_HEAPSIZE=3000 #这里默认为1000m

3.增大RPC数量
通过修改hbase-site.xml中的
hbase.regionserver.handler.count属性，可以适当的放大。默认值为10有点小

更多：
HBase性能深度分析和性能调优
http://www.aboutyun.com/forum.php?mod=viewthread&tid=5788

出河种花 · 发表于 2017-5-17 20:01:23

jixianqiuxue 发表于 2017-5-17 19:56
优化的方法很多，下面仅供楼主参考
1.开启bloomfilter

谢谢指导，学习了

图文精华

Scan的效率怎么提高？？

已有(3)人评论

推荐 /2