分享

Flume 中Sink批量参数设置调优【分享】

arsenduan 发表于 2015-5-4 13:57:50 [显示全部楼层] 回帖奖励 阅读模式 关闭右栏 2 37772
在Flume 配置中,Sink的参数batchSize会影响到整个流程的性能。比如说HDFS sink,它的参数称hdfs.batchSize,这样称呼是由于历史的原因,建议使用hdfs.txnEvenMax。 在sink端调优批量值设置,它依赖于相应的隧道(channel)的事务容量。sink端的批量大小应该小于或者等于channel端的事务容量,而事务容量应该设置为实际需要的最大值(channel端)。下列列举了一下优化的sink批量参数值设置。

槽类型(Sink Type)配置参数(Config parameter)类型值(Typical value)
Avrobatch-size100
HDFShdfs.batchSize, hdfs.txnEventMax1000
HBaseSinkbatchSize100
AsyncHBaseSinkbatchSize100



已有(2)人评论

跳转到指定楼层
514147223 发表于 2015-5-4 15:49:50
新人初次学习
回复

使用道具 举报

bwboy 发表于 2015-5-5 13:10:43
恩,这个翻译官方blog一篇的吧?看着眼熟
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

推荐上一条 /2 下一条