About云-梭伦科技»专题 › 交流区 › 技术交流 › Flume › flume日志收集效率问题

flume日志收集效率问题

查看数: 46375 | 评论数: 18 | 收藏 2

关灯 | 提示：支持键盘翻页<-左右->

帖子模式

ablin

发布时间: 2015-11-4 14:07

正文摘要:

最近公司准备搭建日志分析平台，所有的日志从日志服务器上获得。日志从日志服务器到Hadoop集群的HDFS文件系统，这中间过程我采用flume-ng. 个人也是最近才研究f ...

火龙果先生 发表于 2016-5-1 16:30:58

谢谢啊，channel目前就内存和文件形式，其实内存在效率上面应该已经基本满足需求了

s060403072 发表于 2016-4-24 22:03:32

火龙果先生发表于 2016-4-24 21:45
source怎么设置不通过channel直接进入sink

channel是必须的

火龙果先生 发表于 2016-4-24 21:45:21

mseaspring 发表于 2016-3-1 17:37
我们在用flume的时候，有的效率要求高，可以通过不要channel，直接source之后sink。

source怎么设置不通过channel直接进入sink

mseaspring 发表于 2016-3-1 17:37:47

我们在用flume的时候，有的效率要求高，可以通过不要channel，直接source之后sink。

Pengjx2015 发表于 2015-11-15 18:22:31

ablin 发表于 2015-11-6 10:31:31

cherryzxh007 发表于 2015-11-5 23:39
flume测过一分钟大概也就300来m,增加memory和transaction到非常大并不会提高速度，反而会导致一系列的内存 ...

昨天自己在flume源码里增加了 hdfs commit的时间点，发现自己笔记本的虚拟机在batchSize=10000的情况下，一次commit花了3秒时间左右，而在公司虚拟机上一次commit需要7到10秒时间不等。。我现在怀疑，可能是我自己笔记本的三台虚拟机都是在一台物理机上，而公司3台虚拟机各分布在不同的物理机上导致的这个时间差异。。但是又暴露出一个问题，公司虚拟机调 capacity,batchsize大小速度都不变化，在相差100倍甚至相差1000倍的情况下，速度都保持在2M/S左右，很奇怪。。因该要浮动一点，然后达到一个瓶颈值，这样才算正常吧。。

cherryzxh007 发表于 2015-11-5 23:39:00

flume测过一分钟大概也就300来m,增加memory和transaction到非常大并不会提高速度，反而会导致一系列的内存溢出等问题

arsenduan 发表于 2015-11-4 20:17:39

ablin 发表于 2015-11-4 20:02
查看了公司虚拟机的IO效率自己笔记本虚拟机的IO效率
发现自己笔记本虚拟机cached 读速度是公司虚拟机 ...

对的，磁盘也是考虑因素

图文精华

flume日志收集效率问题

正文摘要:

回复

推荐 /2