请教各位 flume采集到的日志数据上传到hdfs上为什么会生成这么多小文件?

查看数: 33366 | 评论数: 17 | 收藏 0
关灯 | 提示:支持键盘翻页<-左 右->
    组图打开中,请稍候......
发布时间: 2016-9-20 15:28

正文摘要:

下面是我的配置 agent1.sources=source1 agent1.sinks=sink1 agent1.channels=channel1 #配置source1 agent1.sources.source1.type=syslogudp agent1.sources.source1.host=10.0.118.208 agent1.sources. ...

回复

s060403072 发表于 2018-11-15 23:03:56
spftoto 发表于 2018-11-15 16:32
同样的问题,怎么解决呀?

具体情况具体分析,先看看滚动的时间、个数、大小等不要设置过小。其它看日志。
spftoto 发表于 2018-11-15 16:32:25
Hentai 发表于 2016-9-20 15:50
每次日志服务器传来一条日志信息 flume就会在hdfs上生成一个文件  有什么方法让它不生成文件 而是在原来的 ...

同样的问题,怎么解决呀?
desehawk 发表于 2018-3-19 19:20:29
nevermind 发表于 2018-3-19 16:19
flume的版本是1.7的,日志不断显示创建文件,关闭文件,重命名去掉.tmp

肯定跟你的配置有关系。贴出来看下
nevermind 发表于 2018-3-19 16:19:15
desehawk 发表于 2018-3-19 15:53
flume可能有漏洞,一般来说控制三个滚动的方式即可。可在增加下面两个参数
agent1.sinks.sink1.hdfs.idl ...

flume的版本是1.7的,日志不断显示创建文件,关闭文件,重命名去掉.tmp
nevermind 发表于 2018-3-19 16:16:43
desehawk 发表于 2018-3-19 15:53
flume可能有漏洞,一般来说控制三个滚动的方式即可。可在增加下面两个参数
agent1.sinks.sink1.hdfs.idl ...

我加了这两个参数,日志不会报Block Under-replication detected. Rotating file.这个了,但是还是一个一个小文件,请问是为什么呀。。
desehawk 发表于 2018-3-19 15:53:07
nevermind 发表于 2018-3-19 15:44
你好,你这个问题解决了嘛请问

flume可能有漏洞,一般来说控制三个滚动的方式即可。可在增加下面两个参数
agent1.sinks.sink1.hdfs.idleTimeout=60
agent1.sinks.sink1.hdfs.minBlockReplicas=1


nevermind 发表于 2018-3-19 15:44:12
Hentai 发表于 2016-9-20 17:32
是flume不支持把数据写在同一个hdfs文件中吗?

你好,你这个问题解决了嘛请问
arsenduan 发表于 2016-9-20 17:37:46
arsenduan 发表于 2016-9-20 15:57
在大,并且其它两个参数也变大或则直接去掉

重启了吗?所有的都改了吗
Hentai 发表于 2016-9-20 17:32:07
是flume不支持把数据写在同一个hdfs文件中吗?
关闭

推荐上一条 /2 下一条