分享

flume 用spooldir的source配置方式 到最后总报异常

sstutu 发表于 2014-5-17 11:41:12 [显示全部楼层] 只看大图 回帖奖励 阅读模式 关闭右栏 18 73205
本帖最后由 sstutu 于 2014-5-17 11:47 编辑
配置 用spooldir的source配置方式  到最后总报异常
QQ图片20140517114004.jpg

大家有没有遇见过这中情况啊
这是我的 配置
peizhi.jpg





欢迎加入about云群425860289432264021 ,云计算爱好者群,关注about云腾讯认证空间

已有(18)人评论

跳转到指定楼层
hyj 发表于 2014-5-17 11:48:57
spool使用问题还是比较多的
回复

使用道具 举报

sstutu 发表于 2014-5-17 11:50:01
本帖最后由 sstutu 于 2014-5-17 11:51 编辑
我换成 exec 模式的 就不会 报错,而且 只有 文件 大了才会 报错,但是 用exec方式 会丢失数据.
回复

使用道具 举报

hyj 发表于 2014-5-17 11:52:47
你的监控文件夹下文件的生成方式,不断追加还是一分钟一个 还是?你看看你监控的文件夹下是不是有重名的
回复

使用道具 举报

sstutu 发表于 2014-5-17 11:54:52
本帖最后由 sstutu 于 2014-5-17 13:55 编辑

就只有这一个,spool读完文件后会改文件名
回复

使用道具 举报

hyj 发表于 2014-5-17 14:00:35
sstutu 发表于 2014-5-17 11:54
就只有这一个,spool读完文件后会改文件名

把flume启动后 直接把那个日志文件 上传到那个 被监控的文件夹下,的日志文件 一直都是一个文件,你可以使用exec。
但是缺点:exec可能会丢失数据。如果日志分析数据准确性不是太高,可以使用exec。


日志分析 最好还是不要用 spooldir方式吧,否则会报错
回复

使用道具 举报

mjjian0 发表于 2014-5-26 10:41:58
我们用的 就是exec方式,
回复

使用道具 举报

wjhdtx 发表于 2014-10-31 12:04:46
mjjian0 发表于 2014-5-26 10:41
我们用的 就是exec方式,

你好,我的需求是日志文件已经产生,我想通过flume将生成好的日志文件拷贝到hdfs中1. 想问下使用哪中source比较好?
2. 或者不用flume:

①使用java调用hdfs的api将日志文件写入hdfs
②使用java或shell调用hadoop fs -put来将文件写入hdfs
这两种哪个好?

谢谢;)
回复

使用道具 举报

mjjian0 发表于 2014-11-2 22:00:21
wjhdtx 发表于 2014-10-31 12:04
你好,我的需求是日志文件已经产生,我想通过flume将生成好的日志文件拷贝到hdfs中1. 想问下使用哪中sour ...

用flume  他就是用来收集日志的
回复

使用道具 举报

wjhdtx 发表于 2014-11-3 08:35:16
mjjian0 发表于 2014-11-2 22:00
用flume  他就是用来收集日志的

谢谢回复。
回复

使用道具 举报

12下一页
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

推荐上一条 /2 下一条