flume个性化处理json数据
flume source 段json字符串,现在想把它转换成普通的字符串,存储到hdfs或者hive中,怎么做呢?我用的flume,但不太会,现在拿到hdfs上,也是json格式。我想在存入hdfs前,把这个json串进行一个个性化处理,然后按照格式化后的数据格式,存储到hive或者hdfs中。具体怎么做
方法两个:
1.二次开发flume
2.在源头过滤下,也就是没有传递的时候,把json转换成正常字符串。或则在hdfs上通过mapreduce处理下。
einhep 发表于 2016-10-27 15:25
方法两个:
1.二次开发flume
2.在源头过滤下,也就是没有传递的时候,把json转换成正常字符串。或则在hdf ...
怎么二次开发
zeus_lhl 发表于 2016-10-27 15:28
怎么二次开发
下面是一些资料:
Flume1.3开发者指南【英文版about云提供】
http://www.aboutyun.com/forum.php?mod=viewthread&tid=15335
【Flume】flume文件监控的source组件开发,增量传输文件内容,支持断点续传功能
http://www.aboutyun.com/forum.php?mod=viewthread&tid=13757
flume 插件开发介绍
http://www.aboutyun.com/forum.php?mod=viewthread&tid=8315
更多官网
http://flume.apache.org/FlumeDeveloperGuide.html
langke93 发表于 2016-10-27 15:32
下面是一些资料:
Flume1.3开发者指南【英文版about云提供】
http://www.aboutyun.com/forum.php?m ...
这个所谓的二次开发和开发interceptors有什么区别吗
二次开发还是麻烦了,咋不在flume之前就把json格式数据转换成你想要的格式,这样还方便点! 直接在sink 里面把json 转成你想要的格式再sink
页:
[1]