Flume-ng生产环境实践(二)flume-ng 测试过程中event丢失部分body数据
本帖最后由 坎蒂丝_Swan 于 2015-1-12 14:17 编辑问题导读
1.source端单event的body如何处理大于16字节的数据的?
2.具体的方法是如何实现的?
static/image/hrline/4.gif
经过测试发现,当source端单event的body数据大于16字节后,输出到目标只剩下16字节。进过多源代码的分析,发现,源代码中进行了截取。在LoggerSink.java中:
if (event != null) {
if (logger.isInfoEnabled()) {
logger.info("Event: " + EventHelper.dumpEvent(event));
}
}
我们去看EventHelper.java的dumpEvent方法:
private static final int DEFAULT_MAX_BYTES = 16;
public static String dumpEvent(Event event) {
return dumpEvent(event, DEFAULT_MAX_BYTES);
} StringBuilder buffer = new StringBuilder();
if (event == null || event.getBody() == null) {
buffer.append("null");
} else if (event.getBody().length == 0) {
// do nothing... in this case, HexDump.dump() will throw an exception
} else {
byte[] body = event.getBody();
byte[] data = Arrays.copyOf(body, Math.min(body.length, maxBytes));
ByteArrayOutputStream out = new ByteArrayOutputStream();
try {
HexDump.dump(data, 0, out, 0);
String hexDump = new String(out.toByteArray());
// remove offset since it's not relevant for such a small dataset
if(hexDump.startsWith(HEXDUMP_OFFSET)) {
hexDump = hexDump.substring(HEXDUMP_OFFSET.length());
}
buffer.append(hexDump);
} catch (Exception e) {
if(LOGGER.isInfoEnabled()) {
LOGGER.info("Exception while dumping event", e);
}
buffer.append("...Exception while dumping: ").append(e.getMessage());
}
String result = buffer.toString();
if(result.endsWith(EOL) && buffer.length() > EOL.length()) {
buffer.delete(buffer.length() - EOL.length(), buffer.length()).toString();
}
}
return "{ headers:" + event.getHeaders() + " body:" + buffer + " }";
}
不难看出,在event处理过程中,发生了数据截取操作。
Flume-ng生产环境实践(一)Flume-ng生产环境编译
Flume-ng生产环境实践(二)flume-ng 测试过程中event丢失部分body数据
Flume-ng生产环境实践(三)实现文件sink,按照固定格式目录输出
Flume-ng生产环境实践(四)实现log格式化interceptor
{:soso_e179:} 学习了,谢谢分享~ 楼主太强悍了,研究源码~佩服!!! {:soso_e179:} 不是在配置中,有一个maxBytesToLog配置项吗?默认是16,但是修改后没生效,本人才疏学浅,java基础基本为0 老版本的flume不清楚,但是新版本的flume中,应该没有这个问题了,下面截图是官方文档中spool source中,单个event的最大长度
老版本的flume不清楚,但是新版本的flume中,应该没有这个问题了,下面截图是官方文档中spool source中,单个event的最大长度 老版本的flume不清楚,但是新版本的flume中,应该没有这个问题了,下面截图是官方文档中spool source中,单个event的最大长度
LINE
This deserializer generates one event per line of text input.
Property Name
Default
Description
deserializer.maxLineLength 2048 Maximum number of characters to include in a single event. If a line exceeds this length, it is truncated, and the remaining characters on the line will appear in a subsequent event.
deserializer.outputCharset UTF-8 Charset to use for encoding events put into the channel.
DavidShao 发表于 2018-6-15 14:50
老版本的flume不清楚,但是新版本的flume中,应该没有这个问题了,下面截图是官方文档中spool source中,单 ...
牛X牛X
页:
[1]