坎蒂丝_Swan 发表于 2015-1-12 11:43:24

Flume-ng生产环境实践(二)flume-ng 测试过程中event丢失部分body数据

本帖最后由 坎蒂丝_Swan 于 2015-1-12 14:17 编辑

问题导读
1.source端单event的body如何处理大于16字节的数据的?
2.具体的方法是如何实现的?




static/image/hrline/4.gif





经过测试发现,当source端单event的body数据大于16字节后,输出到目标只剩下16字节。进过多源代码的分析,发现,源代码中进行了截取。在LoggerSink.java中:
if (event != null) {
      if (logger.isInfoEnabled()) {
          logger.info("Event: " + EventHelper.dumpEvent(event));
      }
}

我们去看EventHelper.java的dumpEvent方法:
private static final int DEFAULT_MAX_BYTES = 16;
public static String dumpEvent(Event event) {
    return dumpEvent(event, DEFAULT_MAX_BYTES);
}    StringBuilder buffer = new StringBuilder();
    if (event == null || event.getBody() == null) {
      buffer.append("null");
    } else if (event.getBody().length == 0) {
      // do nothing... in this case, HexDump.dump() will throw an exception
    } else {
      byte[] body = event.getBody();
      byte[] data = Arrays.copyOf(body, Math.min(body.length, maxBytes));
      ByteArrayOutputStream out = new ByteArrayOutputStream();
      try {
      HexDump.dump(data, 0, out, 0);
      String hexDump = new String(out.toByteArray());
      // remove offset since it's not relevant for such a small dataset
      if(hexDump.startsWith(HEXDUMP_OFFSET)) {
          hexDump = hexDump.substring(HEXDUMP_OFFSET.length());
      }
      buffer.append(hexDump);
      } catch (Exception e) {
       if(LOGGER.isInfoEnabled()) {
         LOGGER.info("Exception while dumping event", e);
       }
      buffer.append("...Exception while dumping: ").append(e.getMessage());
      }
      String result = buffer.toString();
      if(result.endsWith(EOL) && buffer.length() > EOL.length()) {
      buffer.delete(buffer.length() - EOL.length(), buffer.length()).toString();
      }
    }
    return "{ headers:" + event.getHeaders() + " body:" + buffer + " }";
}


不难看出,在event处理过程中,发生了数据截取操作。




Flume-ng生产环境实践(一)Flume-ng生产环境编译
Flume-ng生产环境实践(二)flume-ng 测试过程中event丢失部分body数据
Flume-ng生产环境实践(三)实现文件sink,按照固定格式目录输出
Flume-ng生产环境实践(四)实现log格式化interceptor

stark_summer 发表于 2015-1-12 13:53:01

{:soso_e179:}

355815741 发表于 2015-1-12 22:23:53

学习了,谢谢分享~

cdb521007 发表于 2015-7-26 14:48:43

楼主太强悍了,研究源码~佩服!!!

为了明天time 发表于 2015-9-22 10:33:27

{:soso_e179:}

dorajam 发表于 2018-6-13 11:33:15

不是在配置中,有一个maxBytesToLog配置项吗?默认是16,但是修改后没生效,本人才疏学浅,java基础基本为0

DavidShao 发表于 2018-6-15 14:44:05

老版本的flume不清楚,但是新版本的flume中,应该没有这个问题了,下面截图是官方文档中spool source中,单个event的最大长度

DavidShao 发表于 2018-6-15 14:48:55

老版本的flume不清楚,但是新版本的flume中,应该没有这个问题了,下面截图是官方文档中spool source中,单个event的最大长度

DavidShao 发表于 2018-6-15 14:50:18

老版本的flume不清楚,但是新版本的flume中,应该没有这个问题了,下面截图是官方文档中spool source中,单个event的最大长度



LINE

This deserializer generates one event per line of text input.






Property Name

Default

Description


deserializer.maxLineLength 2048 Maximum number of characters to include in a single event. If a line exceeds this length, it is truncated, and the remaining characters on the line will appear in a subsequent event.
deserializer.outputCharset UTF-8 Charset to use for encoding events put into the channel.

spftoto 发表于 2019-1-16 20:05:13

DavidShao 发表于 2018-6-15 14:50
老版本的flume不清楚,但是新版本的flume中,应该没有这个问题了,下面截图是官方文档中spool source中,单 ...

牛X牛X
页: [1]
查看完整版本: Flume-ng生产环境实践(二)flume-ng 测试过程中event丢失部分body数据