xuanxufeng 发表于 2016-2-12 18:51:24

hadoop官网帮助手册:第三章离线Edits 阅读器指南




综述

Offline Edits Viewer是一个解析Edits日志的工具。实现不同格式的转换,包括可以被人们方便阅读的XML格式和比较容易编辑的二进制格式。
工具可以解析可以解析编辑-18(大约Hadoop 0.19)或更晚的版本。工具只是在文件上运行,可以不需要Hadoop集群启动。输入的格式包括:1.二进制:Hadoop内部使用二进制格式2.xml:XML格式Offline Edits Viewer提供了几种输出格式(除所述处输出否则转换回原来的编辑文件):
[*]binary:Hadoop内部使用二进制格式
[*]xml: XML格式
[*]stats: 打印统计数据,不能输出会Edits文件
用法 bash$ bin/hdfs oev -i edits -o edits.xml

FlagDescription
[-i ; --inputFile] input file必填项,指定edit日志。当扩展名为xml时是xml格式否则为二进制格式。
[-o ; --outputFile]output file必填项,指定输出文件如果已存在,那么会被重写。
[-p ; --processor]processor指定运行的解释器,目前允许的选项有binary, xml (默认) 和 stats.

[-v ; --verbose]打印输入输出文件到控制台和指定的文件,如果比较大,会需要很多时间。
[-h ; --help]显示帮助信息

案例:集群恢复在这个案例中,Hadoop的集群和edits文件被损坏,但是至少部分的edits文件是正确的。这可以通过将二进制编辑转换为XML,手动编辑它,然后将它转换为二进制。最常见的问题是,编辑文件丢失closing记录(记录opCode为-1)。这应该可以被工具识别和XML格式应该正确地关闭。如果在xml文件中没有closing记录你应该在最新的正确的记录后面手动添加一条,任何在opCode为-1后面的记录都是被忽略的。closing记录的例子:


<RECORD>
    <OPCODE>-1</OPCODE>
    <DATA>
    </DATA>
</RECORD>





页: [1]
查看完整版本: hadoop官网帮助手册:第三章离线Edits 阅读器指南