综述
Offline Edits Viewer是一个解析Edits日志的工具。实现不同格式的转换,包括可以被人们方便阅读的XML格式和比较容易编辑的二进制格式。
工具可以解析可以解析编辑-18(大约Hadoop 0.19)或更晚的版本。工具只是在文件上运行,可以不需要Hadoop集群启动。 输入的格式包括: 1.二进制:Hadoop内部使用二进制格式 2.xml:XML格式 Offline Edits Viewer提供了几种输出格式(除所述处输出否则转换回原来的编辑文件): - binary:Hadoop内部使用二进制格式
- xml: XML格式
- stats: 打印统计数据,不能输出会Edits文件
用法 bash$ bin/hdfs oev -i edits -o edits.xml
Flag | Description | [-i ; --inputFile] input file | 必填项,指定edit日志。当扩展名为xml时是xml格式否则为二进制格式。 | [-o ; --outputFile]output file | 必填项,指定输出文件如果已存在,那么会被重写。 | [-p ; --processor]processor | 指定运行的解释器,目前允许的选项有binary, xml (默认) 和 stats.
| [-v ; --verbose] | 打印输入输出文件到控制台和指定的文件,如果比较大,会需要很多时间。 | [-h ; --help] | 显示帮助信息 |
案例:集群恢复在这个案例中,Hadoop的集群和edits文件被损坏,但是至少部分的edits文件是正确的。这可以通过将二进制编辑转换为XML,手动编辑它,然后将它转换为二进制。最常见的问题是,编辑文件丢失closing记录(记录opCode为-1)。这应该可以被工具识别和XML格式应该正确地关闭。 如果在xml文件中没有closing记录你应该在最新的正确的记录后面手动添加一条,任何在opCode为-1后面的记录都是被忽略的。 closing记录的例子:
[mw_shl_code=bash,true]<RECORD>
<OPCODE>-1</OPCODE>
<DATA>
</DATA>
</RECORD>[/mw_shl_code]
|