分享

hadoop的调试指导

本帖最后由 pig2 于 2014-6-7 18:05 编辑
问题导读:
1.如何把源码调试至不报错的状态?
2.如何添加hadoop jar包
3.-agentlib:jdwp=transport=dt_socket,server=y,
suspend=n,address=8000作用是什么?




调试分为两部分,MapReduce的调试和源码的调试。
MapReduce的调试很简单,首先要部署好hadoop,这个我就不说了,自己去百度。部署好之后,下载Hadoop对应的eclipse插件,有了这个插件之后,变得异常简单。
这是我在网上下的hadoop1.1.2的eclipse插件的地址:http://download.csdn.net/detail/cenyuhaiwork/5716051
下载完毕之后,把它放入eclipse目录的dropins文件夹中即可,然后重启eclipse。
1.jpg
  打开windows preferences 中,发现有Hadoop Map/Reduce就说明已经成功了。
     打开window show View ,选择Map/Reduce Locations
2.jpg
编辑Map/Reduce Locations
3.jpg
修改成实际的Ip地址和端口即可。
4.jpg
设置完毕,开始新建工程。

点击File,新建工程,选择Map/Reduce Project.
5.jpg
新建工程之后,然后新建一个类,我们可以把工程里面的examples里面的WorkCount拿出来试验一下,直接点调试即可开始,就像我们正常调试程序一样。examples里面还提供了其他很多的例子,大家可以去看看挺好的。
好了,现在我们开始进入hadoop源码的调试当中,在调试之前我们首先要把源码处理成不报错的状态。
把源码导入eclipse当中,源码可以在发布版的hadoop的src文件夹中找,然后我们导入jar,右键点击属性,选择java Build path,点击add jars,把发布版的lib文件夹中所有的jar包都导入。
6.jpg
然后我们再点击Source标签页,去掉多余的内容,我们只需要编译核心的几个目录即可,多编译因为缺少一些别的jar包报错,比如ant的。
先删掉原来的src目录,然后重新添加,我点Add Folder添加了一下目录,别的我就没有编译了。
       7.jpg

然后再点击左侧的Java Compiler,选择子项Error/Warnning ,如下图所示,把Error改成Warning.
8.jpg

点击Ok,设置完毕,可以开始Build啦。
好,我们打开hadoop生产环境下的bin目录下的hadoop,我们以调试NameNode为例子,找到elif ["COMMAND" = "namenode"]这一段,在HADOOP_OPTS
的字符串后面,添加-agentlib:jdwp=transport=dt_socket,server=y,suspend=n,address=8000。
9.jpg
其中suspend表示是否挂起等待调试连接,这里我没有让它挂起,有需要的朋友可以改成y,让它挂起,那样效果很明显,一直等着你连接。
这边就算设置完毕了。可以启动hadoop,命令行会出现,8000端口已经被监听的提示,然后在Eclipse这边打开NameNode的代码,打上断点,然后打开Debug Configurations 面板,在左侧选择Remote Java Application,如下图:
10.jpg
点击Debug,然后进入熟悉的debug页面就是成功啦!

相关内容推荐:

调试Hadoop源代码:eclipse调试及日志打印

Hadoop中调试(mapreduce)map与redcue信息的输出办法



来源:岑玉海


没找到任何评论,期待你打破沉寂

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

推荐上一条 /2 下一条