1、通过网络上的各种教程,我搭建了一个hadoop的开发环境,3台CentOS6.5的虚拟机,分别安装了hadoop2.5.2的版本,一个namenode和两个datanode。启动dfs和yarn之后,通过window平台上的eclipse(安装了hadoop plugin)远程连接master,然后进行MapReduce程序开发。通过传递参数(输入输出路径在集群HDFS上),然后Run As -> Run on hadoop 提交运行(WordCount的例子),确实可以运行(这个没问题)。但是当我把集群关闭,甚至连master虚拟机也停止之后,我通过传递本地文件路径(windows平台)做输入输出文件夹,然后Run As -> Java Application 后,同样可以运行,输出也和之前的一样,而且这个时候Run As -> Run on hadoop 上同样可以运行的过(集群完全关闭),输出还是一样的。我就奇怪了,为什么可以运行呢??明明已经不存在hadoop的环境了啊?2、另外还有一个小问题,通过hadoop plugin开发mapreduce后,运行结果(信息)显示在控制台(INFO开头的信息),但是我的程序运行完成后还出现了很多Debug开头的信息,控制台特别杂乱,我想问问有没有哪位知道如何把Debug信息隐藏掉的办法,感谢!!!
这张图片是在脱机环境(关闭所有虚拟机)后的Run on hadoop后的控制台部分输出,可以看到很多Debug信息
|
|