About云-梭伦科技»专题 › 交流区 › 技术交流 › eclipse为何可以直接运行mapreduce程序

eclipse为何可以直接运行mapreduce程序

查看数: 12017 | 评论数: 9 | 收藏 0

关灯 | 提示：支持键盘翻页<-左右->

帖子模式

斯巴达之狐

发布时间: 2016-8-24 11:03

正文摘要:

1、通过网络上的各种教程，我搭建了一个hadoop的开发环境，3台CentOS6.5的虚拟机，分别安装了hadoop2.5.2的版本，一个namenode和两个datanode。启动dfs和yarn之后，通过window平台上的eclipse（安装了hadoop plugin ...

斯巴达之狐 发表于 2016-8-30 14:23:19

hx252502115 发表于 2016-8-29 15:11
是这样的你虽然将远程的输入和输出路径指向了HDFS，但是你的hadoop确是指向的本地（你可以在你的代码里加入 ...

学习了，非常感谢！！！

hx252502115 发表于 2016-8-29 15:11:08

是这样的你虽然将远程的输入和输出路径指向了HDFS，但是你的hadoop确是指向的本地（你可以在你的代码里加入一些控制台输出，你会发现都输出到console里了。很明显mapreduce运行在eclipse的环境下）。

如果你安装了mapreduce的插件，本地eclipse下也是可以跑mapreduce程序的，现象就想楼主的一样，程序可以跑，控制台输出和网上的教程很像。但是hadoop集群上没有任何关于JOB的信息。

楼主可以把你haoop集群namenode上的几个配置文件放到你的classpath路径下（core-site.xml、mapred-site.xml、yarn-site.xml），在hadoop集群启动时是需要分发job的可执行代码的，所以如果楼主需要将工程打包成jar包，并在代码中通过Configuration指定jar的位置。

至于日志输入，楼主可以从hadoop自带的jar包中找一个log4j的配置文件，放到你的classpath路径下，这样每一次日志的输出楼主就可以自己配置了。否则eclipse默认从jar中加载log4j的配置文件。

斯巴达之狐 发表于 2016-8-25 16:00:57