pig2 发表于 2014-5-15 02:04:16

hadoop2.2使用手册2:如何运行自带wordcount

问题导读:
1.hadoop2.x自带wordcount在什么位置?
2.运行wordcount程序,需要做哪些准备?

static/image/hrline/4.gif



此篇是在
hadoop2完全分布式最新高可靠安装文档

hadoop2.X使用手册1:通过web端口查看主节点、slave1节点及集群运行状态

基础上对hadoop2.2的进一步认识。这里交给大家如何运行hadoop2.2自带例子

1.找到examples例子
我们需要找打这个例子的位置:首先需要找到你的hadoop文件夹,然后依照下面路径:
/hadoop/share/hadoop/mapreduce会看到如下图:hadoop-mapreduce-examples-2.2.0.jar



第二步:
我们需要需要做一下运行需要的工作,比如输入输出路径,上传什么文件等。
1.先在HDFS创建几个数据目录:
hadoop fs -mkdir -p /data/wordcount
hadoop fs -mkdir -p /output/

2.目录/data/wordcount用来存放Hadoop自带的WordCount例子的数据文件,运行这个MapReduce任务的结果输出到/output/wordcount目录中。
首先新建文件inputWord:
vi /usr/inputWord
新建完毕,查看内容:
cat /usr/inputWord



将本地文件上传到HDFS中:
hadoop fs -put /usr/inputWord /data/wordcount/可以查看上传后的文件情况,执行如下命令:
hadoop fs -ls /data/wordcount可以看到上传到HDFS中的文件。



通过命令
hadoop fs -text /data/wordcount/inputWord看到如下内容:



下面,运行WordCount例子,执行如下命令:
hadoop jar /usr/hadoop/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.2.0.jar wordcount /data/wordcount /output/wordcount
可以看到控制台输出程序运行的信息:aboutyun@master:~$ hadoop jar /usr/hadoop/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.2.0.jar wordcount /data/wordcount /output/wordcount
14/05/14 10:33:33 INFO client.RMProxy: Connecting to ResourceManager at master/172.16.77.15:8032
14/05/14 10:33:34 INFO input.FileInputFormat: Total input paths to process : 1
14/05/14 10:33:34 INFO mapreduce.JobSubmitter: number of splits:1
14/05/14 10:33:34 INFO Configuration.deprecation: user.name is deprecated. Instead, use mapreduce.job.user.name
14/05/14 10:33:34 INFO Configuration.deprecation: mapred.jar is deprecated. Instead, use mapreduce.job.jar
14/05/14 10:33:34 INFO Configuration.deprecation: mapred.output.value.class is deprecated. Instead, use mapreduce.job.output.value.class
14/05/14 10:33:34 INFO Configuration.deprecation: mapreduce.combine.class is deprecated. Instead, use mapreduce.job.combine.class
14/05/14 10:33:34 INFO Configuration.deprecation: mapreduce.map.class is deprecated. Instead, use mapreduce.job.map.class
14/05/14 10:33:34 INFO Configuration.deprecation: mapred.job.name is deprecated. Instead, use mapreduce.job.name
14/05/14 10:33:34 INFO Configuration.deprecation: mapreduce.reduce.class is deprecated. Instead, use mapreduce.job.reduce.class
14/05/14 10:33:34 INFO Configuration.deprecation: mapred.input.dir is deprecated. Instead, use mapreduce.input.fileinputformat.inputdir
14/05/14 10:33:34 INFO Configuration.deprecation: mapred.output.dir is deprecated. Instead, use mapreduce.output.fileoutputformat.outputdir
14/05/14 10:33:34 INFO Configuration.deprecation: mapred.map.tasks is deprecated. Instead, use mapreduce.job.maps
14/05/14 10:33:34 INFO Configuration.deprecation: mapred.output.key.class is deprecated. Instead, use mapreduce.job.output.key.class
14/05/14 10:33:34 INFO Configuration.deprecation: mapred.working.dir is deprecated. Instead, use mapreduce.job.working.dir
14/05/14 10:33:35 INFO mapreduce.JobSubmitter: Submitting tokens for job: job_1400084979891_0004
14/05/14 10:33:36 INFO impl.YarnClientImpl: Submitted application application_1400084979891_0004 to ResourceManager at master/172.16.77.15:8032
14/05/14 10:33:36 INFO mapreduce.Job: The url to track the job: http://master:8088/proxy/application_1400084979891_0004/
14/05/14 10:33:36 INFO mapreduce.Job: Running job: job_1400084979891_0004
14/05/14 10:33:45 INFO mapreduce.Job: Job job_1400084979891_0004 running in uber mode : false
14/05/14 10:33:45 INFO mapreduce.Job:map 0% reduce 0%
14/05/14 10:34:10 INFO mapreduce.Job:map 100% reduce 0%
14/05/14 10:34:19 INFO mapreduce.Job:map 100% reduce 100%
14/05/14 10:34:19 INFO mapreduce.Job: Job job_1400084979891_0004 completed successfully
14/05/14 10:34:20 INFO mapreduce.Job: Counters: 43
      File System Counters
                FILE: Number of bytes read=81
                FILE: Number of bytes written=158693
                FILE: Number of read operations=0
                FILE: Number of large read operations=0
                FILE: Number of write operations=0
                HDFS: Number of bytes read=175
                HDFS: Number of bytes written=51
                HDFS: Number of read operations=6
                HDFS: Number of large read operations=0
                HDFS: Number of write operations=2
      Job Counters
                Launched map tasks=1
                Launched reduce tasks=1
                Data-local map tasks=1
                Total time spent by all maps in occupied slots (ms)=23099
                Total time spent by all reduces in occupied slots (ms)=6768
      Map-Reduce Framework
                Map input records=5
                Map output records=10
                Map output bytes=106
                Map output materialized bytes=81
                Input split bytes=108
                Combine input records=10
                Combine output records=6
                Reduce input groups=6
                Reduce shuffle bytes=81
                Reduce input records=6
                Reduce output records=6
                Spilled Records=12
                Shuffled Maps =1
                Failed Shuffles=0
                Merged Map outputs=1
                GC time elapsed (ms)=377
                CPU time spent (ms)=11190
                Physical memory (bytes) snapshot=284524544
                Virtual memory (bytes) snapshot=2000748544
                Total committed heap usage (bytes)=136450048
      Shuffle Errors
                BAD_ID=0
                CONNECTION=0
                IO_ERROR=0
                WRONG_LENGTH=0
                WRONG_MAP=0
                WRONG_REDUCE=0
      File Input Format Counters
                Bytes Read=67
      File Output Format Counters
                Bytes Written=51


查看结果,执行如下命令:
hadoop fs -text /output/wordcount/part-r-00000
结果数据示例如下:aboutyun@master:~$ hadoop fs -text /output/wordcount/part-r-00000
aboutyun      2
first      1
hello      3
master      1
slave      2
what      1



登录到Web控制台,访问链接http://master:8088/可以看到任务记录情况。

下一篇:hadoop2.2运行mapreduce(wordcount)问题总结













suchislife 发表于 2015-4-10 22:22:22

学习了 想知道为什么不能发帖子呢

轩辕依梦Q 发表于 2014-10-13 23:28:15

本帖最后由 pig2 于 2014-10-13 23:35 编辑

版主,你好,遇到问题求助:
问题描述:
centos机器下,编译过的64位hadoop,运行自带的wordcount例子,运行报错,运行时间超长,但有时虽然报错,但是结果能执行成功。没有日志

在论坛里也找过各种帖子,但没有找到类似的问题

也提过一个帖子,但问题还是没有解决
http://www.aboutyun.com/thread-9477-1-1.html


贴上运行截图,本次运行报错,没有结果,没有日志。
请帮助解决问题,多谢!












pig2 发表于 2014-10-13 23:46:36

轩辕依梦Q 发表于 2014-10-13 23:28
版主,你好,遇到问题求助:
问题描述:
centos机器下,编译过的64位hadoop,运行自带的wordcount例子,运 ...

无论是成功,还是失败都会有日志的,不可能没有的。日志在这个位置:
http://www.aboutyun.com/data/attachment/forum/201402/22/193035xvyueyucvz4u6vny.png

如果没有日志,说明你的安装配置有问题。

轩辕依梦Q 发表于 2014-10-14 09:07:18

pig2 发表于 2014-10-13 23:46
无论是成功,还是失败都会有日志的,不可能没有的。日志在这个位置:




哦,启动的时候日志都正常有,就是mapred的时候没有任何日志,那我再重新编译配置一次看看吧

轩辕依梦Q 发表于 2014-10-14 22:31:47

pig2 发表于 2014-10-13 23:46
无论是成功,还是失败都会有日志的,不可能没有的。日志在这个位置:






多谢版主!重新配置后,运行正常。

chuyuan_zhou 发表于 2014-12-17 13:05:29

关注中,收藏!

tang 发表于 2015-3-6 17:19:04

很好的文章,学习了

jiaozi 发表于 2016-3-27 17:12:24

你好,版主,我运行例子的时候,一直处于如下状态:
waiting for AM container to be allocated, launched and register with RM.

用虚拟机安装的完全分布式,可能是什么原因呀,内存太小了吗,还是哪里配置有问题。

leo_1989 发表于 2016-3-27 17:56:05

jiaozi 发表于 2016-3-27 17:12
你好,版主,我运行例子的时候,一直处于如下状态:
waiting for AM container to be allocated, launche ...

内存多大,这个应该是等待分配
页: [1] 2
查看完整版本: hadoop2.2使用手册2:如何运行自带wordcount