分享

hadoop2.3安装和wordcount运行验证

本帖最后由 xioaxu790 于 2014-5-28 13:00 编辑
问题导读:
1、如何安装部署hadoop2.3 ?
2、如何运行wordcount列子 ?




前言

hadoop2.3安装和wordcount运行验证,有需要的朋友可以参考下。

以下描述了centos linux(2.6.32-279.el6.x86_64)位机器下,安装32位hadoop 2.3,并通过运行
系统自带的 WordCount 例子来验证服务正确性的步骤。


建立目录
/usr/local/hadoop2.3,以后这个是 hadoop 的安装目录。

java 系统安装(32位版本,jdk-7u51-linux-i586.tar.gz)
jdk下载
oracle 官方网站下载,覆盖原来机器上的版本。
解压 jdk-7u51-linux-i586.tar.gz 版本到 /usr/local/

  1. [root@six hadoop2.3]# ls /usr/local/jdk1.7.0_51
  2. bin jdk-7u51-linux-i586.tar.gz README.html
  3. COPYRIGHT jre release
  4. db lib src.zip
  5. include LICENSE THIRDPARTYLICENSEREADME-JAVAFX.txt
  6. jdk1.7.0_51 man THIRDPARTYLICENSEREADME.txt
复制代码


修改配置文件,增加环境变量JAVA_HOME

  1. [root@six hadoop2.3]# vi /etc/profile
  2. export JAVA_HOME=/usr/local/jdk1.7.0_51
复制代码

执行命令,生效配置
[root@six hadoop2.3]# source /etc/profile

覆盖或者更新系统 java 版本

  1. sudo update-alternatives --install /usr/bin/java java /usr/local/jdk1.7.0_51/bin/java 300
  2. sudo update-alternatives --install /usr/bin/javac javac /usr/local/jdk1.7.0_51/bin/javac 300
  3. sudo update-alternatives --config java
  4. sudo update-alternatives --config javac
复制代码

下载 hadoop 2.3 版本
官网http://hadoop.apache.org/去下载,具体地址可能是
其中一个镜像
下载得到文件 hadoop-2.3.0.tar.gz,特别注意,这个是32位版本,
官网没有提供 64位版本的下载,如果需要,自己编译安装。


安装 hadoop 2.3,解压hadoop-2.3.0.tar.gz到目录 /usr/local/hadoop2.3即可

  1. [root@six hadoop2.3]# ls
  2. bin etc hadoop-2.3.0.tar.gz lib LICENSE.txt NOTICE.txt sbin
  3. dfs example include
复制代码

配置 etc/hadoop/hadoop-env.sh

  1. [root@six hadoop2.3]# cat etc/hadoop/hadoop-env.sh
  2. # The java implementation to use.
  3. export JAVA_HOME=/usr/local/jdk1.7.0_51
复制代码

配置 etc/hadoop/hdfs-site.xml

  1. [root@six hadoop2.3]# cat etc/hadoop/hdfs-site.xml
  2. <configuration>
  3. <property>
  4. <name>dfs.namenode.name.dir</name>
  5. <value>file:/usr/local/hadoop2.3/dfs/name</value>
  6. </property>
  7. <property>
  8. <name>dfs.datanode.data.dir</name>
  9. <value>file:/usr/local/hadoop2.3/dfs/data</value>
  10. </property>
  11. </configuration>
复制代码

配置 etc/hadoop/hdfs-site.xml

  1. [root@six hadoop2.3]# cat etc/hadoop/core-site.xml
  2. <configuration>
  3. <property>
  4. <name>fs.defaultFS</name>
  5. <value>hdfs://127.0.0.1:9009</value>
  6. </property>
  7. </configuration>
复制代码

配置 etc/hadoop/yarn-site.xml

  1. [root@six hadoop2.3]# cat etc/hadoop/yarn-site.xml
  2. <configuration>
  3. <!-- Site specific YARN configuration properties -->
  4. <property>
  5. <name>mapreduce.framework.name</name>
  6. <value>yarn</value>
  7. </property>
  8. <property>
  9. <name>yarn.nodemanager.aux-services</name>
  10. <value>mapreduce_shuffle</value>
  11. </property>
  12. </configuration>
复制代码


配置日志输出方式,便于调试错误

  1. export HADOOP_ROOT_LOGGER=INFO,console
复制代码


格式化文件系统

  1. [root@six hadoop2.3]# mkdir dfs/
  2. [root@six hadoop2.3]# mkdir dfs/name
  3. [root@six hadoop2.3]# mkdir dfs/data
  4. [root@six hadoop2.3]# ./bin/hadoop namenode -format
复制代码

启动服务,这里使用 root 用户,需要输入密码的时候,输入 root 用户密码,如果使用非 root,并假设 分布式服务,需要先解决 ssh 登录问题,此处不详细描述。

  1. [root@six hadoop2.3]# ./sbin/hadoop-daemon.sh start namenode
  2. [root@six hadoop2.3]# ./sbin/hadoop-daemon.sh start datanode
  3. [root@six hadoop2.3]# ./sbin/hadoop-daemon.sh start dfs
  4. [root@six hadoop2.3]# ./sbin/start-yarn.sh
复制代码

查看状态
[root@six hadoop2.3]# ./bin/hadoop dfsadmin -report
表示一个数据节点OK
Datanodes available: 1 (1 total, 0 dead)

http://127.0.0.1:50070/
能看到 hadoop 服务启动


构造数据文件(file1.txt,file2.txt)

  1. [root@six hadoop2.3]# cat example/file1.txt
  2. hello world
  3. hello markhuang
  4. hello hadoop
  5. [root@six hadoop2.3]# cat example/file2.txt
  6. hadoop ok
  7. hadoop fail
  8. hadoop 2.3
复制代码

把数据文件加入到 hadoop 系统。

  1. [root@six hadoop2.3]# ./bin/hadoop fs -mkdir /data
  2. [root@six hadoop2.3]# ./bin/hadoop fs -put -f example/file1.txt example/file2.txt /data
复制代码

运行 WordCount(java) 版本。

  1. [root@six hadoop2.3]# ./bin/hadoop jar ./share/hadoop/mapreduce/sources/hadoop-mapreduce-examples-2.3.0-sources.jar org.apache.hadoop.examples.WordCount /data /output
复制代码

查看结果

  1. [root@six hadoop2.3]# ./bin/hadoop fs -cat /output/part-r-00000
  2. 2.3 1
  3. fail 1
  4. hadoop 4
  5. hello 3
  6. markhuang 1
  7. ok 1
  8. world 1
复制代码







已有(1)人评论

跳转到指定楼层
allenswf 发表于 2015-3-24 08:05:09
给楼主 点个赞呗
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

推荐上一条 /2 下一条