5、 运行hadoop进入到E:\hadoop-0.20.1,在cygwin下的操作如:/cygdrive/e/ hadoop-0.20.1,执行:bin/hadoop namenode –format格式化一个新的分布式文件系统,提示信息如下:
10/02/19 17:32:26 WARN conf.Configuration: DEPRECATED: hadoop-site.xml found in the classpath.
Usage of hadoop-site.xml is deprecated. Instead use core-site.xml, mapred-site.xml and hdfs-site.xml
to override properties of core-default.xml, mapred-default.xml and hdfs-default.xml respectively
(这段我还不是很清楚,我用的最新版本)10/02/19 17:32:26 INFO namenode.NameNode: STARTUP_MSG:/************************************************************STARTUP_MSG: Starting NameNodeSTARTUP_MSG: host = PC-04101515/192.168.0.14STARTUP_MSG: args = [-format]STARTUP_MSG: version = 0.20.1STARTUP_MSG: build =http://svn.apache.org/repos/asf/hadoop/common/tags/release-0.20.1-rc1 -r 810220; compiled by ‘oom’ on Tue Sep 1 20:55:56 UTC 2009************************************************************/10/02/19 17:32:27 INFO namenode.FSNamesystem:fsOwner=zihou,None,root,Administrators,Users10/02/19 17:32:27 INFO namenode.FSNamesystem: supergroup=supergroup10/02/19 17:32:27 INFO namenode.FSNamesystem: isPermissionEnabled=true10/02/19 17:32:28 INFO common.Storage: Image file of size 102 saved in 0 seconds.10/02/19 17:32:28 INFO common.Storage: Storage directory \tmp\hadoop-SYSTEM\dfs\name has been successfully formatted.10/02/19 17:32:28 INFO namenode.NameNode: SHUTDOWN_MSG:/************************************************************SHUTDOWN_MSG: Shutting down NameNode at PC-04101515/192.168.0.14************************************************************/ 6、 启动hadoop守护进程
(注:如果你第一次启动,提示信息或许会与上面有所不同,我为了写这篇文章,重新执行了一遍)7、 测试单机模式的操作方法下面的实例将已解压的 conf 目录拷贝作为输入,查找并显示匹配给定正则表达式的条目。输出写入到指定的output目录。(注:根目录是hadoop的目录)$ mkdir input$ cp conf/*.xml input$ bin/hadoop jar hadoop-*-examples.jar grep input output ‘dfs[a-z.]+’$ cat output/*通过执行$ bin/hadoop dfs –ls来看是否将*.xml文件拷贝到input中了,执行后结果如下:Found 1 itemsdrwxr-xr-x – zihou supergroup 0 2010-02-19 17:44 /user/zihou/input表示已经拷贝过去了。在伪分布式模式上运行bin/hadoop jar hadoop-*-examples.jar grep input output ‘dfs[a-z.]+’如果没有错误的话,会给出一堆信息,如:
10/02/19 14:56:07 WARN conf.Configuration: DEPRECATED: hadoop-site.xml found in the classpath. Usage of hadoop-site.xml is deprecated. Instead use core-site.xml, mapred-site.xml and hdfs-site.xml to override properties of core-default.xml, mapred-default.xml and hdfs-default.xml respectively10/02/19 14:56:08 INFO jvm.JvmMetrics: Initializing JVM Metrics with processName=JobTracker, sessionId=10/02/19 14:56:09 INFO mapred.FileInputFormat: Total input paths to process : 510/02/19 14:56:10 INFO mapred.JobClient: Running job: job_local_000110/02/19 14:56:10 INFO mapred.FileInputFormat: Total input paths to process : 510/02/19 14:56:10 INFO mapred.MapTask: numReduceTasks: 110/02/19 14:56:10 INFO mapred.MapTask: io.sort.mb = 10010/02/19 14:56:10 INFO mapred.MapTask: data buffer = 79691776/9961472010/02/19 14:56:10 INFO mapred.MapTask: record buffer = 262144/327680。。。。。。。。。。。。。。。
这样,hadoop就成功配置了!说明:Hadoop中文文档地址:http://hadoop.apache.org/common/docs/r0.18.2/cn/快速安装说明手册:http://hadoop.apache.org/common/docs/r0.18.2/cn/quickstart.htmlHadoop简介:Hadoop是一个开放源代码的分布式文件系统,属于Apache中的一个项目,所谓分布式文件系统(Distributed File System),指的是具有执行远程文件存取的能力,并以透明方式对分布在网络上的文件进行管理和存取,客户端访问的时候不需要知道文件真正存放在哪里。 Hadoop最初是包含在Nutch中的,后来,Nutch中实现的NDFS和MapReduce代码剥离出来成立了一个新的开源项目,这就是 Hadoop。问题:安装了cygwin,但没有cygdrive这个文件夹?、解答:查看硬盘是看不到这个文件夹的,但如果你通过DOS界面操作的话就有这个文件夹,这个文件夹相当于是Linux系统下的文件夹,在Windows环境下是看不到的。但在Dos界面中,如果你安装好了cygwin的话,就相当于Linux环境,所以是可以看到这个文件夹的。