分享

nutch2.x在hadoop2.x下运行异常

fanbells 2013-12-18 10:20:42 发表于 问题解答 [显示全部楼层] 回帖奖励 阅读模式 关闭右栏 19 25611
通过crawl进行数据爬取时,出现下面的错误java.io.IOException: Cannot initialize Cluster. Please check your configuration for mapreduce.framework.name and the correspond server addresses.
        at org.apache.hadoop.mapreduce.Cluster.initialize(Cluster.java:120)
        at org.apache.hadoop.mapreduce.Cluster.<init>(Cluster.java:82)
        at org.apache.hadoop.mapreduce.Cluster.<init>(Cluster.java:75)
        at org.apache.hadoop.mapreduce.Job$9.run(Job.java:1238)
        at org.apache.hadoop.mapreduce.Job$9.run(Job.java:1234)
        at java.security.AccessController.doPrivileged(Native Method)
        at javax.security.auth.Subject.doAs(Subject.java:396)
        at org.apache.hadoop.security.UserGroupInformation.doAs(UserGroupInformation.java:1491)
        at org.apache.hadoop.mapreduce.Job.connect(Job.java:1233)
        at org.apache.hadoop.mapreduce.Job.submit(Job.java:1262)
        at org.apache.hadoop.mapreduce.Job.waitForCompletion(Job.java:1286)
        at org.apache.nutch.util.NutchJob.waitForCompletion(NutchJob.java:50)
        at org.apache.nutch.crawl.InjectorJob.run(InjectorJob.java:233)
        at org.apache.nutch.crawl.InjectorJob.inject(InjectorJob.java:251)
        at org.apache.nutch.crawl.InjectorJob.run(InjectorJob.java:273)
        at org.apache.hadoop.util.ToolRunner.run(ToolRunner.java:70)
        at org.apache.nutch.crawl.InjectorJob.main(InjectorJob.java:282)

已有(19)人评论

跳转到指定楼层
lzw 发表于 2013-12-18 10:28:16
查看一下你Hadoop_HOME 和hadoop_conf_dir是否配置的正确,除了异常之外,其他相关信息也贴出来我看看。
回复

使用道具 举报

fanbells 发表于 2013-12-18 11:30:07
lzw 发表于 2013-12-18 10:28
查看一下你Hadoop_HOME 和hadoop_conf_dir是否配置的正确,除了异常之外,其他相关信息也贴出来我看看。

这个就是全部的日志信息了。
INFO  crawl.InjectorJob - InjectorJob: starting at 2013-12-18 10:03:10
2013-12-18 10:03:10,229 INFO  crawl.InjectorJob - InjectorJob: Injecting urlDir: /usr/local/ceshi
2013-12-18 10:03:11,161 WARN  util.NativeCodeLoader - Unable to load native-hadoop library for your platform... using builtin-java classes where applicable
2013-12-18 10:10:42,692 INFO  crawl.InjectorJob - InjectorJob: starting at 2013-12-18 10:10:42
2013-12-18 10:10:42,693 INFO  crawl.InjectorJob - InjectorJob: Injecting urlDir: /usr/local/ceshi
2013-12-18 10:10:43,582 WARN  util.NativeCodeLoader - Unable to load native-hadoop library for your platform... using builtin-java classes where applicable
2013-12-18 10:10:46,338 INFO  store.HBaseStore - Keyclass and nameclass match but mismatching table names  mappingfile schema is 'webpage' vs actual schema 'test_webpage' , assuming they are the same.
2013-12-18 10:10:46,979 INFO  crawl.InjectorJob - InjectorJob: Using class org.apache.gora.hbase.store.HBaseStore as the Gora storage class.
2013-12-18 10:10:46,995 ERROR security.UserGroupInformation - PriviledgedActionException as:root (auth:SIMPLE) cause:java.io.IOException: Cannot initialize Cluster. Please check your configuration for mapreduce.framework.name and the correspond server addresses.
2013-12-18 10:10:46,996 ERROR crawl.InjectorJob - InjectorJob: java.io.IOException: Cannot initialize Cluster. Please check your configuration for mapreduce.framework.name and the correspond server addresses.
        at org.apache.hadoop.mapreduce.Cluster.initialize(Cluster.java:120)
        at org.apache.hadoop.mapreduce.Cluster.<init>(Cluster.java:82)
        at org.apache.hadoop.mapreduce.Cluster.<init>(Cluster.java:75)
        at org.apache.hadoop.mapreduce.Job$9.run(Job.java:1238)
        at org.apache.hadoop.mapreduce.Job$9.run(Job.java:1234)
        at java.security.AccessController.doPrivileged(Native Method)
        at javax.security.auth.Subject.doAs(Subject.java:396)
        at org.apache.hadoop.security.UserGroupInformation.doAs(UserGroupInformation.java:1491)
        at org.apache.hadoop.mapreduce.Job.connect(Job.java:1233)
        at org.apache.hadoop.mapreduce.Job.submit(Job.java:1262)
        at org.apache.hadoop.mapreduce.Job.waitForCompletion(Job.java:1286)
        at org.apache.nutch.util.NutchJob.waitForCompletion(NutchJob.java:50)
        at org.apache.nutch.crawl.InjectorJob.run(InjectorJob.java:233)
        at org.apache.nutch.crawl.InjectorJob.inject(InjectorJob.java:251)
        at org.apache.nutch.crawl.InjectorJob.run(InjectorJob.java:273)
        at org.apache.hadoop.util.ToolRunner.run(ToolRunner.java:70)
        at org.apache.nutch.crawl.InjectorJob.main(InjectorJob.java:282)

回复

使用道具 举报

nettman 发表于 2013-12-18 13:12:22
fanbells 发表于 2013-12-18 11:30
这个就是全部的日志信息了。
INFO  crawl.InjectorJob - InjectorJob: starting at 2013-12-18 10:03:1 ...

检查一下你的配置文件,注意字母的大小写。
回复

使用道具 举报

fanbells 发表于 2013-12-18 13:26:33
nettman 发表于 2013-12-18 13:12
检查一下你的配置文件,注意字母的大小写。

配置文件是对的,我的50070和8088页面访问正常。
回复

使用道具 举报

lzw 发表于 2013-12-18 13:54:55
你是用安装用户启动的,还是root的启动的,应该是用安装启动才对的。
回复

使用道具 举报

fanbells 发表于 2013-12-18 14:00:24
安装用户启动的hadoop
回复

使用道具 举报

lzw 发表于 2013-12-18 14:02:41
把你的mapred-site.xml配置贴出来看一下。
回复

使用道具 举报

fanbells 发表于 2013-12-18 14:02:47
fanbells 发表于 2013-12-18 14:00
安装用户启动的hadoop

hbase中表都创建了,就是报这个错
回复

使用道具 举报

fanbells 发表于 2013-12-18 14:04:48
fanbells 发表于 2013-12-18 14:02
hbase中表都创建了,就是报这个错

<configuration>
        <property>
                <name>mapreduce.framework.name</name>
                <value>yarn</value>
        </property>
</configuration>

回复

使用道具 举报

12下一页
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

推荐上一条 /2 下一条