分享

Cloudera Enterprise过期后重启服务datanode启动不了

一个集群6台机器,官网说企业版使用后不影响免费版使用,但是试用了Cloudera Enterprise过期之后,很多服务不正常,重启服务后发现datanode启动不了,界面看到是错误提示:Base role config group of type BALANCER not found in service hdfs,之后根据官网文档去datanode配置香项创建组,结果发现下拉列表根本没这个选择的,哪位大佬知道如何破解着难题呢?在线等


001.png
002.png

已有(8)人评论

跳转到指定楼层
nettman 发表于 2019-12-25 08:17:04
最好一开始就使用免费版,避免造成这样的情况。

楼主可以参考下面官网的内容,看能否在配置下
https://docs.cloudera.com/docume ... _hdfs_balancer.html

1.png
回复

使用道具 举报

luo360 发表于 2019-12-25 09:30:20
HDFS服务配置里面,范围中没找到平衡器这个东西了,去创建又创建不了
003.png
回复

使用道具 举报

hyj 发表于 2019-12-25 09:52:22
luo360 发表于 2019-12-25 09:30
HDFS服务配置里面,范围中没找到平衡器这个东西了,去创建又创建不了

那就是没有了,不过这个应该不影响启动的。
实在不行,采用下面方法:
1.手工启动hdfs,也就是直接通过hdfs命令启动
2.cloudera其实只是对hadoop的封装而已,Balancers命令应该也可以实现启动的。
回复

使用道具 举报

luo360 发表于 2019-12-25 14:47:21
现在就是手工启动了,CM页面上也监听不到DATANODE的状态,而且提示很多快坏了,NAMENODE手工启动还报错,基本上这个集群处于废弃完全不能用的情况
回复

使用道具 举报

hyj 发表于 2019-12-25 17:50:40
luo360 发表于 2019-12-25 14:47
现在就是手工启动了,CM页面上也监听不到DATANODE的状态,而且提示很多快坏了,NAMENODE手工启动还报错,基 ...

namenode看看日志启动报什么错误
回复

使用道具 举报

luo360 发表于 2019-12-26 15:54:26
现在手工启动,集群看似正常,但是通过hadoop fsck /命令检查,发现10几万的文件丢失,后面使用hdfs debug recoverLease -path $line -retries 2 命令修复,检查发现无效,确认无效,估计这批数据真是无法找回来了
回复

使用道具 举报

luo360 发表于 2019-12-26 16:35:09
现在怀疑修复数据的时候是不是服务不行,而不是真的数据库丢失了,1年前的数据库也丢失,按照道理不会,不知道有人试过现有的集群(dfs.datanode.data.dir)和(dfs.namenode.name.dir)数据直接挂在一个新的集群上,就不格式化新集群,不知道行不?
哪位大神可以指点下
回复

使用道具 举报

hyj 发表于 2019-12-26 17:04:30
luo360 发表于 2019-12-26 16:35
现在怀疑修复数据的时候是不是服务不行,而不是真的数据库丢失了,1年前的数据库也丢失,按照道理不会,不 ...

你是怎么判断丢失的,最好贴出来,看看是什么原因。需要判断,到底是元数据的原因,还是数据丢失造成的。如果是元数据,是否备份了,是否有Secondary NameNode或则备用节点等。 楼主可看下图
20171114122514628.png

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

推荐上一条 /2 下一条