分享

cloudera-scm-agent启动失败

sunt99 发表于 2016-11-14 14:16:39 [显示全部楼层] 回帖奖励 阅读模式 关闭右栏 2 39253
请问下,我CDH界面报错,某一台机器与集群失去联系
不良  :    该主机与 Cloudera Manager Server 失去联系的时间过长。 该主机未与 Host Monitor 建立联系。
到该机器下,查看cloudera-scm-agent状态,显示
cloudera-scm-agent 已死,但 pid 文件仍存
于是删除cloudera-scm-agent.pid
重新启动cloudera-scm-agent
过了一会又死掉了,出现cloudera-scm-agent 已死,但 pid 文件仍存

查看日志cloudera-scm-agent.log
[12/Nov/2016 03:33:05 +0000] 16618 Monitor-HostMonitor throttling_logger ERROR    (5 skipped) Timed out waiting for worker process collecting filesystem usage to complete. This may occur if the host has an NFS or other remote filesystem that is not responding to requests in a timely fashion. Current nodev filesystems: /dev/shm,/var/run/cloudera-scm-agent/process
[12/Nov/2016 03:40:14 +0000] 16618 Monitor-HostMonitor filesystem_map WARNING  Failed to join worker process collecting filesystem usage. All nodev filesystems will have unknown usage until the worker process is no longer active. Current nodev filesystems: /dev/shm,/var/run/cloudera-scm-agent/process
大家有什么好的解决方法吗


已有(2)人评论

跳转到指定楼层
tntzbzc 发表于 2016-11-14 14:49:24
这个错误显示,一直是超时。
也就是说可能是agent根本就没有起来,所以还需要看看agent遇到了什么问题,导致起不来。使得 Host Monitor一直连接不上
回复

使用道具 举报

sunt99 发表于 2016-11-14 15:30:14
tntzbzc 发表于 2016-11-14 14:49
这个错误显示,一直是超时。
也就是说可能是agent根本就没有起来,所以还需要看看agent遇到了什么问题,导 ...

嗯嗯,agent 起来之后,过几秒就挂了,应该是没有能够写入cloudera-scm-agent.pid
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

推荐上一条 /2 下一条