分享

新人请教,增加regionserver后hbase写入停止,找不到哪里报错

duoduocode 发表于 2017-1-20 17:42:51 [显示全部楼层] 回帖奖励 阅读模式 关闭右栏 1 5528
环境简述:
使用完全分布式的方法搭建了一个3台服务器的hadoop集群,一个namenode,2个datanode。3台机器上分别部署zookeeper.2个已有的regionserver部署中datanode上。另有一台独立的应用服务器上发布java应用对hadoop集群进行操作操作背景:
今天新搞了两台机器,作为新的datanode和regionserver动态加入集群。启动成功,在hadoop和hbase的页面上能看到datanode和regionserver都起来
问题现象:
新增部署之后发现应用服务器上对hbase的写入完全停止。hbase页面上读写请求统计停止增长。查看写入部分的代码日志也没有catch到任何异常。

问题出现后完全没有排查头绪,后来发现应用服务器上的/etc/hosts文件没有加入两个新增结点的ip地址和主机名。加上之后,问题解决。

虽然误打误撞的解决了问题。但是根本没有找到根本原因,所以想请教,这种问题正常的排查思路应该是什么样的。在hadoop集群中哪里可以找到相关的日志。该从哪个点开始进行排查。十分感谢

已有(1)人评论

跳转到指定楼层
qcbb001 发表于 2017-1-20 19:30:33
两个节点链接不上master,datanode,regionserver,起来了,可能也会down掉。
他们会定期发送心跳,链接不上,应该会有错误
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

推荐上一条 /2 下一条