现象:zk dump中总是有closing,查看源码,发现region server在close region时如果没有成功则会出现此问题,但会有异常抛出,而log中没有相关异常。原因:region server页面中发现版本没有对齐,出问题的region server用了一个非常老的版本。解决方法:版本对齐。
现象:hbck有大量region都被加载了6、7次,hbck过程中.meta.表无法访问。原因:可能是balencer的原因,关闭完大量region后比较容易触发迁移,导致.meta.表迁移(也有可能是region信息写入过于频繁导致了split,但按照迁移的原因处理后问题解决),新的信息无法写入。解决方法:把balencer禁掉再hbck。