分享

关于hmaster和jobtracker的节点选择

zeus_lhl 发表于 2016-7-9 02:24:22 [显示全部楼层] 回帖奖励 阅读模式 关闭右栏 3 11083
1. hbase的hmaster节点,和map reduce的Job Tracker,分别都必须要和namenode置于同一个节点吗?还是说随便放哪个节点都行?而hmaster和jobtracker所在的节点基本没什么负载,是不是这样的节点硬盘容量要求也不高?
2. 如果给其他系统提供一个API的调用接口(MR或者Hbase),想把这个节点的带宽设置大点,这些接口所在的节点是上面说的hmaster或者JobTracker所在节点,还是说任意一台datanode节点?
3. 因为获取到的日志数据,是要放在一台datanode上,如果是后者(任一台datanode上),那日志全放这台节点上,堆积的数据多了,会不会负载很大?
刚入门,没做过相关的项目,请知道的朋友分条说一下,谢谢

已有(3)人评论

跳转到指定楼层
qcbb001 发表于 2016-7-9 08:02:28
1. hbase的hmaster节点,和map reduce的Job Tracker,分别都必须要和namenode置于同一个节点吗?还是说随便放哪个节点都行?而hmaster和jobtracker所在的节点基本没什么负载,是不是这样的节点硬盘容量要求也不高?
不是必须的,很多进程可以都安装在一个节点,也可以分开安装。如果安全性够高,可以分开安装


2. 如果给其他系统提供一个API的调用接口(MR或者Hbase),想把这个节点的带宽设置大点,这些接口所在的节点是上面说的hmaster或者JobTracker所在节点,还是说任意一台datanode节点?
这方面楼主还需要加深,关键看你想做哪方面的接口。如果涉及datanode,是在任何节点。如果只是服务端开发,可能只涉及到namenode


3. 因为获取到的日志数据,是要放在一台datanode上,如果是后者(任一台datanode上),那日志全放这台节点上,堆积的数据多了,会不会负载很大?
hadoop是分布式的。如果这样会产生数据倾斜,可以配置优化使其均匀分不到不通的机器上。这样负载就小多了。
例如:

hadoop数据节点中某个磁盘分区数据倾斜问题请教??
http://www.aboutyun.com/forum.php?mod=viewthread&tid=10146


回复

使用道具 举报

zeus_lhl 发表于 2016-7-9 23:45:55
本帖最后由 zeus_lhl 于 2016-7-9 23:48 编辑
qcbb001 发表于 2016-7-9 08:02
1. hbase的hmaster节点,和map reduce的Job Tracker,分别都必须要和namenode置于同一个节点吗?还是说随便 ...

谢谢,你的回答很条理,还有几个疑问没清楚:
1. 那一般企业里,各个节点的带宽都是设置成一样的,还是说哪些个节点的带宽会设置偏高?为什么?
2. 数据倾斜是日志中的数据,而不是日志文件本身所占用硬盘的空间造成的倾斜吧?   
3. 如果我的数据源都是日志文件,一般要处理的话,这些日志是怎么在节点上分配的(这个是我特别想知道的)?       是根据业务不同,或者功能不同,然后把不同的日志文件拉取到不同的节点上吗?可不可以先把一台节点的硬盘用的差不多了,然后再加载到其他的节点上(当然,这样会负载不均衡)?

回复

使用道具 举报

zeus_lhl 发表于 2016-7-9 23:51:06
qcbb001 发表于 2016-7-9 08:02
1. hbase的hmaster节点,和map reduce的Job Tracker,分别都必须要和namenode置于同一个节点吗?还是说随便 ...

补充一下,针对带宽设置,如果某些节点设置带宽比其他的节点要高,可不可以举个例子?谢谢
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

推荐上一条 /2 下一条