图文精华

hadoop-2.6.0+zookeeper-3.4.6+hbase-1.0.0+hive-1.1.0完全分布 ...

About云-梭伦科技»专题 › 技术学习(版主发帖区) › 大数据学习 › Hadoop|YARN › 介绍解说› hadoop2体系结构

0
0
0

分享

hadoop2体系结构

pig2 2014-2-13 00:13:12 发表于介绍解说 [显示全部楼层] 回帖奖励

回帖奖励

阅读模式关闭右栏 0 6897

About云VIP帮助找工作和提升

本帖最后由 pig2 于 2014-2-13 10:58 编辑

阅读本文需要具有hadoop 1.x的基础。
可以带着下面问题来阅读本文：
1.hadoop2中支持几个NameNode？
2.NameNode之间是什么关系？
3.NameNode之间如何切换？

hadoop1的核心组成是两部分，即HDFS和MapReduce。在hadoop2中变为HDFS和Yarn。

新的HDFS中的NameNode不再是只有一个了，可以有多个（目前只支持2个）。每一个都有相同的职能。

这两个NameNode的地位如何哪？答：一个是active状态的，一个是standby状态的。当集群运行时，只有active状态的NameNode是正常工作的，standby状态的NameNode是处于待命状态的，时刻同步active状态NameNode的数据。一旦active状态的NameNode不能工作，通过手工或者自动切换，standby状态的NameNode就可以转变为active状态的，就可以继续工作了。这就是高可靠。

当NameNode发生故障时，他们的数据如何保持一致哪？在这里，2个NameNode的数据其实是实时共享的。新HDFS采用了一种共享机制，JournalNode集群或者NFS进行共享。NFS是操作系统层面的，JournalNode是hadoop层面的，我们这里使用JournalNode集群进行数据共享。

如何实现NameNode的自动切换哪？这就需要使用ZooKeeper集群进行选择了。HDFS集群中的两个NameNode都在ZooKeeper中注册，当active状态的NameNode出故障时，ZooKeeper能检测到这种情况，它就会自动把standby状态的NameNode切换为active状态。

HDFS Federation（HDFS联盟）是怎么回事？答：联盟的出现是有原因的。我们知道NameNode是核心节点，维护着整个HDFS中的元数据信息，那么其容量是有限的，受制于服务器的内存空间。当NameNode服务器的内存装不下数据后，那么HDFS集群就装不下数据了，寿命也就到头了。因此其扩展性是受限的。HDFS联盟指的是有多个HDFS集群同时工作，那么其容量理论上就不受限了，夸张点说就是无限扩展。

思考：hadoop2通过什么使集群更稳固

来自群组: Hadoop技术组

关注公众号，获取大数据、人工智能20套、区块链资源5阶段等资源，随时更新，获取最新技术资源

回复

使用道具举报

自定义广告语

没找到任何评论，期待你打破沉寂

GeneralJing 发表于 2014-2-13 10:23:46

pig2很犀利啊总结的很到位顶

回复

使用道具举报

发表新帖

pig2

超级版主

关注

2332

主题
3342

帖子
1972

粉丝

欢迎大家如about云官方2群322273151，更新咨询，更新资源，随时关注

TA的主题

24小时热文

推荐 /2

关于我们· 联系我们· 加入我们· 小黑屋· 合作伙伴

Copyright © 2001-2024 About云-梭伦科技 Powered by Discuz! X3.4 Licensed Discuz Team.

简书 / 京ICP备2020039040号简书网举报电话：021-34700000

意见
反馈