搜索
搜 索
本版
文章
帖子
用户
图文精华
hadoop-2.6.0+zookeeper-3.4.6+hbase-1.0.0+hive-1.1.0完全分布 ...
首页
Portal
专题
BBS
面试
办公|编程助手
更多
登录
注册
用户组:游客
主题
帖子
云币
我的帖子
我的收藏
我的好友
我的勋章
设置
退出
导读
淘贴
博客
群组
社区VIP
APP下载
今日排行
本周排行
本周热帖
本月排行
本月热帖
会员排行
About云-梭伦科技
»
专题
›
技术学习(版主发帖区)
›
大数据学习
›
spring hadoop
›
Hdfs存储原理
0
0
0
分享
Hdfs存储原理
zixindejie
发表于 2016-8-22 19:04:25
[显示全部楼层]
阅读模式
关闭右栏
0
7440
About云VIP帮助找工作和提升
本帖最后由 pig2 于 2016-8-23 14:14 编辑
HDFS实现思想:
1.hdfs是通过分布式集群来存储文件
2.文件存储到hdfs集群中去时被切分成block
3.文件的block存放在若干Datanode节点上
4.hdfs文件系统中的文件与真实的block之间有映射关系,有Namenode管理
5.每一个block在集群中会存储多个副本,可以提高数据可靠性和访问吞吐量
工作原理:客户端存储数据内容到某一个路径下,首先发送申请去Namenode节点。Namenode节点查询存储内容是否存在,若不存在则Namenode返回给客户端许可,客户端将内容分配到Datanode上。
客户端存入数据将信息传入Namenode,Namenode将存储记录存入edits log;
namenode返回客户端存储分配的Datanode;
客户端向Namenode中的block中写入存储文件
写完一个block将edits log中的记录更新到Namenode的内存中
Namenode中的内存与fsimage互为镜像,fsimage中存储着数据内容
edits log中的新存储记录与fsimage合并:
Namenode内存中有元数据,磁盘上的文件fsimage中也存有元数据,而日志edits log中存着最新的存储记录。当edits log中存储记录存满后,SecondaryNamenode进行checkpoint操作:SecondaryNamenode向Namenode发出信号使Namenode停止向edits log中写数据,此时Namenode产生一个新的日志文件New edits log记录客户端上传的文件。而Namenode中的fsimage和edits log被下载到SecondaryNamenode中进行合并成一个新的元数据镜像文件,生成后上传给Namenode。新的元数据文件将替换原来的文件,New edits log也会替换原来的edits log日志。来源:http://bbs.csdn.net/topics/392007082
更多
0
回复
使用道具
举报
提升卡
置顶卡
沉默卡
喧嚣卡
变色卡
千斤顶
显身卡
没找到任何评论,期待你打破沉寂
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
本版积分规则
发表回复
回帖后跳转到最后一页
发表新帖
zixindejie
新手上路
关注
1
主题
19
帖子
4
粉丝
TA的主题
Hdfs存储原理
2016-8-22
24小时热文
Flink CDC:新一代实时数据集成框架
蚂蚁面试就是不一样
如何高效学习
人情世故速查速用大全集
框架思维
关闭
推荐
/2
中文版ChatGPT
1.无需魔法 2.提高编程效率 3.提高文档能力
查看 »
新手帮助
新手帮助:注册遇到问题,领取资源,加入铁粉群,不会使用搜索,如何获取积分等
查看 »
意见
反馈