书籍分享:Hadoop 技术内幕:深入解析 MapReduce 架构设计与实现原理
一、适用对象(1)Hadoop 二次开发人员
Hadoop 由于在扩展性、容错性和稳定性等方面的诸多优点,已被越来越多的公司采
用。而为了减少开发成本,大部分公司在 Hadoop 基础上进行了二次开发,以打造属于公司
内部的 Hadoop 平台。对于 Hadoop 二次开发人员来说,深入而又全面地了解 Hadoop 的设
计原理与实现细节是修改 Hadoop 内核的前提,而本书可帮助这部分读者快速而又全面地了
解 Hadoop 实现细节。
(2)Hadoop 应用开发人员
如果要利用 Hadoop 进行高级应用开发,仅掌握 Hadoop 基本使用方法是远远不够的,
必须对 Hadoop 框架的设计原理、架构和运作机制有一定的了解。对这部分读者而言,本书
将带领他们全面了解 Hadoop 的设计和实现原理,加深对 Hadoop 框架的理解,提高开发水
平,从而编写出更加高效的 MapReduce 应用程序。
(3)Hadoop 运维工程师
对于一名合格的 Hadoop 运维工程师而言,适当地了解 Hadoop 框架的设计原理、架
构和运作机制是十分有帮助的。这不仅可以使 Hadoop 运维人员更快地排除各种可能的
Hadoop 故障,还可以让 Hadoop 运维人员与研发人员进行更有效的沟通。通过阅读这本书,
Hadoop 运维人员可以了解到很多其他书中无法获取的 Hadoop 实现细节。
(4)开源软件爱好者
Hadoop 是开源软件中的佼佼者。它在实现的过程中吸收了很多开源领域的优秀思想,
同时有很多值得学习的创新。尤为值得一提的是,本书分析 Hadoop 架构设计和实现原理的
方式也许值得所有开源软件爱好者学习和借鉴。通过阅读本书,这部分读者不仅能领略到
开源软件的优秀思想,还可以掌握分析开源软件源代码的方法和技巧,从而进一步提高使
用开源软件的效率和质量。
二、如何阅读本书
本书分为四大部分(不包括附录):
第一部分为基础篇,简单地介绍 Hadoop 的阅读环境搭建和基本设计架构,帮助读者了
解一些基础背景知识。
第二部分为 MapReduce 编程模型篇,着重讲解 MapReduce 编程接口,主要包括两套
编程接口,分别是旧 API 和新 API。
第三部分为 MapReduce 核心设计篇,主要讲解 Hadoop MapReduce 的运行时环境,包
括 RPC 框架、客户端、JobTracker、TaskTracker 和 Task 等内部实现细节。
V
第四部分为 MapReduce 高级篇,主要讲解 Hadoop MapReduce 中的一些高级特性和未
来发展趋势,包括多用户作业调度器、安全机制和下一代 MapReduce 框架等。
另外,本书最后还添加了几个附录 :附录 A 为安装 Hadoop 过程中可能存在的问题及
解决方案 ;附录 B 为 Hadoop 默认 HTTP 端口号以及 HTTP 地址。参考资料中包括了本书
写作过程中参考的书籍、论文、Hadoop Jira 和网络资源。
如果你是一名经验丰富的资深用户,能够理解 Hadoop 的相关基础知识和使用技巧,那
么你可以直接阅读第三部分和第四部分。但是,如果你是一名初学者,请一定从第 1 章的
基础理论知识开始学习。
http://pan.baidu.com/s/1nCmZr
全集:
Hadoop技术内幕 深入解析HADOOP COMMON和HDFS架构设计与实现原理大全1-9章
Hadoop技术组 的范德萨发生飞洒发1
页:
[1]