实现方式及目标:
web监控:
监控工具可以是一种基于Web的工具,支持Apache Hadoop集群的供应、管理和监控。支持大多数Hadoop组件,包括HDFS、MapReduce、Hive、Pig、 Hbase、Zookeper、Sqoop和Hcatalog等。
管理组件:
支持HDFS、MapReduce、Hive、Pig、Hbase、Zookeper、Sqoop和Hcatalog等的集中管理。也是5个顶级hadoop管理工具之一。
实现目标:
1.通过一步一步的安装向导简化了集群供应。
2.预先配置好关键的运维指标(metrics),可以直接查看Hadoop Core(HDFS和MapReduce)及相关项目(如HBase、Hive和HCatalog)是否健康。
3.支持作业与任务执行的可视化与分析,能够更好地查看依赖和性能。
4.通过一个完整的RESTful API把监控信息暴露出来,集成了现有的运维工具。
5.用户界面非常直观,用户可以轻松有效地查看信息并控制集群。
5.根据收集度量指标,支持系统报警,当需要引起管理员的关注时(比如,节点停机或磁盘剩余空间不足等问题),系统将向其发送邮件。
6.能够安装安全的Hadoop集群,实现了对Hadoop 安全的支持,提供了基于角色的用户认证、授权和审计功能。
上面是实现目标,这里具体说一下:
Hadoop集群的部署与管理系统HDMS,系统旨在自动化地部署Hadoop相关系统、管理集群
节点角色、修改配置参数、启动停止系统服务并监控系统运行状态。主要体现在以下四个方面:
(1)配置接口的设计与实现。通过提取Hadoop集群的可配置项,抽象
成键值对形式的参数化接口,集中存放在HDMS系统的管理节点上,为上层应用系统提供了直
观而方便的集群配置手段。
(2)集群部署模块的设计与实现。通过执行远程命令为节点部
署必要环境,主要包括部署网络环境、部署软件库、部署时间一致性服务、以及应用配置到节点等操作,为上层应用系统提供了统一的集群部署接口。
(3) Hadoop
组件模块的设计与实现。利用Puppet资源描述语言来管理集群资源,包括Hadoop相关组件的
软件包、配置文件和服务的启动停止。设计并实现了节点对于Hadoop服务的内存分配算法
以及Mapreduce任务槽的数量计算。
(4)安全模块和监控模块的设计与实现。
可以基于Puppet设计并实现Kerberos身份认证系统以及Ganglia集群监控系统的的部署和管理方案,并自动
化地修改Hadoop相关参数完成集成工作,为Hadoop集群提供了安全保障和监控手段。
|