pig2 发表于 2014-2-12 18:26:57

YARN/MRv2 Resource Manager中用户交互相关模块详解

这一篇是在YARN的 Resource Manager的作用 基础上详细介绍

阅读本文可以带着下面问题:
1.如果某个作业死掉,该如何杀死一个作业?
2.为有利于管理员管理集群,YARN是怎么做的?
3.YARN为管理员提供哪些命令来管理集群?
4.WebApp是什么?

YARN分别针对普通用户,管理员和Web提供了三种对外服务,分别对应ClientRMService、AdminService和WebApp,本节将对这三个服务分别进行详细介绍。

1.   ClientRMService

ClientRMService是为普通用户提供的服务,它会处理来自客户端各种RPC请求,比如提交应用程序、终止应用程序,获取应用程序运行状态等。ClientRMService实现了 ClientRMProtocol协议,提供了丰富的RPC接口,以下是几个例子:public GetNewApplicationResponse getNewApplication(GetNewApplicationRequest request)
public SubmitApplicationResponse submitApplication(SubmitApplicationRequest request)
public KillApplicationResponse forceKillApplication(KillApplicationRequest request)
public GetApplicationReportResponse getApplicationReport(GetApplicationReportRequest request)在客户端,当用户需要提交或者杀死一个作业时,直接使用封装好的对外命令即可,比如MapReduce杀死一个作业直接使用:bin/hadoop job -kill job_XXX
该命令最终会调用forceKillApplication()函数。

2.   AdminService

YARN为管理员提供了一套独立的服务接口,以防止大量的普通用户请求使管理员发送的管理命令堵塞,管理员可通过这些接口管理集群,比如动态更新节点列表,更新ACL列表,更新队列信息等。

通过该服务,YARN为管理员提供了以下几个接口/命令,以管理/更新系统中的队列、节点、用户等信息:

refreshQueues:更新队列信息,调用ResourceScheduler. Reinitialize(),触发重新加载调度器专有的资源配置文件。

refreshNodes:更新exclude和include节点列表,这两个节点列表分别在配置选项yarn.resourcemanager.nodes.exclude-path和yarn.resourcemanager.nodes.include-path指定的文件中设置,其中,exlude节点不能够接入ResourceManager,而include节点则可以接入,默认值为空,表示任何节点均可接入。


refreshSuperUserGroupsConfiguration:更新代理用户和所在的host,为了安全起见,YARN要求上层应用(如Oozie,Hive等)通过一个代理用户接入集群。

refreshUserToGroupsMappings:更新用户与用户组之间的映射,默认情况下,采用Linux 用户和用户组的映射,需要注意的是,YARN会对该映射关系进行缓存,当管理员在操作系统层修改了该映射关系,应使用该命令刷新缓存。

refreshAdminAcls:更新YARN集群管理员列表。可通过配置选项yarn. admin.acl设置YARN的集群管理员,这些管理员可以执行以上所有操作,管理用户应用程序(比如杀死应用程序)。

refreshServiceAcls:更新服务访问控制列表,ResourceManager中包含三个服务,分别是:ClientRMService,ApplicationMasterService和ResourceTrackerService,分别对应访问者Client、ApplicationMaster和NodeManager,管理员可通过该命令刷新这三个服务的合法访问者列表。


3.   WebApp
为了更加友好地展示集群资源使用情况和应用程序运行状态等信息,YARN对外提供了一个Web 界面,这一部分有一个叫Hamlet的Web框架实现的,Hamlet是YARN仿照haml(http://haml.info/)开发的一个轻量级嵌入式Web框架。



Hadoop技术组
页: [1]
查看完整版本: YARN/MRv2 Resource Manager中用户交互相关模块详解