hyj 发表于 2013-12-11 16:11:43

Hadoop YARN配置参数剖析(2)—NodeManager相关配置参数

1.    NodeManager相关配置参数
(1) yarn.nodemanager.resource.memory-mb
参数解释:NodeManager总的可用物理内存。注意,该参数是不可修改的,一旦设置,整个运行过程中不可动态修改。另外,该参数的默认值是8192MB,即使你的机器内存不够8192MB,YARN也会按照这些内存来使用(傻不傻?),因此,这个值通过一定要配置。不过,Apache已经正在尝试将该参数做成可动态修改的。
默认值:8192
(2) yarn.nodemanager.vmem-pmem-ratio
参数解释:每使用1MB物理内存,最多可用的虚拟内存数。
默认值:2.1
(3) yarn.nodemanager.resource.cpu-vcores
参数解释:NodeManager总的可用虚拟CPU个数。
默认值:8
(4) yarn.nodemanager.local-dirs
参数解释:中间结果存放位置,类似于1.0中的mapred.local.dir。注意,这个参数通常会配置多个目录,已分摊磁盘IO负载。
默认值:${hadoop.tmp.dir}/nm-local-dir
(5) yarn.nodemanager.log-dirs
参数解释:日志存放地址(可配置多个目录)。
默认值:${yarn.log.dir}/userlogs
(6) yarn.nodemanager.log.retain-seconds
参数解释:NodeManager上日志最多存放时间(不启用日志聚集功能时有效)。
默认值:10800(3小时)
(7) yarn.nodemanager.aux-services
参数解释:NodeManager上运行的附属服务。需配置成mapreduce_shuffle,才可运行MapReduce程序
默认值:“”

pig2 发表于 2015-10-17 21:38:43

注意,配置这些参数前,应充分理解这几个参数的含义,以防止误配给集群带来的隐患。另外,这些参数均需要在yarn-site.xml中配置。  1.    权限相关配置参数  这里的权限由三部分组成,分别是:(1)管理员和普通用户如何区分 (2)服务级别的权限,比如哪些用户可以向集群提交ResourceManager提交应用程序,(3)队列级别的权限,比如哪些用户可以向队列A提交作业等。  管理员列表由参数yarn.admin.acl指定。  服务级别的权限是通过配置hadoop-policy.xml实现的,这个与Hadoop 1.0类似  队列级别的权限是由对应的资源调度器内部配置的,比如Fair Scheduler或者Capacity Scheduler等,具体阅读后面几节。  2.    日志聚集相关配置参数  日志聚集是YARN提供的日志中央化管理功能,它能将运行完成的Container/任务日志上传到HDFS上,从而减轻NodeManager负 载,且提供一个中央化存储和分析机制。默认情况下,Container/任务日志存在在各个NodeManager上,如果启用日志聚集功能需要额外的配 置。  (1) yarn.log-aggregation-enable  参数解释:是否启用日志聚集功能。  默认值:false  (2) yarn.log-aggregation.retain-seconds  参数解释:在HDFS上聚集的日志最多保存多长时间。  默认值:-1  (3) yarn.log-aggregation.retain-check-interval-seconds  参数解释:多长时间检查一次日志,并将满足条件的删除,如果是0或者负数,则为上一个值的1/10。  默认值:-1  (4) yarn.nodemanager.remote-app-log-dir  参数解释:当应用程序运行结束后,日志被转移到的HDFS目录(启用日志聚集功能时有效)。  默认值:/tmp/logs  (5) yarn.log-aggregation.retain-seconds  参数解释:远程日志目录子目录名称(启用日志聚集功能时有效)。  默认值:日志将被转移到目录  ${yarn.nodemanager.remote-app-log-dir}/${user}/${thisParam}下
页: [1]
查看完整版本: Hadoop YARN配置参数剖析(2)—NodeManager相关配置参数