分享

基于Cloudera Manager5配置HIVE压缩

yuwenge 发表于 2015-6-25 16:11:35 [显示全部楼层] 只看大图 回帖奖励 阅读模式 关闭右栏 0 13841

问题导读



1.基于HIVE命令行如何实现HIVE压缩?
2.基于xml文件的压缩需要做哪些修改?
3.Cloudera Manager5配置HIVE压缩如何配置?








基于Cloudera Manager5配置HIVE压缩,配置HIVE的压缩,实际就是配置MapReduce的压缩,包括运行结果及中间结果的压缩。

1、基于HIVE命令行的配置


[mw_shl_code=bash,true]set hive.enforce.bucketing=true;
set hive.exec.compress.output=true;
set mapred.output.compress=true;
set mapred.output.compression.codec=org.apache.hadoop.io.compress.GzipCodec;
set io.compression.codecs=org.apache.hadoop.io.compress.GzipCodec;[/mw_shl_code]

在hive的命令下行运行如上代码即可,这里用的是Gzip压缩。


2、基于xml文件的压缩配置

mapred-site.xml


[mw_shl_code=bash,true]<property>
  <name>mapred.output.compress</name>
  <value>true</value>
  <description>Should the job outputs be compressed?
  </description>
</property>
<property>
  <name>mapred.output.compression.codec</name>
  <value>org.apache.hadoop.io.compress.GzipCodec</value>
  <description>If the job outputs are compressed, how should they be compressed?
  </description>
</property>[/mw_shl_code]

hive-site.xml

[mw_shl_code=xml,true]<property>
  <name>hive.enforce.bucketing</name>
  <value>true</value>
</property>
<property>
  <name>hive.exec.compress.output</name>
  <value>true</value>
</property>
<property>
  <name>io.compression.codecs</name>
  <value>org.apache.hadoop.io.compress.GzipCodec</value>
</property>[/mw_shl_code]

3、基于Cloudera Manager5配置HIVE压缩
1) 基于yarn的MR配置


1.png






2) hive的配置




2.png


增加如下内容


[mw_shl_code=xml,true]<property>
  <name>hive.enforce.bucketing</name>
  <value>true</value>
</property>
<property>
  <name>hive.exec.compress.output</name>
  <value>true</value>
</property>
<property>
  <name>io.compression.codecs</name>
  <value>org.apache.hadoop.io.compress.GzipCodec</value>
</property>[/mw_shl_code]

配置完毕,MapReduce包括hive运行结果以GZip进行压缩。


[Author]: kwu

没找到任何评论,期待你打破沉寂

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

推荐上一条 /2 下一条