分享

让你真正明白什么是hive

 
pig2 2014-4-16 17:46:19 发表于 推荐型 [显示全部楼层] 回帖奖励 阅读模式 关闭右栏 69 132611
yanzhihua88 发表于 2015-11-4 15:53:14
能不能描述下hadoop+hbase+hive的使用场景,相互间怎么配合工作的
回复

使用道具 举报

arsenduan 发表于 2015-11-4 15:56:14
yanzhihua88 发表于 2015-11-4 15:53
能不能描述下hadoop+hbase+hive的使用场景,相互间怎么配合工作的

hive为什么与hbase整合
http://www.aboutyun.com/thread-7317-1-1.html



回复

使用道具 举报

为梦狂野 发表于 2016-1-5 16:22:10
pig2 发表于 2014-4-16 18:05
同时补充一下hive与hbase的联系与区别:
共同点:
1.hbase与hive都是架构在hadoop之上的。都是用hadoop作 ...

博主,我发现你写的特别好,偶像呀,我一定向你多多学习。凯凯
回复

使用道具 举报

为梦狂野 发表于 2016-1-5 16:57:16
顶博主,博主说的真心不错,将hive比喻为数据仓库软件很好。
数据仓库就是
    面向主题的、集成的、相对稳定的、随时间不断变化(不同时间)的数据集合,用以支持经营管理中的决策制定过程。数据仓库中的数据面向主题,与传统数据库面向应用相对应。
1、数据仓库的主题是一个在较高层次上将数据归类的标准,每一个主题对应一个宏观的分析领域:
2、数据仓库的集成特性是指在数据进入数据仓库之前,必须经过数据加工和集成,这是建立数据仓库的关键步骤。首先要统一原始数据中的矛盾之处,还要将原始数据结构做一个从面向应用向面向主题的转变;
3、数据仓库的稳定性是指数据仓库反映的是历史数据(不可更改),而不是日常事务处理产生的数据,数据经加工和集成进入数据仓库后是极少或根本不修改的;
4、数据仓库是不同时间的数据集合,它要求数据仓库中的数据保存时限能满足进行决策分析的需要,而且数据仓库中的数据都要标明该数据的历史时期。

==>hive数据仓库就是管理一些经过加工处理后数据,且不被修改的历史数据,以及随时间变化的历史数据而且稳定。
刚好hive全满足这些特性,待我举例说明:
如:1、一些经过加工处理后数据--》hive的数据大部分是被加工的,不是ods(原始数据)。
       2、且不被修改的历史数据 --》hive的语法中没有update语法,只有插入和重写。
      3、随时间变化的历史数据 --》hive使用了分区patition
      4、稳定 --》数据当然稳定,因为hive本身不存储数据,数据存放于hadoop分布式框架上的HDFS上面,而HDFS非常稳定,会将数据存放多份。
若觉得我说的有道理,希望看到的好友也点个赞,给点意见。。。
回复

使用道具 举报

xuliang123789 发表于 2016-2-12 10:39:02
学习了,楼主,赞~~
回复

使用道具 举报

liuzhixin137 发表于 2016-4-18 10:49:31
赞,大神谢谢分享。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

推荐上一条 /2 下一条