分享

有几点关于hadoop的hive数据仓库和hbase几点疑惑

hyj 2014-5-19 13:30:42 发表于 问题解答 [显示全部楼层] 回帖奖励 阅读模式 关闭右栏 0 9034
1.hive是数据仓库,表往hive里面存的时候,其实不是存表,hive并不知道我们存的是什么数据,到底什么是仓库,仓库的作用是什么??
回答:
Hive 的目标是做成数据仓库,所以它提供了SQL,提供了文件-表的映射关系,又由于Hive基于HDFS,所以不提供Update,因为HDFS本身就不支持。仓库和数据的本质区别是用途不一样,结构大部分一样。仓库是用来存储历史数据,数据库是用来存储在线数据,也就是实时数据,换句话说是可以增删改查的。
同样可以参考:
让你真正明白什么是hive


2.而hbase又是hadoop的数据库,是不是hbase就类似我们做javaWeb时,对应的oracle数据库的作用,存的是hadoop的数据???
回答:
可以这么理解,HBase 是NoSQL数据库-所以不要跟传统混淆并谈-NoSQL 提供的是另一种思路来满足高性能的需求,而这些是传统数据库的短板,与传统数据库的理念不一样。。

3.我们在存数据的时候,把数据存入hive仓库中,使用的命令一般是什么?而把数据存入hbase又是怎样操作的呢?
回答:
可以参考:Hbase shell 操作数据库常用命令
HBase Shell常用命令


4.HIVE不能直接往表中插入随机数据,是不是就是说我们不能单条往hive仓库中插入,只能load数据文件进仓库是吗?如果不用load,怎样把数据放入hive仓库呢?
回答:
hive书数据仓库,不会像数据库一样,它的重心是分析,所以支持load与覆盖。
可以参考:
hive支持sql大全(收藏版)


5.hive必须通过其他HIVE表倒入应该怎样解释呢?
回答:
这句话不对,不一定
可以参考:
hive内部表与外部表区别详细介绍


6.HIVE的数据表一般都是映射其他媒介的数据源,比如HDFS FILE、HBASE、MYSQL等 ,映射是什么意思呢?
是不是就是我们使用hive的数据语言,操作其他媒介的数据,那这种操作又是怎样实现的呢,怎样关联的呢,流程是什么?
回答:
映射就是结构对应-如文件每一行的第一个字段-映射到Hive表的第一个字段
类似Hibernate的语法解析。
Hive本身实现了一套语法结构也就是操作符。如扫描文件等,最终记本都会转换成MapReduce来运行




没找到任何评论,期待你打破沉寂

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

推荐上一条 /2 下一条