分享

hive数据存储与元数据的疑惑

redliquid 发表于 2016-8-16 09:52:34 [显示全部楼层] 回帖奖励 阅读模式 关闭右栏 14 12878
在配置hive的时候,要配置连接derby或者mysql,这个作为元数据,这里有个疑问,这个元数据做为什么用的?
比如:我连接了一个mysql库testDB,但是我在hive里面建立一张表 create table test,实际上这个test是存在我的hdfs上的,和我的mysql没有联系,我往test里面导入数据也和mysql没有关系,那这个元数据起什么作用呢?

另外我发现通过hive往表中load数据,只是简单的把这个文件拷贝到这个表所在的目录下,并不像原始的rdbms一行一行的数据,比如:
create table test2(id int,name string) row format delimited fields terminated by ',';
LOAD DATA  INPATH 'hdfs://cluster1/data.txt' OVERWRITE INTO TABLE test2;
这时我发现我的/home/hadoop/hive/warehouse/test2下面多了一个data.txt的文件,并没有传统意义上的那种表,这样对吗?

已有(14)人评论

跳转到指定楼层
einhep 发表于 2016-8-16 11:55:29
元数据是最基本的数据,比如hadoop的namenode存储的是一些元数据,也就是editlogs及image,他们存储的是操作记录及映射关系等信息而hive中mysql也是扮演的同样的角色、
mysql中应该有表名等信息,楼主没有看到说明看错信息了。肯定是有的
回复

使用道具 举报

redliquid 发表于 2016-8-16 13:16:00
einhep 发表于 2016-8-16 11:55
元数据是最基本的数据,比如hadoop的namenode存储的是一些元数据,也就是editlogs及image,他们存储的是操 ...

谢谢你的回帖,下面是我做的测试
hive> create table testabc(id int,name string) row format delimited fields terminated by ',';
OK
Time taken: 3.383 seconds
hive> show tables
    > ;
OK
test
test1
test2
test_table
testabc
Time taken: 0.22 seconds, Fetched: 5 row(s)

mysql> use hive;
Reading table information for completion of table and column names
You can turn off this feature to get a quicker startup with -A

Database changed
mysql> show tables;
+---------------------------+
| Tables_in_hive            |
+---------------------------+
| AUX_TABLE                 |
| BUCKETING_COLS            |
| CDS                       |
| COLUMNS_V2                |
| COMPACTION_QUEUE          |
| COMPLETED_COMPACTIONS     |
| COMPLETED_TXN_COMPONENTS  |
| DATABASE_PARAMS           |
| DBS                       |
| DB_PRIVS                  |
| DELEGATION_TOKENS         |
| FUNCS                     |
| FUNC_RU                   |
| GLOBAL_PRIVS              |
| HIVE_LOCKS                |
| IDXS                      |
| INDEX_PARAMS              |
| KEY_CONSTRAINTS           |
| MASTER_KEYS               |
| NEXT_COMPACTION_QUEUE_ID  |
| NEXT_LOCK_ID              |
| NEXT_TXN_ID               |
| NOTIFICATION_LOG          |
| NOTIFICATION_SEQUENCE     |
| NUCLEUS_TABLES            |
| PARTITIONS                |
| PARTITION_EVENTS          |
| PARTITION_KEYS            |
| PARTITION_KEY_VALS        |
| PARTITION_PARAMS          |
| PART_COL_PRIVS            |
| PART_COL_STATS            |
| PART_PRIVS                |
| ROLES                     |
| ROLE_MAP                  |
| SDS                       |
| SD_PARAMS                 |
| SEQUENCE_TABLE            |
| SERDES                    |
| SERDE_PARAMS              |
| SKEWED_COL_NAMES          |
| SKEWED_COL_VALUE_LOC_MAP  |
| SKEWED_STRING_LIST        |
| SKEWED_STRING_LIST_VALUES |
| SKEWED_VALUES             |
| SORT_COLS                 |
| TABLE_PARAMS              |
| TAB_COL_STATS             |
| TBLS                      |
| TBL_COL_PRIVS             |
| TBL_PRIVS                 |
| TXNS                      |
| TXN_COMPONENTS            |
| TYPES                     |
| TYPE_FIELDS               |
| VERSION                   |
| WRITE_SET                 |
| hiveTest                  |
| tmp_series                |
+---------------------------+
59 rows in set (0.00 sec)
在mysql中并没有找到testabc这张表啊。

回复

使用道具 举报

xuanxufeng 发表于 2016-8-16 14:12:08
redliquid 发表于 2016-8-16 13:16
谢谢你的回帖,下面是我做的测试
hive> create table testabc(id int,name string) row format delimite ...

查看下里面表的数据,你会有新的发现
回复

使用道具 举报

redliquid 发表于 2016-8-16 14:19:26
xuanxufeng 发表于 2016-8-16 14:12
查看下里面表的数据,你会有新的发现

不好意思,没太明白你的意思,查看哪里面的表?
回复

使用道具 举报

xuanxufeng 发表于 2016-8-16 14:22:15

你的配置文件创建应该有链接的数据库,这个是自己创建的。
猜测应该是hiveTest
查看下hiveTest

回复

使用道具 举报

redliquid 发表于 2016-8-16 15:01:45
xuanxufeng 发表于 2016-8-16 14:22
你的配置文件创建应该有链接的数据库,这个是自己创建的。
猜测应该是hiveTest
查看下hiveTest

好像不大对啊,我建的表时testabc啊。
回复

使用道具 举报

einhep 发表于 2016-8-16 17:35:45
redliquid 发表于 2016-8-16 15:01
好像不大对啊,我建的表时testabc啊。

你的数据库连接串还有配置贴出来看下
回复

使用道具 举报

redliquid 发表于 2016-8-16 21:22:38
einhep 发表于 2016-8-16 17:35
你的数据库连接串还有配置贴出来看下

内容贴不上来,请看附件 hive-env.rar (43.61 KB, 下载次数: 1)
回复

使用道具 举报

12下一页
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

推荐上一条 /2 下一条