个人建议,你也可以说出自己想法,咱们相互讨论。
hive每一个分区其实就是一个文件,对于hbase一个表一个文件夹,并且这个文件夹里的还有文件进行裂变。
在这个整合的过程中,
(1)可以通过下面的方式创建映射表:
- CREATE TABLE hbase_table_1(key int, value string) STORED BY 'org.apache.hadoop.hive.hbase.HBaseStorageHandler' WITH SERDEPROPERTIES ("hbase.columns.mapping" = ":key,cf1:val") TBLPROPERTIES ("hbase.table.name" = "xyz");
复制代码
(2)还有另外一种方式就是创建外部表
你可以先尝试第一种,如果他们支持分区的话,这个应该不是问题。
|