分享

读取hbase表t1,生成hfile,将hfile导入hbase表t2

ohano_javaee 发表于 2018-3-22 17:02:35 [显示全部楼层] 回帖奖励 阅读模式 关闭右栏 6 9391
有个需求:
读取hbase 表 t1 某列c1,生成hfile,将hfile导入新表t2.

我想用MapReduce遍历t1表,逐条生成hfile,这种方式是否可行,想法是否正确?

已有(6)人评论

跳转到指定楼层
hyj 发表于 2018-3-22 19:20:19
数据量多大,数据量小可以读取完直接插入。spark使用spark也可以完成。
回复

使用道具 举报

langke93 发表于 2018-3-22 20:58:26
mapreduce本身输出的就是hfile,不用逐条。那麻烦了。生成后在直接bulkload.

使用命令如下
参考下面文章:
MapReduce生成HFile文件,再使用BulkLoad导入HBase中(完全分布式运行)
http://www.aboutyun.com/forum.php?mod=viewthread&tid=10665


更多
hbase数据快速导入方案--bulkload
http://www.aboutyun.com/forum.php?mod=viewthread&tid=8418



回复

使用道具 举报

ohano_javaee 发表于 2018-3-23 10:31:46
hyj 发表于 2018-3-22 19:20
数据量多大,数据量小可以读取完直接插入。spark使用spark也可以完成。

数据量非常大,生产上的管理员要求用bulkload实现。
回复

使用道具 举报

ohano_javaee 发表于 2018-3-23 10:37:44
langke93 发表于 2018-3-22 20:58
mapreduce本身输出的就是hfile,不用逐条。那麻烦了。生成后在直接bulkload.

使用命令如下

这个帖子我看了,现在有个疑问,我 并不知道hbase表在hdfs的位置,这个怎么破?
回复

使用道具 举报

qcbb001 发表于 2018-3-23 11:09:06
本帖最后由 qcbb001 于 2018-3-23 11:11 编辑
ohano_javaee 发表于 2018-3-23 10:37
这个帖子我看了,现在有个疑问,我 并不知道hbase表在hdfs的位置,这个怎么破?

查看hbase的配置文件
hbase中 hbase-site.xml 包含如下配置:
[mw_shl_code=bash,true]<property>
<name>hbase.root.dir</name>
<value>hdfs://computerName:7001/hbase</value>
</property>[/mw_shl_code]
回复

使用道具 举报

ohano_javaee 发表于 2018-3-23 12:20:16
qcbb001 发表于 2018-3-23 11:09
查看hbase的配置文件
hbase中 hbase-site.xml 包含如下配置:
[mw_shl_code=bash,true]

谢谢指点, 找到了!!!
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

推荐上一条 /2 下一条