分享

hive load data 能够不动源数据吗?

linjikai8888 发表于 2015-7-7 14:58:10 [显示全部楼层] 回帖奖励 阅读模式 关闭右栏 4 23204
HIVE在做一些统计的时候,个人感觉还是不错的。

就是每次做load data的时候,总是会把数据移到hive定义的文件目录下。

我想的是源数据可不可以不动到,就相当于copy一份到hive定义的目录下。

我百度了一阵子,不知道是不是我百度的方法不对?竟然没找到~

已有(4)人评论

跳转到指定楼层
NEOGX 发表于 2015-7-7 15:38:08

这方面是有的,属于hive的外部表
楼主经常用的应该是内部表
这里相关资料
hive内部表与外部表区别详细介绍
回复

使用道具 举报

linjikai8888 发表于 2015-7-7 17:32:15
NEOGX 发表于 2015-7-7 15:38
这方面是有的,属于hive的外部表
楼主经常用的应该是内部表
这里相关资料

我是用的外部表~

hive会把load path  ……  的文件给移到 hive的目录下。
而不是copy的动作。

我希望可以有两份,不要动到原来的那份,因为我原来的那份是线上跑的追加文件 。

这样虽然没有什么影响,但心里还是很不爽。

回复

使用道具 举报

leo_1989 发表于 2015-7-7 19:24:27
linjikai8888 发表于 2015-7-7 17:32
我是用的外部表~

hive会把load path  ……  的文件给移到 hive的目录下。

目前还没有发现hive有这种机制
回复

使用道具 举报

wubaozhou 发表于 2015-7-7 22:18:05
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

推荐上一条 /2 下一条