用户组:游客
使用道具 举报
arsenduan 发表于 2015-4-7 07:23 合并多个小文件作为查询结果:如果查询结果包括很多的小文件,hive可以合并这些小文件为大文件避免HDFS元数 ...
JME 发表于 2015-4-7 09:33 那不是说spark-sql 基本就废了,因为 计算结果大量出现小文件.
bingyuac 发表于 2016-9-23 19:38 大神们,怎么解决呀?spark-sql每次生成200个文件
einhep 发表于 2016-9-23 20:10 hive不是可以结合spark的吗? 如果spark不行,可以尝试换用hive跑在spark上试试
bingyuac 发表于 2016-9-25 17:19 我用的就是spark-sql操作hive的表。但是每次spark-sql的执行结果都是200个文件(特别小的文件)
本版积分规则 发表回复 回帖后跳转到最后一页
积极上进,爱好学习
经常参与各类话题的讨论,发帖内容较有主见
经常帮助其他会员答疑
中级会员
8
主题
46
帖子
3
粉丝
查看 »