分享

怎么合并parquet小文件

ab0412 发表于 2016-5-4 18:51:31 [显示全部楼层] 回帖奖励 阅读模式 关闭右栏 2 24824
大家好,请教一个怎么合并 parquet小文件,现在跑个spark job 出来一堆小文件。怎么快速的合并.

已有(2)人评论

跳转到指定楼层
bioger_hit 发表于 2016-5-4 19:39:38
尝试下面方法
df.coalesce(1).write.parquetFile(...)
回复

使用道具 举报

ab0412 发表于 2016-5-5 10:05:35
这个我之前试过 ,效率不高啊,比较慢
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

推荐上一条 /2 下一条