分享

hadoop中combine,partition和shuffle的疑问

绝尘H2 发表于 2016-3-8 08:58:08 [显示全部楼层] 回帖奖励 阅读模式 关闭右栏 4 8465
这是我理解的hadoop函数调用过程,但还是有点疑惑,比如:每个map函数输出都调用一个partition函数(图中为此方式)还是一个partition函数处理所有的map输出,如果图中的过程正确,那么shuffle函数调用发生在哪里?

已有(4)人评论

跳转到指定楼层
绝尘H2 发表于 2016-3-8 09:08:02
回复

使用道具 举报

atsky123 发表于 2016-3-8 10:09:28

楼主的图看不到,不过代码是分发到每个客户端来执行的。
而不是只有一份代码在跑。
比如map函数,也是多个客户端在跑,其它函数也是同理
回复

使用道具 举报

绝尘H2 发表于 2016-3-8 12:22:03

hadoop中combine,partition和shuffle的疑问

atsky123 发表于 2016-3-8 10:09
楼主的图看不到,不过代码是分发到每个客户端来执行的。
而不是只有一份代码在跑。
比如map函数,也是 ...

回复

使用道具 举报

s060403072 发表于 2016-3-8 12:31:20

这个也不是一两句能说明白的,下面一些资料,希望对楼主有帮助
hadoop中,combine、partition、shuffle作用分别是什么?
http://www.aboutyun.com/forum.php?mod=viewthread&tid=7104


Spark源码系列(六)Shuffle的过程解析
http://www.aboutyun.com/forum.php?mod=viewthread&tid=8375

Hadoop(6)MapReduce 性能调优:优化洗牌(shuffle)和排序阶段

http://www.aboutyun.com/forum.php?mod=viewthread&tid=15545







回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

推荐上一条 /2 下一条