Mapreduce 整个工作机制图

donovanchen · 发表于 2015-6-2 14:03:36

学习了学习了。

HadoopUser · 发表于 2015-6-3 23:19:28

谢谢分享，学习中！

1027420005 · 发表于 2015-6-26 12:37:34

两台机器是如何交互的？如果 1000 个节点呢？

Rekklesly · 发表于 2015-7-1 18:30:26

可以讲一下分区么。。HASH分区是不是会带带来倾斜问题。。

nextuser · 发表于 2015-7-1 18:31:47

Rekklesly 发表于 2015-7-1 18:30
可以讲一下分区么。。HASH分区是不是会带带来倾斜问题。。

HASH分区是普遍被使用，但是如果想更好的分区，则需要自己定制

Rekklesly · 发表于 2015-7-1 18:34:34

nextuser 发表于 2015-7-1 18:31
HASH分区是普遍被使用，但是如果想更好的分区，则需要自己定制

比如有4个cluster{k1,[v1,v2,v3,v4]},{k2,[v1,v2,v3,v4]},{k3,[v1,v2,v3,v4]},{k4,[v1,v2,v3,v4]}...
要分给两个reuducer 工作。。那么一定是。。k1和k3在一个reduce,k2和k4在一个reduce.是吧。。

nextuser · 发表于 2015-7-1 18:40:58

Rekklesly 发表于 2015-7-1 18:34
比如有4个cluster{k1,[v1,v2,v3,v4]},{k2,[v1,v2,v3,v4]},{k3,[v1,v2,v3,v4]},{k4,[v1,v2,v3,v4]}...
要 ...

这个由分区函数来决定我们可以自己写分区函数，但是一旦分区函数确定了。
至于这些数据是如何分区的，则是取决于分区函数，所以不能盲目的说谁和谁是一组的

Rekklesly · 发表于 2015-7-1 19:18:04

nextuser 发表于 2015-7-1 18:40
这个由分区函数来决定我们可以自己写分区函数，但是一旦分区函数确定了。
至于这些数据是如何分区的，则 ...

恩呢这个我明白。我的意思是说。。。如果用哈希分区。。那么就是上述的那种结果吧。。。

hery · 发表于 2015-7-2 16:38:58

两个node之间的箭头是表示在交互什么信息呢？

fdfdggg · 发表于 2015-7-7 10:59:16

正在看，谢谢

图文精华

Mapreduce 整个工作机制图

最佳新人

活跃会员

热心会员

推荐 /2