nickpro 发表于 2014-9-29 19:08 可以使用这个: 对Map/Reduce分区与分组的实例分析 也可以自己写个。 |
nickpro 发表于 2014-9-29 19:06 |
howtodown 发表于 2014-9-29 18:44 请问你那边有很详细的mapreduce的执行过程么? |
阿飞 发表于 2014-9-29 18:52 对于分组的好处,我可不可以这样理解呢:分组就是让数据在同一个reducer中输出来呢? |
上面根本看不出区别,上面图示可以解释为下面: 分区1: 1900 35 ----------- 1900 34 1900 34 分区一两个组 分区2: 1900 36 ----------- 1900 35 分区2两个组 |
你能想到这个问题很不错,其实你已经看到了问题所在,如果在有真实环境,相信你会理解的更好一些。 分组其实就是对数据的进一步细化。这样在排序后很容易找出最大值及最小值。 更详细,可以看看对Map/Reduce分区与分组的实例分析 |