About云»专题 › 技术学习(版主发帖区) › 大数据学习 › Mapreduce › MapReduce 编程模型概述

MapReduce 编程模型概述

查看数: 81647 | 评论数: 26 | 收藏 21

关灯 | 提示：支持键盘翻页<-左右->

帖子模式

howtodown

发布时间: 2014-3-2 21:11

正文摘要:

本帖最后由 howtodown 于 2014-3-2 21:29 编辑已经讲了一篇mapreduce编程模型，这里从另外一角度，感觉也不错。引用一个经典的图片来说明问题. 可以带着下面问题来阅读： mapreduce的过程都包含什么操作？ ma ...

pig2 发表于 2014-3-2 21:32:23

个人认为，仅供参考：

mapreduce的过程都包含什么操作？
排序复制合并

map处理完后，tasktracer会完成什么任务？
tasktracker会把数据进行复制和排序, 然后通过输出的key 和value进行 partition的划分, 并把partition相同的map输出, 合并为相同的reduce的输入.

ruducer的作用是什么？
把数据输出, 每个相同的key, 一定在一个reduce中处理完, 每一个reduce至少对应一份输出

map中经过谁的处理之后，变为reduce输入？
通过shuffle之后, 变成reduce的输入, 这是相同的key对应的value被组合成了一个迭代器

yngwiewang 发表于 2017-10-26 07:01:33