Mapreduce 整个工作机制图
刚才发现一张讲解mapreduce整个工作机制图,跟大家分享一下,大家发表一下建议,对mapreduce工作机制有何看法,或者那里有不清楚。mapreduce每一个工作阶段,对我们在工作中处理某种业务都是有很大帮助的。旋风来袭 发表于 2014-6-3 11:27
很模糊,有高手可以整体解释一下这张图吗???
图中1:表示待处理数据,比如日志,比如单词计数
图中2:表示map阶段,对他们split,然后送到不同分区
图中3:表示reduce阶段,对这些数据整合处理。
图中4:表示二次mapreduce,这个是mapreduce的链式,详细可以看让你真正明白什么是MapReduce组合式,迭代式,链式
两个node之间的交互其实是个抽象概念,不要纠结于这,先是几个node各自执行map阶段;执行完后,reducer所在的node去向执行map的节点抓取数据,然后执行reduce阶段,也就是shuffle过程。 作为初学者,顶一下!!!! 哈哈哈哈哈哈哈哈哈
作为初学者,顶一下!!!! 顶起,,,,,,,,,,,,,,,,,,,,,, 没怎么看明白,求高手可以详细解说一下 还是有点不明白两台机之间是怎么协作的 很模糊,有高手可以整体解释一下这张图吗??? 非常感谢,{:soso_e179:}