Berkeley的论文《MapReduce Online》及翻译！

Berkeley的这篇论文是对Hadoop的改进，利用了管道技术，能够支持Online Aggregation 和 Continuous Queries，这是以前的Hadoop所不具备的（以前只支持批处理吧）。
最近正在看这篇论文，匆忙地翻译了一下，有很多错误，大家共同研究，共同进步！

ruanhero · 发表于 2013-10-26 15:10:38

顶，很好的改进，这个会提升性能，但不知道是否降低了容错冗灾性

shihailong123 · 发表于 2013-10-26 15:10:38

http://code.google.com/p/hop/
这篇论文的项目源代码在这里，但是我还没咋看过，大家一起研究下啊！

easthome001 · 发表于 2013-10-26 15:10:38

回复 2# eyjian
论文中说明了保持其容错的，但源代码还没看呢，大家一起交流一下啊！

leo_1989 · 发表于 2013-10-26 15:10:38

有时间研究一下

kaif22 · 发表于 2013-10-26 15:10:38

辛苦了……感谢翻译

langke93 · 发表于 2013-10-26 15:10:38

这个改进很好，貌似他的容错的话还是和保留了以前的MR那种将中间数据存本地的方法，只是粗略的看了下，呵呵，大家一起交流交流

top_gloria · 发表于 2013-10-26 15:10:38

这个改进很好，貌似他的容错的话还是和保留了以前的MR那种将中间数据存本地的方法，只是粗略的看了下，呵呵 ...
cztlcc 发表于 2010-5-12 09:03

数据保存在本地有助于提高容错能力，如果将数据存储到DFS上，容错能力更强，但性能代价会偏高，所以折中放在本地是比较好的，程序结构上也会简单些。如果将数据直接PUSH到下一节点，性能可能会高一些，但变复杂了，而且限定死了数据的分发策略，因为这个要求高手下一阶段工作之前，分布策略就已经确定，不能运用动态的分发策略。

lijian123841314 · 发表于 2013-10-26 15:10:38

谢谢诶，这个改进很不错

yuanqingyu0123 · 发表于 2013-10-26 15:10:38

那么好啊，下下来瞧瞧，谢谢共享啊

图文精华

Berkeley的论文《MapReduce Online》及翻译！

已有(17)人评论

最佳新人

活跃会员

热心会员

推广达人

推荐 /2