分享

Berkeley的论文《MapReduce Online》及翻译!

ruanhero 发表于 2013-10-26 15:10:38 [显示全部楼层] 回帖奖励 阅读模式 关闭右栏 17 14301
Berkeley的这篇论文是对Hadoop的改进,利用了管道技术,能够支持Online Aggregation 和 Continuous Queries,这是以前的Hadoop所不具备的(以前只支持批处理吧)。
    最近正在看这篇论文,匆忙地翻译了一下,有很多错误,大家共同研究,共同进步!

已有(17)人评论

跳转到指定楼层
ruanhero 发表于 2013-10-26 15:10:38
顶,很好的改进,这个会提升性能,但不知道是否降低了容错冗灾性
回复

使用道具 举报

shihailong123 发表于 2013-10-26 15:10:38
http://code.google.com/p/hop/
这篇论文的项目源代码在这里,但是我还没咋看过,大家一起研究下啊!
回复

使用道具 举报

easthome001 发表于 2013-10-26 15:10:38
回复 2# eyjian
    论文中说明了保持其容错的,但源代码还没看呢,大家一起交流一下啊!
回复

使用道具 举报

leo_1989 发表于 2013-10-26 15:10:38
有时间研究一下
回复

使用道具 举报

kaif22 发表于 2013-10-26 15:10:38
辛苦了……感谢翻译
回复

使用道具 举报

langke93 发表于 2013-10-26 15:10:38
这个改进很好,貌似他的容错的话还是和保留了以前的MR那种将中间数据存本地的方法,只是粗略的看了下,呵呵,大家一起交流交流
回复

使用道具 举报

top_gloria 发表于 2013-10-26 15:10:38
这个改进很好,貌似他的容错的话还是和保留了以前的MR那种将中间数据存本地的方法,只是粗略的看了下,呵呵 ...
cztlcc 发表于 2010-5-12 09:03



数据保存在本地有助于提高容错能力,如果将数据存储到DFS上,容错能力更强,但性能代价会偏高,所以折中放在本地是比较好的,程序结构上也会简单些。如果将数据直接PUSH到下一节点,性能可能会高一些,但变复杂了,而且限定死了数据的分发策略,因为这个要求高手下一阶段工作之前,分布策略就已经确定,不能运用动态的分发策略。
回复

使用道具 举报

lijian123841314 发表于 2013-10-26 15:10:38
谢谢诶,这个改进很不错
回复

使用道具 举报

yuanqingyu0123 发表于 2013-10-26 15:10:38
那么好啊,下下来瞧瞧,谢谢共享啊
回复

使用道具 举报

12下一页
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

推荐上一条 /2 下一条