分享

Spark学习总结---入门

 
xuanxufeng 2017-1-2 20:37:28 发表于 文档 [显示全部楼层] 回帖奖励 阅读模式 关闭右栏 285 92134


描述
ppt
61页


简介

Spark是一个高效的分布式计算系统,发源于美国加州大学伯克利分校AMPLab的集群计算平台。Spark立足于内存计算,相比Hadoop MapReduce,Spark在性能上要高100倍,而且Spark提供了比Hadoop更上层的API,同样的算法在Spark中实现往往只有Hadoop的1/10或者1/100的长度。

Spark基于map reduce 算法模式实现的分布式计算,拥有Hadoop MapReduce所具有的优点;但不同于Hadoop MapReduce的是Job中间输出和结果可以保存在内存中,从而不再需要读写HDFS

目前Spark在全球已有广泛的应用,其中包括阿里巴巴、Cloudera、Databricks、IBM、Intel、雅虎等。

Spark自2013年6月进入Apache的孵化器以来,已经有来自25个组织的120多位开发者参与贡献。



链接:http://pan.baidu.com/s/1hrTOiv6 密码:
游客,如果您要查看本帖隐藏内容请回复






已有(285)人评论

跳转到指定楼层
wu_zhjian 发表于 2017-1-3 08:51:08
谢谢,正需要这个
回复

使用道具 举报

NIITYZU 发表于 2017-1-3 09:05:46
谢谢楼主分享
回复

使用道具 举报

18236598985 发表于 2017-1-3 09:06:56
谢谢楼主分享
回复

使用道具 举报

庐州令狐冲 发表于 2017-1-3 09:10:44
谢谢楼主分享!
回复

使用道具 举报

a_zhen 发表于 2017-1-3 09:14:02

谢谢楼主分享!
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

推荐上一条 /2 下一条