Apache Spark新手入门攻略【推荐】

查看数: 23928 | 评论数: 6 | 收藏 7
关灯 | 提示:支持键盘翻页<-左 右->
    组图打开中,请稍候......
发布时间: 2015-7-14 15:32

正文摘要:

问题导读: 1、为什么要使用Apache Spark? 2、Spark如何工作? 3、如何安装Spark? 4、什么是弹性分布式数据集RDD? 【编者按】时至今日,Spark已成为大数据领域最火的一个开源项目,具备高性能、易于 ...

回复

那年夏天110 发表于 2016-1-14 18:01:38
弹性分布式数据集(RDD,从Spark 1.3版本开始已被DataFrame替代)
介绍的挺详细,但这句话有问题吧。 spark 1.3 以后RDD 怎么会被DataFrame 替代呢?这两个根本就是不同的概念。 1.3以后引入了DataFrame 更方便的处理各种数据源了,并能能把数据映射成一个table 来用sql 语法处理处理。但底层执行还是用的RDD算子 血缘迭代运算。  RDD 是spark 计算框架的最小算子 是它灵魂 核心,两者完全不同,没有了RDD 还能叫Spark 吗?  
rocky2015 发表于 2015-7-16 09:45:32
很不错,谢谢楼主,学习了·
rocky2015 发表于 2015-7-15 15:47:24
很不错,
zbjbaggio 发表于 2015-7-15 09:27:15
收藏一下看看
wd_2007 发表于 2015-7-15 08:08:51
学习了。值得新手一看
小秦琼 发表于 2015-7-14 22:42:07
不错。适合新手。
关闭

推荐上一条 /2 下一条