About云-梭伦科技»专题 › 技术学习(版主发帖区) › 大数据学习 › Spark › Apache Spark新手入门攻略【推荐】

Apache Spark新手入门攻略【推荐】

查看数: 23928 | 评论数: 6 | 收藏 7

关灯 | 提示：支持键盘翻页<-左右->

帖子模式

poppowerlb2

发布时间: 2015-7-14 15:32

正文摘要:

问题导读： 1、为什么要使用Apache Spark？ 2、Spark如何工作？ 3、如何安装Spark？ 4、什么是弹性分布式数据集RDD？【编者按】时至今日，Spark已成为大数据领域最火的一个开源项目，具备高性能、易于 ...

那年夏天110 发表于 2016-1-14 18:01:38

弹性分布式数据集（RDD，从Spark 1.3版本开始已被DataFrame替代）
介绍的挺详细，但这句话有问题吧。 spark 1.3 以后RDD 怎么会被DataFrame 替代呢？这两个根本就是不同的概念。 1.3以后引入了DataFrame 更方便的处理各种数据源了，并能能把数据映射成一个table 来用sql 语法处理处理。但底层执行还是用的RDD算子血缘迭代运算。 RDD 是spark 计算框架的最小算子是它灵魂核心，两者完全不同，没有了RDD 还能叫Spark 吗？

rocky2015 发表于 2015-7-16 09:45:32