分享

spark快速数据处理

 
yuwenge 2015-5-14 01:35:26 发表于 书籍 [显示全部楼层] 只看大图 回帖奖励 阅读模式 关闭右栏 138 97861


1.jpg

译者序
作者简介
前言
第1章 安装Spark以及构建Spark集群
 1.1 单机运行Spark
 1.2 在EC2上运行Spark
 1.3 在ElasticMapReduce上部署Spark
 1.4 用Chef(opscode)部署Spark
 1.5 在Mesos上部署Spark
 1.6 在Yarn上部署Spark
 1.7 通过SSH部署集群
 1.8 链接和参考
 1.9 小结
第2章 Sparkshell的使用
 2.1 加载一个简单的text文件
 2.2 用Sparkshell运行逻辑回归
 2.3 交互式地从S3加载数据
 2.4 小结
第3章 构建并运行Spark应用
 3.1 用sbt构建Spark作业
 3.2 用Maven构建Spark作业
 3.3 用其他工具构建Spark作业
 3.4 小结
第4章 创建SparkContext
 4.1 Scala
 4.2 Java
 4.3 Java和Scala共享的API
 4.4 Python
 4.5 链接和参考
 4.6 小结
第5章 加载与保存数据
 5.1 RDD
 5.2 加载数据到RDD中
 5.3 保存数据
 5.4 连接和参考
 5.5 小结
第6章 操作RDD
 6.1 用Scala和Java操作RDD
 6.2 用Python操作RDD
 6.3 链接和参考
 6.4 小结
第7章 Shark-Hive和Spark的综合运用
 7.1 为什么用HiveShark
 7.2 安装Shark
 7.3 运行Shark
 7.4 加载数据
 7.5 在Spark程序中运行HiveQL查询
 7.6 链接和参考
 7.7 小结
第8章 测试
 8.1 用Java和Scala测试
 8.2 用Python测试
 8.3 链接和参考
 8.4 小结
第9章 技巧和窍门
 9.1 日志位置
 9.2 并发限制
 9.3 内存使用与垃圾回收
 9.4 序列化
 9.5 IDE集成环境
 9.6 Spark与其他语言
 9.7 安全提示
 9.8 邮件列表
 9.9 链接和参考
 9.10 小结


链接:http://pan.baidu.com/s/1mggOUQ8 密码:
游客,如果您要查看本帖隐藏内容请回复



已有(138)人评论

跳转到指定楼层
hbu126 发表于 2015-5-14 07:30:27
好资源,多谢分享
回复

使用道具 举报

努力奔跑 发表于 2015-5-14 08:14:23
非常谢谢分享
回复

使用道具 举报

zhangfuhuo 发表于 2015-5-14 08:16:46
回复

使用道具 举报

haorengoodman 发表于 2015-5-14 08:39:34
谢谢楼主,楼主好人

回复

使用道具 举报

zhangshuai 发表于 2015-5-14 09:02:33
分享 看下值不值得!
回复

使用道具 举报

hufan2005 发表于 2015-5-14 09:05:18
回复

使用道具 举报

sxyqhyt 发表于 2015-5-14 09:05:39
谢谢分享         
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

推荐上一条 /2 下一条