Spark 实时计算整合案例
http://www.aboutyun.com/forum.php?mod=viewthread&tid=22849
1. 如果将 Storm 替换为 Spark 那么业务实现流程是什么?
2. 如何实现该业务逻辑?
国美深度学习打造精准推荐系统实践
http://www.aboutyun.com/forum.php?mod=viewthread&tid=22864
1.国美大数据中心的背景是什么?
2.国美个性化推荐系统的面面观?
3.未来的挑战是什么?
日志分析实战之清洗日志小实例1:使用spark&Scala分析Apache日志
http://www.aboutyun.com/forum.php?mod=viewthread&tid=22856
1.如何进入spark shell?
2.spark shell中如何加载外部文件?
3.spark中读取文件后做了哪些操作?
日志分析实战之清洗日志小实例2:导入日志清洗代码并打包
http://www.aboutyun.com/forum.php?mod=viewthread&tid=22862
1.通过什么菜单项可以导入源码?
2.打jar包需要哪些步骤?
3.如何找到jar生成路径?
日志分析实战之清洗日志小实例3:如何在spark shell中导入自定义包
http://www.aboutyun.com/forum.php?mod=viewthread&tid=22881
1.自定义包,本文放到哪个路径下面?
2.复制包之后,需要做哪些权限操作?
3.如何验证导入是否成功?
用Hadoop的FileSystem实现在已有目录下用一个文件保存Spark数据
http://www.aboutyun.com/forum.php?mod=viewthread&tid=22855
1.如何用Hadoop的FileSystem实现在已有目录下用一个文件保存Spark数据? 2.如何分块读取RDD数据并保存到hdfs? 3.如何避免数据量过大超过内存空间而失败?
Spark 高级分析:第二章第2,3节
http://www.aboutyun.com/forum.php?mod=viewthread&tid=22853
1.写一个Spark程序包括哪几点?
2.文中称之为“记录链接”的是什么?
3.记录链接难点在哪儿?
Kafka配置文件及相关配置项说明
http://www.aboutyun.com/forum.php?mod=viewthread&tid=22844
1.Kafka核心配置有哪三个?
2.Consumer配置核心配置有哪些?
3.Producer的配置有哪些?
资源:
数据仓库与数据挖掘(廖开际)第三章
http://www.aboutyun.com/forum.php?mod=viewthread&tid=22882
|