2016年about云09月第02周经典帖子总结

Spark之Stage详解【专题】
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19724
1.什么是spark stage？
2.stage如何划分？
3.Spark 多个Stage执行是串行执行的么？

ElasticSearch优化技巧总结
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19748
1. 如何优化集群节点的配置？
2. 机器内存为什么需要预留一半给Lucene用？
3. 给ES内存配置是不是越大越好呢？
4. Swapping为什么会是性能的瓶颈？

Spark MLlib之 KMeans聚类算法详解
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19745
1.什么是Spark MLlib ？
2.Spark MLlib 分为哪些类？
3.KMeans算法的基本思想是什么？
4.Spark Mllib KMeans源码包含哪些内容？

如何在Spark sql上扩展自己的插件？----spark开源项目spark-avro
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19741

JobControl设计原理及JobControl类深入剖析
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19740
1.什么是贝叶斯分类？
2.JobControl的设计原理是什么？
3.Job类是如何设计的？
4.JobControl类如何深入剖析？

Spark任务中Stage划分算法及Task任务本地性算法原理
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19729
1、Spark Job Stage划分算法有哪些？
2、Task最佳计算位置算法如何理解？
3、Task任务本地算法运用场景有哪些？

为什么程序员普遍都比较难沟通？该如何改变提高自己
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19725

资源：
Spark Scala入门手册
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19742

spark介绍及SPARKSQL应用
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19743

聚类算法---以K-means算法实例
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19752

Hadoop-MapReduce短作业执行性能优化
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19720

数据算法英文
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19750

写好spark jobs的技巧【英文】
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19733

Octopus（大章鱼）：基于R语言的跨平台大数据机器学习与数据分析系统-南京大学-黄宜华
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19732

提高spark写效率文档【英文】
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19721

问答：

spark查询不了hive的orc格式的表
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19723

关于hive2.1.0的动态分区，做insert的性能问题
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19722

图文精华

2016年about云09月第02周经典帖子总结

活跃会员

热心会员

优秀版主

论坛元老

推荐 /2