分享

2016年about云09月第02周经典帖子总结

pig2 发表于 2016-9-11 16:38:38 [显示全部楼层] 回帖奖励 阅读模式 关闭右栏 0 4873


Spark之Stage详解【专题】
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19724
1.什么是spark stage?
2.stage如何划分?
3.Spark 多个Stage执行是串行执行的么?




ElasticSearch优化技巧总结
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19748
1. 如何优化集群节点的配置?
2. 机器内存为什么需要预留一半给Lucene用?
3. 给ES内存配置是不是越大越好呢?

4. Swapping为什么会是性能的瓶颈?


Spark MLlib之 KMeans聚类算法详解
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19745
1.什么是Spark MLlib ?
2.Spark MLlib 分为哪些类?
3.KMeans算法的基本思想是什么?
4.Spark Mllib KMeans源码包含哪些内容?



如何在Spark sql上扩展自己的插件?----spark开源项目spark-avro
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19741


JobControl设计原理及JobControl类深入剖析
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19740
1.什么是贝叶斯分类?
2.JobControl的设计原理是什么?
3.Job类是如何设计的?
4.JobControl类如何深入剖析?


Spark任务中Stage划分算法及Task任务本地性算法原理
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19729
1、Spark Job Stage划分算法有哪些?
2、Task最佳计算位置算法如何理解?
3、Task任务本地算法运用场景有哪些?



为什么程序员普遍都比较难沟通?该如何改变提高自己
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19725



资源:
Spark Scala入门手册
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19742



spark介绍及SPARKSQL应用
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19743



聚类算法---以K-means算法实例
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19752


Hadoop-MapReduce短作业执行性能优化
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19720



数据 算法 英文
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19750


写好spark jobs的技巧【英文】
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19733


Octopus(大章鱼):基于R语言的跨平台大数据机器学习与数据分析系统-南京大学-黄宜华
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19732


提高spark写效率文档【英文】
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19721



问答:

spark查询不了hive的orc格式的表
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19723


关于hive2.1.0的动态分区,做insert的性能问题
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19722










没找到任何评论,期待你打破沉寂

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

推荐上一条 /2 下一条