2016年about云01月第03周经典帖子总结
总结2015之Spark篇:新生态系统的形成
http://www.aboutyun.com/thread-16974-1-1.html
1.为什么DataFrame比RDD在存储和计算上的效率更高?
2.Spark从API的角度看,可以分为哪两大类?
3.Spark支持的外部数据源有很多种,本文列举了哪些数据源?你知道哪些数据源?
4.spark在机器学习领域有哪些亮点?
2016年,数据、分析和机器学习趋势五大预测
http://www.aboutyun.com/thread-17006-1-1.html
1.你是如何预测大数据行业的?
2.本文是如何预测的?
3.你认为该如何根据行业来计划自己的2016?
献给初学者:谈谈如何学习Linux
http://www.aboutyun.com/thread-17037-1-1.html
1.linux有什么作用?为什么要学习linux?
2.linux在各领域的发展怎么样?
3.怎么样循序渐进学习linux?
使用 NoSQL 数据库提供云级别数据可伸缩性
http://www.aboutyun.com/thread-17019-1-1.html
1.Nosql数据库的设计原理是什么?
2.Hbase原理是什么样?
3.举例介绍MongoDB的运行原理怎么样?
HBase 数据导入功能实现方式解释
http://www.aboutyun.com/thread-17016-1-1.html
1.向hbase中导入数据分为几种方式?
2.Bulk load 怎么导入数据?
3.Sqoop怎么导入到Hbase数据库中?
对比Pig、Hive和SQL,浅看大数据工具之间的差异
http://www.aboutyun.com/thread-17005-1-1.html
1. 什么时候用Apache Pig?
2. 什么时候用Apache Hive?
3. 什么时候用SQL?
Apache HBase 2015年发展回顾与未来展望
http://www.aboutyun.com/thread-16984-1-1.html
1、HBase0.98 与 HBase1.0接口差异是什么?
2、HBase 与 HydraHBase 有何不同?
2016年大数据及其分析将影响深远
http://www.aboutyun.com/thread-16962-1-1.html
1.什么是实时大数据技术?2.2016年大数据及其分析将有哪些影响?3.实时大数据怎样打破传统商业模式?
Apache Spark 1.6 正式发布,做了哪些改变
http://www.aboutyun.com/thread-16973-1-1.html
1.spark1.6做了哪些改变?
2.性能提升做了哪些改进?
3.增加了哪些新的算法和功能?
资源:
R语言与金融大数据处理-视频与课件代码合集
http://www.aboutyun.com/thread-16993-1-1.html
Storm中文学习手册
http://www.aboutyun.com/thread-17007-1-1.html
机器学习与数据挖掘基础
http://www.aboutyun.com/thread-17042-1-1.html
数据挖掘十大算法及案例
http://www.aboutyun.com/thread-17041-1-1.html
Spark技术及应用
http://www.aboutyun.com/thread-17028-1-1.html
内存计算Spark
http://www.aboutyun.com/thread-17027-1-1.html
hadoop入门实战手册
http://www.aboutyun.com/thread-17008-1-1.html
数据分析指导
http://www.aboutyun.com/thread-16992-1-1.html
cloudera-quickstart安装使用总结
http://www.aboutyun.com/thread-16976-1-1.html
R导论【书籍】
http://www.aboutyun.com/thread-16975-1-1.html
问答:
想用scala程序操作spark时遇到了问题
http://www.aboutyun.com/thread-16980-1-1.html
页:
[1]