pig2 发表于 2016-5-8 19:50:06

2016年about云05月第02周经典帖子总结



Spark 数据ETL及部分代码示例
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18250
1.数据如何处理?
2.从数据中如何提取有用的特征?
3.有哪些衍生特征?



Spark性能优化:JVM参数调优
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18292
1. JVM分为哪几种?
2. 如何监测垃圾回收?
3. 如何优化executor内存比例
4. 更高级的垃圾回收调优有哪些?


15年编程生涯,资深架构师经验总结
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18295


Hbase split方式及过程介绍
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18281
1.在一个region中是否可以有一个或多个stroe?
2.什么是store?
3.一个store包含哪些内容?
4.Pre-splitting解决了什么问题?
5.Pre-splitting如何通过shell实现?
6.什么是自动splitting?
7.如何实现强制split?
8.region splits包含哪些内容?


从日志统计到大数据分析
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18242
1.怎样从零开始做大数据数据分析?2.怎样进行利用最新的技术进行系统的架构改造?3.怎样从零构建大数据平台?


Hadoop2.6.0中YARN底层状态机实现分析及代码示例
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18280
1.什么是Yarn中的事件?
2.Yarn 中的状态指的是什么?
3.什么是转换(过渡)?
4.什么是状态机?
5.如何用状态机构建?
6.什么是状态转移?




Spark函数扩展功能介绍
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18267
1.UDF对spark sql的作用是什么?
2.用Scala编写的UDF与普通的Scala函数唯一的区别在什么地方?
3.如何在spark中使用UDF?



大数据平台搭建利器 Ambari 之 Kerberos 集成之路
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18261

1、什么是Kerberos?
2、Kerberos的认证流程有哪些?
3、Ambari与Kerberos的关系是什么?
4、如何理解Ambari Kerberos Descriptor?

Dr.Elephant入门指南
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18251
1.什么是 Dr.Elephant?
2.为什么要使用Dr.Elephant?
3.核心功能点有哪些?


资源:

facebook为什么使用hbase
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18298


大数据分析:商业价值的路径
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18284


facebook实时数据分析【ppt英文版】
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18252


百度海量数据分析语言
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18283


淘宝网:HDFS元数据的独立服务和独立持久化存储
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18270


HDP2.2安装文档(推荐离线安装)
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18262



美国俄亥俄州立大学:一个开发处理大数据软件的分析模型【英文】
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18297


IBM李建:大数据系统与结构【英文】
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18271


让你的应用漫步云端-闫国旗
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18246


大规模跨地域分布式资源的云平台技术挑战与实践-金钧
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18245



问答:

spark 读取oracle,字段类型为Date的处理
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18282




xw2016 发表于 2016-5-8 20:44:55

果断收藏
页: [1]
查看完整版本: 2016年about云05月第02周经典帖子总结