本帖最后由 helianthus 于 2015-11-29 21:43 编辑
SparkSQL+SparkCore任务解析 1.在我们调用spark API时,背后发生了什么呢?
2.RDD.id是在初始化时生成的,id代表什么?
3.rdd.collect()调用的效果是什么?
spark core源码分析 1.spark.shuffle.consolidateFiles是为了解决什么问题? 2.spark.shuffle.spill的作用是什么? 3.spark.local.dir默认是什么?
openstack中region、az、host aggregate、cell 概念 1.region的定义是什么? 2.cell的定义是什么? 3.az和host aggregate的定义是什么?
OpenStack 中的 NovaCell 1.Nova Cell 模块是什么? 2.Nova Cell 模块有哪些主要组件? 3.怎样搭建与配置Nova Cell 环境?
CDH离线安装
对象存储(Object-based Storage)概述 1.存储概念对比
2.对象存储文件系统的关键技术
Vmware SDK的使用(原创) 1.Vmware SDK简介
2.资料准备
3.Eclipse创建项目
4.Demo-clone虚拟机
资源:
数据分析与R语言视频教程+课件
R语言与统计分析
问答:
spark如何内存设置
hive排序中文解决
|