【微信分享】梁堰波:主流SQL on Hadoop框架选择 http://www.aboutyun.com/thread-14468-1-1.html
1.Hive on Tez 与 Hive on Spark的优劣势有哪些?
2.Spark SQL有哪些优劣势?
3.Impala有哪些优劣势?
4.SQL on Hadoop解决方案选择的依据是什么?
5.impala最大的规模多少?性能如何?
6.apache phoenix进入cloudera lab能说明什么吗?
7.刚你说到Spark做ETL的痛点,可否详细说说,除下资源预测,还有哪些?
8.根据应用场景不同,sql on hadoop架构还是混合模型的,就是多重组件同时存在?
Ambari——大数据平台的搭建利器之进阶篇 http://www.aboutyun.com/thread-14466-1-1.html
1.Ambari现在处于一个什么样的状态?
2.利用Ambari如何扩展集群?
3.Ambari有哪些自定义命令?
4.Ambari 中 Service 之间是什么样的依赖关系?
5.什么是Ambari的 维护模式?
6.应用:如何快速搭建 Spark on YARN 的集群?