1、组件选择
我应该选择哪些组件呢?Hive、Hbase、Spark、Zookeeper。
这些跟你的架构方案有关系,下面架构可参考
hadoop 2.6.5 + spark 1.6.3 + kafka 0.9.0.1 + flume 1.6.0 + hive 1.2.1 + scala 2.11.8【修改为2.10】
更多参考:
about云日志分析项目准备5:hadoop,spark,kafka,flume,hive等工具的版本选择
http://www.aboutyun.com/forum.php?mod=viewthread&tid=20587
2、硬盘分区方案
硬盘怎么分区会比较合适?分多少个区?以及大小怎么规划比较好?比如/、/data?
这个分区,参考普通的Linux即可
推荐参考
https://blog.csdn.net/explore_world/article/details/79081587
3、内存
内存的话,我打算1台32G(CM以及Mysql),其他4台每台16G。合理不?
这个可以暂时这么分配,主机master内存可以多一些。后期根据需要在调整
|