现在我们准备做大数据平台分析,目前已经搭建了平台,主要装了Hadoop2.6.0,zookeeper,hive,hbase,如果有需要还会用storm或spark。
平台搭建好了,但是下一步该怎么做就不知道了,请大家给点意见或建议。我现在的问题:
1,数据模型的概念?怎么使用数据模型?
2,算法模型或分析模型的概念?怎么使用算法模型?
3,网上看到很多平台的架构,但是具体里面怎么落地的,就不知道了,能否根据自己的实际经验提点宝贵的建议,谢谢!
4,一般的从数据收集到数据分析出结果再到数据的存储,再到数据的展现都采用什么样的软件或工具?
忘各位不吝赐教!
|
|