pig2 发表于 2018-8-22 10:44:48

大数据各个组件的用途

本帖最后由 pig2 于 2018-8-22 10:52 编辑

对于大数据组件,我们可能知道它的功能是什么,比如Hive可以用来sql查询,Hbase可以用来存储。但是从用途来讲,可能有所混淆,这里总结

高级分析工具:
1.Flume 2.Impala 3.Kafka 4.Spark



数据搜集和存储工具:
1.Hbase 2.cassandra 3.mongoDB 4.Spark Sql



ETL工具
1.Hive 2.pig 3.Sqoop


文件系统
1.hdfs


编程工具
1.MapReduce 2.Java 3.Python 4.Scala






是饭饭 发表于 2018-8-22 14:57:20

支持。。!

jiangzi 发表于 2018-8-22 19:54:01

大数据各个组件的用途~!
页: [1]
查看完整版本: 大数据各个组件的用途