怎样学习大数据

对大数据有很大的学习兴趣，想知道如何有效的去学习，有没有坛友提供下参考的学习阶段及其知识点、书籍、学习技术等！

tntzbzc · 发表于 2017-8-18 12:05:53

大数据内容也很多，看你怎么学了：
可以按照下面顺序

零基础学习hadoop到上手工作线路指导（初级篇）
http://www.aboutyun.com/forum.php?mod=viewthread&tid=6780

零基础学习hadoop到上手工作线路指导（编程篇）
http://www.aboutyun.com/forum.php?mod=viewthread&tid=8329

零基础学习hadoop到上手工作线路指导初级篇：hive及mapreduce
http://www.aboutyun.com/forum.php?mod=viewthread&tid=7567

hive入门学习线路指导
http://www.aboutyun.com/forum.php?mod=viewthread&tid=7598

spark零基础学习线路指导
http://www.aboutyun.com/forum.php?mod=viewthread&tid=21959

零基础学习hadoop到上手工作线路指导（实战篇）
http://www.aboutyun.com/forum.php?mod=viewthread&tid=22431

acherat · 发表于 2017-8-18 12:07:56

tntzbzc 发表于 2017-8-18 12:05
大数据内容也很多，看你怎么学了：
可以按照下面顺序

hadoop-->hive-->spark

已收到~

tntzbzc · 发表于 2017-8-18 12:30:25

acherat 发表于 2017-8-18 12:07
hadoop-->hive-->spark

已收到~

内容挺多的，更多可以自己搜下。
零基础学习hadoop生态系统到上手工作线路指导初级篇（HBASE篇）
http://www.aboutyun.com/forum.php?mod=viewthread&tid=8391

acherat · 发表于 2017-8-18 12:32:35

内容太多了，差点迷失，需要搞清楚下系统的学习阶段，或者说是学习的前后顺序！

yunge2016 · 发表于 2017-8-18 16:06:41

看有没有Java基础了，有基础最好。没有也关系不大。可以先熟悉一下Java，这样学起来容易。最好是javaSE学会了，在学hadoop.生态圈里的各种组件，比如yarn,mapreduce,hdfs,然后最好学之前简单熟悉一下linux系统的基本操作。这样学起来更容易上手，因为Hadoop集群环境都是在linux系统上的。hadoop学会就是学hive 离线处理数据的一个框架，架设在hadoop上的数据仓库。在学nosql的数据库hbase. 列式存储，支持大容量高并发读写数据。输出的结果一般写入到hbase里，也可以写到mysql里。学完后就可以进入spark学习了。学习基本的rdd算子，经典的wordcount程序。融会贯通后就学它的架构和原理。比如rdd的各种函数。学大数据最重要的就是搞懂原理，就是各个组件的关系，任务提交流程。执行流程等。原理懂了代码自然就能写出了。学spark最好熟悉一下scala语言，因为源码就是scala实现的。差不多就这样，再模拟做几个项目就差不多。不要看太多书，多动手操作。

acherat · 发表于 2017-8-18 18:13:13

yunge2016 发表于 2017-8-18 16:06
看有没有Java基础了，有基础最好。没有也关系不大。可以先熟悉一下Java，这样学起来容易。最好是javaSE学会 ...

好的，JAVA基础有，关系数据库和非关系型数据库的也使用过，linux用的不多，简单的命令会些。思路大致有了，我整理整理，开始去实践。

图文精华

怎样学习大数据

已有(6)人评论

推荐 /2