- Hadoop|YARN
- 数据中台
- 数据湖
- 数据治理
- Flink
- Spark
- Cloudera系列
- Hadoop大数据架构
- Nosql
- Flume
- Sqoop
- ZooKeeper
- Hive|数据仓库
- Hbase
- Mapreduce
- Pig
- Kafka
- Storm
- Solr|Nutch|Lucene|ES
- Oozie
- spring hadoop
- 可视化
- Kylin
- Google Dataflow
- 阿里云ODPS介绍 (2篇回复)
- hadoop中什么是slots (5篇回复)
- Hadoop DistributedCache使用及原理 (0篇回复)
- 大数据开源列式存储引擎Parquet和ORC (0篇回复)
- Hadoop2.2.0源码分析(一)——Eclipse运行WordCount.java (0篇回复)
- 谈谈分布式计算的算子层及常见算子层对比(Trident、RDD等对比) (2篇回复)
- 微博广告推荐中使用Hadoop系统架构介绍及遇到的问题及解决方案 (6篇回复)
- Eclipse查看hadoop源代码出现Source not found,是因为没有添加.zip (6篇回复)
- 图片服务架构演进及云存储的优势 (1篇回复)
- 总结内容分发平台个性化推荐系统 (5篇回复)
- Ambari——大数据平台的搭建利器 (4篇回复)
- HDFS追本溯源:租约,读写过程的容错处理及NN的主要数据结构 (1篇回复)
- hive实战经验:遇到问题总结 (2篇回复)
- about云hadoop源码分析之mapredue的泛型类解析【hadoop2.7.1】 (2篇回复)
- R与python比较:帮助分析是R还是Python (1篇回复)
- Impala与Hive的相似之处,区别在什么地方? (2篇回复)
- Redis数据“丢失”问题 (2篇回复)
- Hadoop平台架构--存储篇 (3篇回复)
- Apache Crunch:简化编写MapReduce Pipeline程序 (1篇回复)
- 推荐系统入门 (2篇回复)
- 美团推荐算法实践 (5篇回复)
- 大数据工作流全面比较:Airflow、Azkaban、Conductor、Oozie (3篇回复)
- 将hive的元数据存到Oracle里各位高手总结 (4篇回复)
- 开源大数据查询分析引擎现状 (1篇回复)
- Redis如何通过Spring Session实现分布式Session共享 (1篇回复)
- 大数据术语入门整理一 (5篇回复)
- kettle实现从mongo增量到Postgresql (1篇回复)
- 如何编写运行带参数输入输出路径hadoop程序 (0篇回复)
- hadoop,CDH如何实现 HDFS的Block数据balancer重分布 (2篇回复)
- 后Hadoop时代的大数据架构 (9篇回复)