HBase数据模型特性及表设计思路
http://www.aboutyun.com/forum.php?mod=viewthread&tid=20485
1、如何理解HBase分布式nosql数据库?
2、HBase数据模型如何理解?
3、HBase的表设计中需要注意哪些问题?
4、如何设计几种表结构?
5、HBase关键特性有哪些?
深入了解京东商品搜索引擎的架构
http://www.aboutyun.com/forum.php?mod=viewthread&tid=20466
1.京东商品搜索引擎的整体架构是怎样的? 2.京东搜索索引服务系统分为哪几个阶段? 3.京东基于内存和线程池的搜索服务遇到哪些瓶颈,怎样优化?
数据分析师知识结构体系整理
http://www.aboutyun.com/forum.php?mod=viewthread&tid=20498
1. 如何进行数据采集?
2. 采集到的数据如何存储?
3. 如何提取数据?
4. 如何进行数据挖掘?
5. 如何进行数据分析?
6. 数据展现形式是什么?
7. 数据的应用价值在哪?
使用spark实现max/min/mean/topN等经典mapreduce问题
http://www.aboutyun.com/forum.php?mod=viewthread&tid=20507
1. 使用spark如何实现最大值最小值问题?
2. 使用spark如何实现平均值问题?
3. 使用spark如何实现topN问题?
storm定时的三种方式及tick详解
http://www.aboutyun.com/forum.php?mod=viewthread&tid=20502
1.tick是什么功能?
2.如何指定某个bolt每隔一段时间做一些操作?
3.如何实现Topology中的每个bolt都每隔一段时间做一些操作?
Hadoop-Impala让分区最优化的方法
http://www.aboutyun.com/forum.php?mod=viewthread&tid=20474
1、什么时候使用分区表?
2、在Impala的SQL语法,分区影响哪些语句?
3、静态和动态分区子句什么区别?
4、分区的子目录是什么权限?
5、什么是分区精简?
6、如何检查分区修剪对于查询的有效性?
7、检查是否需要对查询进行分区修剪?
8、什么SQL构造分区修剪工作?
9、如何动态分区修剪?
10、如何选择分区键列
11、分区有哪些不同文件格式?
12、如何管理分区?
资源:
Elasticsearch之kibana中文指南
http://www.aboutyun.com/forum.php?mod=viewthread&tid=20511
JAVA并发编程实践(电子工业出版社)
http://www.aboutyun.com/forum.php?mod=viewthread&tid=20499
Spark大数据中文分词统计Scala语言工程源码
http://www.aboutyun.com/forum.php?mod=viewthread&tid=20476
基于FlumeKafkaSpark-的分布式日志流处理系统的设计与实现
http://www.aboutyun.com/forum.php?mod=viewthread&tid=20487
Spark Summit East 2016 PPT【40文档下载】
http://www.aboutyun.com/forum.php?mod=viewthread&tid=20465
问答:
求救!!!HBASE报错!!!!
http://www.aboutyun.com/forum.php?mod=viewthread&tid=20491
|