2016年about云10月第04周经典帖子总结
图数据分析在Spark生态系统的使用
http://www.aboutyun.com/forum.php?mod=viewthread&tid=20080
1、如何定义图数据?
2、图数据分析与传统数据的处理有哪些不同之处?
3、图数据分析是如何促进大数据和预测分析?
4、NoSQL图数据库、图数据查询、图数据分析和图数据可视化这四种图数据相关的概念吗?
5、在哪些受欢迎的用例数据处理中,图数据处理是更好解决的方案?
6、Spark GraphX程序库实现中还有哪些缺失特性?
基于 Spark 如何构建一个文本情感分析系统
http://www.aboutyun.com/forum.php?mod=viewthread&tid=20067
1. 什么是文本情感分析?2. 为什么要采用Spark?3. 基于 Spark 如何构建文本情感分析系统?4. 如何文本分类正确率?
Hbase架构及设计实践
http://www.aboutyun.com/forum.php?mod=viewthread&tid=20060
1. NOSQL是如何产生的以及Hbase 在NOSQL中的地位如何?
2. Hbase框架是如何架构出来的 ?
3. Hbase 是如何检索一条数据以及检索时间复杂度是多少?
4. 如何设计 Hbase 数据库?
5. 还有哪些HBase调优小技巧?
网易云对象存储方案和应用场景介绍
http://www.aboutyun.com/forum.php?mod=viewthread&tid=20052
1、对象存储应用场景有哪些?
2、网易对象存储核心是什么?
3、DFS分布式文件系统哪些特性?
4、网易NOS系统架构提供哪些服务?
ElasticSearchJava API 之 索引管理【 版本2.4.1】
http://www.aboutyun.com/forum.php?mod=viewthread&tid=20042
1.ElasticSearch如何实现管理索引的?
2.IndicesAdminClient定义了几种prepareXXX()方法作为创建请求的入口点?
3.类型存在API的作用是什么?
4.如何创建复杂索引?
5.如何关闭打开索引?
6.如何创建索引的别名?
rpm安装CDH方法介绍:以CDH-5.3.2为例
http://www.aboutyun.com/forum.php?mod=viewthread&tid=20037
1.什么是cloudera manager?2.Hadoop的适用场景与不适用场景?3.怎样通过cloudera manager安装Hadoop?
资源:
深度学习【英文】
http://www.aboutyun.com/forum.php?mod=viewthread&tid=20064
中国医药电商大数据分析报告
http://www.aboutyun.com/forum.php?mod=viewthread&tid=20061
Scala编程指南第三版(2016)【英文】
http://www.aboutyun.com/forum.php?mod=viewthread&tid=20054
Sqoop开发者指南
http://www.aboutyun.com/forum.php?mod=viewthread&tid=20043
学习Ceph【英文版】
http://www.aboutyun.com/forum.php?mod=viewthread&tid=20038
问答:
hive 查看数据是不是连续重复的数据
http://www.aboutyun.com/forum.php?mod=viewthread&tid=20068
如何用spark某些字段的回车去除
http://www.aboutyun.com/forum.php?mod=viewthread&tid=20056
sqoop执行导入导出不执行mapreduce
http://www.aboutyun.com/forum.php?mod=viewthread&tid=20044
页:
[1]