Spark实现LDA实例
http://www.aboutyun.com/thread-20130-1-1.html
1. LDA主题模型算法简介
2. Spark实现LDA的GraphX基础
3. PySparkml库中Clustering LDA简介
4. LDA求解的优化器模型
5. Spark实现LDA的步骤
6. 使用pySpark实现LDA
7. 使用scala的Spark实现LDA
乐视分享:为何将Storm数据存储到 HBase
http://www.aboutyun.com/thread-20122-1-1.html
1. HBase 实时指标存储与传统方案 (Redis/MySQL) 对比有什么优势?
2. HBase 在写入时需要注意哪些?
3. HBase 的 Client 的特点有哪些?
4. Redis/Mysql 存储方案存在哪些缺点?
Kafka源码分析--Kafka client是如何基于NIO构建自己的network层
http://www.aboutyun.com/thread-20109-1-1.html
1、如何理解Network层的分层架构?
2、Network层组件与NIO组件的映射关系是什么?
3、Kafka Selector、NetworkClient实现思路有哪些?
4、连接检测&自动重连机制有哪些?
基于spark用户协同过滤算法的实现
http://www.aboutyun.com/thread-20100-1-1.html
1、如何基于用户协同过滤的? 2、使用idea是如何打包的? 3、UserBase推荐算法主要做哪些工作? 4、如何运行jar? 5、运行jar时有哪些注意事项?
Kafka源码分析Producer的网络层——JAVA NIO封装 1.Java NIO有哪些组件? 2.Unix环境有哪几种网络IO模型? 3.Selector和epoll在事件的注册上面有哪些区别?
openstack基础之python的多线程并发库函数——eventlet 1.什么是协程? 2. eventlet是做什么用的? 3.怎样通过eventlet实现一个爬虫?
资源:
学习spark-快速大数据分析
Storm源码分析书籍【适合入门推荐】
Sqoop之Oracle导数入Hive
神经网络与机器学习(原书第3版)[推荐]
hadoop安装CDH5
Sqoop中文手册
问答:
oozie与kettle的比较,大家怎么看?
Spark Streaming中读取本地文件,无法获取数据
CM初始化报log4j:ERROR Could not find value for key log4j.appender.A
|