2016年about云10月第05周经典帖子总结

Spark实现LDA实例
http://www.aboutyun.com/thread-20130-1-1.html
1. LDA主题模型算法简介
2. Spark实现LDA的GraphX基础
3. PySparkml库中Clustering LDA简介
4. LDA求解的优化器模型
5. Spark实现LDA的步骤
6. 使用pySpark实现LDA
7. 使用scala的Spark实现LDA

乐视分享：为何将Storm数据存储到 HBase
http://www.aboutyun.com/thread-20122-1-1.html
1. HBase 实时指标存储与传统方案 (Redis/MySQL) 对比有什么优势？
2. HBase 在写入时需要注意哪些？
3. HBase 的 Client 的特点有哪些？
4. Redis/Mysql 存储方案存在哪些缺点？

Kafka源码分析--Kafka client是如何基于NIO构建自己的network层
http://www.aboutyun.com/thread-20109-1-1.html
1、如何理解Network层的分层架构？
2、Network层组件与NIO组件的映射关系是什么？
3、Kafka Selector、NetworkClient实现思路有哪些？
4、连接检测&自动重连机制有哪些？

基于spark用户协同过滤算法的实现
http://www.aboutyun.com/thread-20100-1-1.html

1、如何基于用户协同过滤的？

2、使用idea是如何打包的？

3、UserBase推荐算法主要做哪些工作？

4、如何运行jar？

5、运行jar时有哪些注意事项？

Kafka源码分析Producer的网络层——JAVA NIO封装

http://www.aboutyun.com/thread-20088-1-1.html

1.Java NIO有哪些组件?

2.Unix环境有哪几种网络IO模型?

3.Selector和epoll在事件的注册上面有哪些区别?

openstack基础之python的多线程并发库函数——eventlet

http://www.aboutyun.com/thread-20085-1-1.html