Spark从开源到火爆,从 0.9.x到1.2.0
http://www.aboutyun.com/thread-11886-1-1.html
机器学习中的数据清洗与特征处理综述
http://www.aboutyun.com/thread-11885-1-1.html
1.特征获取方案有哪两种?
2.如何处理特征和标注数据?
流式大数据处理的三种框架:Storm,Spark和Samza
http://www.aboutyun.com/thread-11884-1-1.html
1.Apache Storm由哪两种角色? 2.Spark Streaming与Storm的区别在什么地方? 3.Apache Samza是如何处理数据流的? 4.他们的共同之处是什么?
Kafka入门
http://www.aboutyun.com/thread-11888-1-1.html
1.如何安装配置Kafka?
2.如何创建topic?
问答:
cloudera manager 内存调拨过度验证阈值 ?
http://www.aboutyun.com/thread-11880-1-1.html
【求助】通过CM安装CDH失败,提示无法进行身份认证
http://www.aboutyun.com/thread-11881-1-1.html
openstack什么到底什么是租户
http://www.aboutyun.com/thread-11882-1-1.html
请教,hive构建数据仓库,ETL使用什么工具来做?
http://www.aboutyun.com/thread-11887-1-1.html
|