about云2014年12月25日每日一读
Spark1.2新特性介绍http://www.aboutyun.com/thread-10797-1-1.html
1.在传大量数据的情况下,communication manager换成netty-based的实现了,实现这个功能有什么好处?2.Spark SQL中缓存表一定要用cacheTable(“tableName”)这种形式,为什么?
Twitter的百TB级Redis缓存实践
http://www.aboutyun.com/thread-10796-1-1.html
1.为什么使用Redis?
2.为什么使用Redis代替Memcache?
3.Redis添加Hybrid List可以带来什么好处?
数据挖掘入门——分词
http://www.aboutyun.com/thread-10795-1-1.html
1.如何才能让数据发挥最大价值?
2.分词的作用是什么?
3.如何让程序识别句子中的时间?比如“上午”、“下午2点”?
Spark 性能相关参数配置详解-Storage篇
http://www.aboutyun.com/thread-10794-1-1.html
1、如何根据实际场合对Spark进行配置优化?
2、Storage相关配置参数有哪些?
Ubuntu 14.10 下安装伪分布式HIVE-0.14.0
http://www.aboutyun.com/thread-10778-1-1.html
1.hive安装需要下载哪个包?
2.hive伪分布该如何配置?
HIVE 0.14.0安装配置
http://www.aboutyun.com/thread-10777-1-1.html
1.HIVE安装是否需要编译?
2.hive安装需要哪些步骤?
3.hive安装需要修改哪些配置?
Spark源码系列(九)Spark SQL初体验之解析过程详解
http://www.aboutyun.com/thread-10783-1-1.html
1.如何通过Parser把sql解析成一个LogicPlan?2.child.execute()执行子节点的execute来返回数据的过程是怎样的?
hbase源码系列(三)Client如何找到正确的Region Server
http://www.aboutyun.com/thread-10788-1-1.html
1.hbase的两张元数据表查找过程是怎样的?
2.如何根据情况来构建Scan的StartKey?
使用Java编写并运行Spark应用程序
http://www.aboutyun.com/thread-10791-1-1.html
1、统计分析程序需要实现哪几个功能点?
2、要分析某网站的访问日志信息思路怎样?
3、怎样通过Web控制台来查看当前执行应用程序的状态信息?
Spark0.9分布式运行MLlib的二元分类算法
http://www.aboutyun.com/thread-10792-1-1.html
1、什么是MLlib?
2、什么方法默认执行L2正规化算法?
3、如何理解二元分类?
Spark0.9分布式运行MLlib的线性回归算法
http://www.aboutyun.com/thread-10793-1-1.html
1、什么是线性回归算法?
2、可用线性回归算法有哪些?
3、如何对拟合优度进行评估?
云游戏数据分析:云上游戏数据分析实践
http://www.aboutyun.com/thread-10766-1-1.html
1.游戏数据的特点主哪些个方面?
2.当前游戏行业数据分析的现状是什么?
Spark社区的圣诞礼物 : Spark Package
http://www.aboutyun.com/thread-10767-1-1.html
1.什么是Spark Package?
2.本文spark Package各自的作用是什么?
hbase源码系列(二)HTable 探秘
http://www.aboutyun.com/thread-10786-1-1.html
1.HTable内部是用什么来和后台通信的?2.有哪些客户端调优的方法?
scribe、chukwa、kafka、flume日志系统对比
http://www.aboutyun.com/thread-10782-1-1.html
资源:
lucene视频教程
http://www.aboutyun.com/thread-10789-1-1.html
12月19日(北京站)分享嘉宾PPT
http://www.aboutyun.com/thread-10785-1-1.html
ubuntu 14.04.1安装openstack_juno
http://www.aboutyun.com/thread-10775-1-1.html
Linux下Eclipse编译和调试HIVE
http://www.aboutyun.com/thread-10776-1-1.html
问答:
【解决】HIVE如何执行?
http://www.aboutyun.com/thread-10768-1-1.html
Ceph云硬盘性能测试结果疑惑
http://www.aboutyun.com/thread-10770-1-1.html
关于hadoop 生成的日志文件
http://www.aboutyun.com/thread-10771-1-1.html
求教 storm 的Rebalance
http://www.aboutyun.com/thread-10772-1-1.html
【解决】HIVE转化成MapReduce的逻辑
http://www.aboutyun.com/thread-10773-1-1.html
【求助】关于对CPU的资源使用问题
http://www.aboutyun.com/thread-10779-1-1.html
【解决】关于Hive的Reduce数量的问题
http://www.aboutyun.com/thread-10781-1-1.html
yarn下nodemanager的识别问题
http://www.aboutyun.com/thread-10784-1-1.html
使用rpmbuild打包出现错误,求解
http://www.aboutyun.com/thread-10787-1-1.html
版主每日一读,我尽量来每日一顶 感谢分享。{:soso_e100:}
页:
[1]