分享

about云每日一读汇总(第十二篇2016.01.01)



about云每日一读汇总(第一篇)

about云每日一读汇总(第二篇)

about云每日一读汇总(第三篇2014.10.20)

about云每日一读汇总(第四篇2014.12.10)

about云每日一读汇总(第五篇2015.01.01)

about云每日一读汇总(第六篇2015.02.01)

about云每日一读汇总(第七篇2015.03.01)

about云每日一读汇总(第八篇2015.05.01)

about云每日一读汇总(第九篇2015.06.21)

about云每日一读汇总(第十篇2015.09.01)

about云每日一读汇总(第十一篇2015.11.14)


about云2016年03月31日每日一读

Storm在线业务实践-集群空闲CPU飙高问题排查
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17874
1.什么是Storm?
2.集群空闲CPU飙高出现的现象是什么样的?
3.出现此现象之后应该如何进行排查?



Storm--多语言接口协议
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17875
1.什么是Storm 多语言协议?
2.如何在集群上运行壳组件?
3.什么是Shell Spouts?
4.什么是Shell Bolts?
5.如何处理心跳?


资源:

Spark各个知识点总结
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17876

Docker的云中实战

http://www.aboutyun.com/forum.php?mod=viewthread&tid=17877


发个HADOOP权威指南 第3版中文的
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17869



问答:

关于spark的core数
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17871


百度、阿里等大的公司的Hadoop大数据集群用开源版本还是CDH版本
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17872


CDH 配置kerberos后 hdfs无法离开安全模式 很多服务红色信号
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17873


数据挖掘150道面试题(三) 50-60题
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17870




about云2016年03月30日每日一读

机器学习在金融大数据风险建模中的应用
http://www.aboutyun.com/thread-17857-1-1.html
1、为什么互联网金融、消费金融需要大数据?
2、什么是T-L核模型、Random Forest模型、ScoreNet模型?
3、机器学习在金融大数据中的关注重点是什么?



使用Solr搭建“小”数据集群的搜索和推荐功能
http://www.aboutyun.com/thread-17861-1-1.html
1、Solr如何连接Mysql数据库?
2、如何处理位置搜索的数据结构?
3、Solr的学习三个步骤有哪些内容?


资源:

GrowingIO使用spark过程中的小技巧
http://www.aboutyun.com/thread-17860-1-1.html

inux下的C编程(0基础).pdf
http://www.aboutyun.com/thread-17868-1-1.html


问答:

Hbase配置以后启动提示master.HMasterCommandLine: Master exiting java.lang.Runt...
http://www.aboutyun.com/thread-17859-1-1.html

HDFS启动执行命令提示:DEPRECATED: Use of this script to execute hdfs command
http://www.aboutyun.com/thread-17864-1-1.html

关于spark streaming的checkpoint
http://www.aboutyun.com/thread-17865-1-1.html

hdfs下节点,数据恢复问题
http://www.aboutyun.com/thread-17866-1-1.html




about云2016年03月29日每日一读

雷军回应飞猪理论:任何人成功都需要一万小时的苦练
http://www.aboutyun.com/thread-17843-1-1.html
1.不要曲解飞猪理论?
2.如何顺势而为?
3.为什么要低调做事?


当当网高可用架构之道
1.什么是高可用?
2.系统中的非功能性需求有哪些?
3.如何设计高可用架构?


资源:

Linux内核分析方法

spark图处理

the future of Real-Time in spark

让数据说话-spark在TalkingData的应用

问答:

查看glance镜像时报错
http://www.aboutyun.com/thread-17841-1-1.html

hadoop 集群重启问题
http://www.aboutyun.com/thread-17847-1-1.html

CDH 安装JCE Policy File 报错
http://www.aboutyun.com/thread-17849-1-1.html

sparkstreaming 和kafka
http://www.aboutyun.com/thread-17850-1-1.html

storm连接oracle数据库失败
http://www.aboutyun.com/thread-17854-1-1.html

ganglia gmond sent message 'heartbeat' of length 52 with 1 errors
http://www.aboutyun.com/thread-17853-1-1.html

求教:hbase运行过程中异常,有没有遇到过类似问题的
http://www.aboutyun.com/thread-17855-1-1.html


about云2016年03月28日每日一读

2016年about云03月第04周经典帖子总结
http://www.aboutyun.com/thread-17839-1-1.html

哪些平台可以成为大数据网站
http://www.aboutyun.com/thread-17817-1-1.html

NoSQL数据库在现代应用程序中的作用
http://www.aboutyun.com/thread-17818-1-1.html
1.NoSQL与REST如何结合使用?
2.什么叫做数据模型驱动力?
2.怎么样选择SQL或者NoSQL?


如何阅读 Redis 源码?
http://www.aboutyun.com/thread-17819-1-1.html
1.如何阅读redis数据结构?
2.如何一步步了解redis源码?


关于spark执行器内存分配的问题
http://www.aboutyun.com/thread-17820-1-1.html

阅读hbase源码,读到client和server交互的地方卡住了
http://www.aboutyun.com/thread-17822-1-1.html

揭开Spark Streaming神秘面纱② - ReceiverTracker 与数据导入
http://www.aboutyun.com/thread-17825-1-1.html
1.streaming application 如何兼容众多数据源?
2.receivers 是如何分发并启动的?
3.receiver 接收到的数据是如何流转的?

揭开Spark Streaming神秘面纱③ - 动态生成 job
http://www.aboutyun.com/thread-17826-1-1.html
1.JobGenerator中的定时逻辑是什么?
2.为 batch 生成 jobs的流程是什么?
3.jobs的生成过程有哪几步?


[Spark源码剖析]Spark 延迟调度策略
http://www.aboutyun.com/thread-17834-1-1.html

1.什么是延迟调度?
2.延时调度如何工作?
3.怎样判断是否还有当前 locality level 的 task 需要执行?


Spark Streaming的还原药水——Checkpoint
http://www.aboutyun.com/thread-17835-1-1.html
1.什么时候需要启用 checkpoint?
2.如何使用 checkpoint?
3.在什么时机进行 checkpoint?


数据挖掘150道解析(二)40-50题
http://www.aboutyun.com/thread-17829-1-1.html

资源:
spark数据分析和管道处理【英文】
http://www.aboutyun.com/thread-17837-1-1.html

老码识途-从机器码到框架的系统观逆向修炼之路
http://www.aboutyun.com/thread-17838-1-1.html

问答:

求解,如何去除HDFS中一张数据表格中数据之间的分隔符?谢谢
http://www.aboutyun.com/thread-17812-1-1.html

请教一个Hadoop集群的问题
http://www.aboutyun.com/thread-17815-1-1.html


hive中自定义UDF函数如何使用外部文件
http://www.aboutyun.com/thread-17813-1-1.html

spark on yarn 的配置疑问
http://www.aboutyun.com/thread-17821-1-1.html

如何搭建Hbase源码阅读环境,并能进行编译运行
http://www.aboutyun.com/thread-17823-1-1.html

求教:hbase scan 源码分析,客户端和服务端,都有哪些处理过程
http://www.aboutyun.com/thread-17827-1-1.html

关于MapReduce的setOutputKeyClass的问题
http://www.aboutyun.com/thread-17828-1-1.html

spark streaming 编程问题
http://www.aboutyun.com/thread-17830-1-1.html

SQuirreL SQL Client连接phoenix问题
http://www.aboutyun.com/thread-17836-1-1.html




about云2016年03月25日每日一读


Storm集群组件和编程模型
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17806
1.storm的工作原理是什么?
2.storm集群组件包含几部分?
3storm的编程模型是怎么样的?


揭开Spark Streaming神秘面纱① - DStreamGraph 与 DStream DAG
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17807
1.DStreamGraph怎么用?
2.DStream的依赖链是怎么样的?




hbase与zookeeper版本到底如何对应的
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17793



资源:

spark真实的未来
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17803


从Paxos到Zookeeper 分布式一致性原理与实践【推荐书籍】
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17804



问答:

CDH solr jvm内存限制该如何解决
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17792


创建实例主机出现以下提示,应该怎么整,求大神解答!
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17794


二次排序SecondarySort 例子出错
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17795


hbase hbase.hregion.max.filesize的问题
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17796


cloudera manager 安装中遇到的问题
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17797


Zookeeper一直提示连接失败
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17798


hbase中SCAN_ATTRIBUTES_METRICS_ENABLE这个参数是做什么用的
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17799


求 Hadoop 入门到精通视频 谢谢
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17800


关于创建的网络时,网络的端口network:router_interface停止运行的问题
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17802


关于启动image提示Unexpected API Error.
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17805


spark集群问题
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17808


Hadoop集群问题
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17809





about云2016年03月24日每日一读

1号店交易系统架构如何向「高并发高可用」演进
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17782
1.电商(轻量级与重量级)的架构和痛点是什么?
2.电商网站演进之路在何方?
3.怎么做架构演进的准备工作?
4.核心Service如何规划?
5.怎样进行订单水平拆库?
6.SOA中间件是什么?
7.什么是多活机房架构?


物联网核心协议,消息推送技术演进
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17783
1.物联网架构和关键技术分别是什么?
2.什么是移动互联网通信模式?
3.消息推送技术如何进行的演进?


当我们说数据挖掘的时候我们在说什么
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17790
1、数据挖掘的流程是什么?
2、数据挖掘各流程主要内容有哪些?



资源:

Spark Streaming 和物联网
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17788


Hadoop-2.7.1分布式安装手册
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17789



问答:

centos搭建Ganglia监控访问页面404
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17779


只能启动测试镜像的虚拟机
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17780


CDH集群中的solrCloud的数据如何切换到tomcat下面
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17781


solr分组
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17784


Instance 访问public网络问题
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17785


openstack虚拟机选择问题
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17786


solr-4.10.3-cdh5.5.1版本想在tomcat下面运行,报错
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17787



about云2016年03月23日每日一读

决策树分类和预测算法的原理及实现
http://www.aboutyun.com/thread-17776-1-1.html
1、什么是决策树算法?
2、决策树算法有什么特点?
3、如何深度理解决策树算法?




设置Hadoop用户以便访问任何HDFS文件
http://www.aboutyun.com/thread-17777-1-1.html
1、如何设置Hadoop用户访问任何HDFS文件?
2、Hadoop用户访问任何HDFS文件原理是什么?




hbase 为什么需要zookeeper
http://www.aboutyun.com/thread-17770-1-1.html


资源:
JDBC学习手册
http://www.aboutyun.com/thread-17774-1-1.html

部署spark技巧
http://www.aboutyun.com/thread-17775-1-1.html

问答:
solr一个查询语句同时查询两个core的时候,如果两个core有相同ID的数据,结果少一条
http://www.aboutyun.com/thread-17768-1-1.html

用mahout执行聚类分析的时候,报如下的错,请教各位,多谢多谢!
http://www.aboutyun.com/thread-17771-1-1.html

请问hadoop集群如何安全的删除一个节点,或者说退役节点
http://www.aboutyun.com/thread-17773-1-1.html  




about云2016年03月22日每日一读

Java虚拟机类加载机制
http://www.aboutyun.com/thread-17750-1-1.html
1. 类的加载过程是怎样的?
2. 类的记载过程中每个阶段是怎样的?


数据可视化演绎大数据的未来
http://www.aboutyun.com/thread-17759-1-1.html

2016年大数据发展七大趋势
http://www.aboutyun.com/thread-17760-1-1.html
1.大数据有哪些趋势?
2.大数据可能"走下神坛"?
3.大数据交易中心模式走向成熟?


代码解析深度学习系统编程模型:TensorFlow vs. CNTK
http://www.aboutyun.com/thread-17761-1-1.html
1.什么是TensorFlow?
2.什么是CNTK?
3.CNTK与TensorFlow在网络训练上有哪些不同?

资源:

构建spark sql dataframes,datasets,和streaming
http://www.aboutyun.com/thread-17748-1-1.html

京东服务框架实践-京东
http://www.aboutyun.com/thread-17749-1-1.html

ZooKeeper-3.4.6分布式安装指南
http://www.aboutyun.com/thread-17754-1-1.html

SBT实战【英文版】
http://www.aboutyun.com/thread-17755-1-1.html

问答:

Storm本地eclipse中运行报错, Async loop died!
http://www.aboutyun.com/thread-17751-1-1.html

哪位大神帮忙看下,重启系统后,hive报错,
http://www.aboutyun.com/thread-17752-1-1.html


启动spark-shell报错,
http://www.aboutyun.com/thread-17753-1-1.html

CDH hadoop hbase 启动脚本是哪个?
http://www.aboutyun.com/thread-17756-1-1.html

一个很困惑的关于GROUP BY的问题
http://www.aboutyun.com/thread-17758-1-1.html

hive on spark on yarn的问题
http://www.aboutyun.com/thread-17762-1-1.html

Hadoop时间与系统时间不一致
http://www.aboutyun.com/thread-17763-1-1.html

【求助】phoenix配置启动出错
http://www.aboutyun.com/thread-17766-1-1.html





about云2016年03月21日每日一读

如何用Python写一个贪吃蛇AI
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17743
1.最简单的贪吃蛇游戏开发过程中要注意哪些问题?
2.怎样制作高级版本的贪吃蛇游戏?
3.python中怎样优化图片大小?



Flume日志收集分层架构应用实践
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17745
1.Flume有哪些优势?
2.为什么要对Flume日志收集系统进行分层设计?
3.怎样构建一个相对复杂的Flume分层日志收集系统?




达观数据分析平台架构和Hive实践
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17725
1.Hive与一般SQL有什么区别?
2.达观数据分析平台架构是怎么样的?
3.达观怎么优化数据分析平台的?


机器学习开发者的现代化路径:不需要从统计学微积分开始
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17726
1.机器学习是什么?
2.如何去学习机器学习技术?
3.机器学习常见误区有哪些?





centos7 安装jdk 1.7
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17730
1.环境变量在哪个文件中配置的?
2.需要配置哪些变量?
3.如何生效环境变量?


2016年,文本分析、情感分析和社交分析的10大趋势
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17732
1.分析技术将有哪些突破?
2.哪些领域可以做自动分析?
3.分析技术的发展趋势是什么?



使用 Flume 部署和管理可扩展的 Web 服务
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17733
1.Flume是什么?
2.Avro是什么?
3.怎样使用Flume部署和管理可扩展的 Web 服务?



2016年about云03月第03周经典帖子总结
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17746


淘点点面试架构问题
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17740



hadoop问题整理搜集
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17739


spark RDD函数里尽量不要使用全局变量
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17741


HBase客户端访问超时分析
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17742


问答:

小白求问虚拟机3节点安装openstack的虚拟机网卡配置
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17734


在公网中Maven有时候可用,有时候用不了
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17735


CentOS系统更换软件安装源
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17737


spark 二次排序,就top
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17729


neutron ext-list报错
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17738



请教下在spark-shell 里面不能new HiveContext
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17744



请教一个问题,
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17724


有一个 jps 问题
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17727


关于虚机备份
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17728


实例大小无法超过单台计算节点大小
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17731




about云2016年03月18日每日一读


如何基于Spark进行用户画像?
http://www.aboutyun.com/thread-17710-1-1.html
1.拿到数据我们怎么去做数据分析?
2.在spark中怎么去做聚类分析?


分布式数据库挑战与分析
http://www.aboutyun.com/thread-17711-1-1.html
1.关系型数据库和非关系型数据库的区别?
2.Nosql的分类有哪些?


在eclipse提交的作业总是在eclipse虚拟的云环境中运行
http://www.aboutyun.com/thread-17708-1-1.html



CentOS7 wget不可用
http://www.aboutyun.com/thread-17707-1-1.html


sqoop错误总结
http://www.aboutyun.com/thread-17715-1-1.html


资源:
写spark应用5大误区
http://www.aboutyun.com/thread-17721-1-1.html


solr安装与配置文档_插件版(水印)
http://www.aboutyun.com/thread-17722-1-1.html


问答:

请教hbase 表设计version设置过大会有什么影响?
http://www.aboutyun.com/thread-17703-1-1.html


关于mr1和mr2结构的一点疑问
http://www.aboutyun.com/thread-17704-1-1.html


求助 sqoop导入的时候报错,请各位大神帮忙看下
http://www.aboutyun.com/thread-17705-1-1.html


一个sqoop的错误,各位大神见过没
http://www.aboutyun.com/thread-17709-1-1.html


sqoop导入hive报错
http://www.aboutyun.com/thread-17712-1-1.html


oozie coordinator 作业如何配置???
http://www.aboutyun.com/thread-17713-1-1.html


hadoop集群的节点之间需要ssh的免密码登录吗
http://www.aboutyun.com/thread-17716-1-1.html


哪位大神自己搭建Hadoop环境了,配套的安装包能不能给下
http://www.aboutyun.com/thread-17717-1-1.html


openstack web改了中文还是显示英文
http://www.aboutyun.com/thread-17720-1-1.html




about云2016年03月17日每日一读


Hadoop平台上用Sqoop在Hive和DB2数据库之间传输数据的实践和总结
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17696
1.如何将DB2导入Hive数据库?
2.有分区和无分区二者有什么区别?
3.如何从Hive库导入DB2库?


亲密接触Redis-第三天(Redis的Load Balance)-1
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17689
1.Redis3.x中如何引入的Load Balance?
2.Redis Cluster如何实现?
3.怎样使用Rubb Gem的Redis模块+redis-trib.rb创建集群?




亲密接触Redis-第三天(Redis的Load Balance)-2
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17690
1.如何使用Jedis Client来连接Redis集群(Load Balance)?
2.Redis集群的注意事项与坑有哪些?
3.redis-cli客户端使用需要注意什么?



Xshell4连接,Linux系统中文显示乱码解决办法
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17693


CentOS中rpm命令详细介绍
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17697
1.rpm -U是什么意思?
2.rpm 如何删除软件包?
3.rpm -q如何查询安装软件包?


资源:

rpm命令详解
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17698


开源分布式文件系统
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17699



问答:

求助,谁有Hadoop2.6的sqoop安装包
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17700


hadoop2.7.0集群,使用中遇到的bug及解决办法
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17701


关联规则
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17686


eclipse编程,java API连接操作HBase需要导入哪些jar包,哪里可以下载?
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17688


关于mapper和reducer启动数量的一些疑惑
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17692


hive整合hbase的问题
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17694


请问用sqoop从db2 a表导入hive b表命令
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17695




about云2016年03月16日每日一读

协同过滤介绍和简单推荐系统的实现
http://www.aboutyun.com/thread-17678-1-1.html
1、什么是推荐系统、协同过滤?
2、如何实现相似度测量方法?


Hadoop之使用python实现数据集合间join操作
http://www.aboutyun.com/thread-17677-1-1.html
1、什么是hadoop steaming?
2、python如何调用steaming?
3、如何使用hadoop steaming分析数据?


资源:

统计思维:程序员数学之概率统计.pdf
http://www.aboutyun.com/thread-17682-1-1.html

[O'Reilly:社交网站的数据挖掘与分析].(Mattbew.A.Russell)
http://www.aboutyun.com/thread-17681-1-1.html

构建健壮的、自适应流媒体应用spark streaming
http://www.aboutyun.com/thread-17680-1-1.html

Hive 1.2.1&Spark&Sqoop安装指南
http://www.aboutyun.com/thread-17683-1-1.html


问答:

openstack 能否将多台计算机变成一台
http://www.aboutyun.com/thread-17676-1-1.html




about云2016年03月15日每日一读

Yarn下的YarnChild启动个数决定参数
http://www.aboutyun.com/thread-17664-1-1.html

Spark入门篇第2课:Scala面向对象彻底精通
http://www.aboutyun.com/thread-17662-1-1.html

centos配置集群为什么要关闭SELINUX
http://www.aboutyun.com/thread-17667-1-1.html

集群配置必知:linux下yum安装及配置
http://www.aboutyun.com/thread-17668-1-1.html
1.如何查看卸载安装包?
2.如何更改yum源?
3.如何清理yum缓存?


当取经队伍用上大数据分析工具。。。
http://www.aboutyun.com/thread-17670-1-1.html

亲密接触Redis-第二天(Redis Sentinel)
http://www.aboutyun.com/thread-17673-1-1.html
1.RDB有哪些优缺点?
2.AOF有哪些优缺点?
3.什么是THP?


亲密接触Redis-第一天
http://www.aboutyun.com/thread-17674-1-1.html
1.Redis是什么?
2.如何安装Redis?
3.如何使用Spring Data JEDIS来连接Redis Service?



资源:

IBM存储解决方案——数据分析的存储
http://www.aboutyun.com/thread-17671-1-1.html

分布式存储技术整体分析与研究应用
http://www.aboutyun.com/thread-17672-1-1.html

问答:

Hadoop环境搭建
http://www.aboutyun.com/thread-17665-1-1.html

救命啊,新增加节点全部服务都起来了,也分配到YarnChild,但就是YarnChild不干活
http://www.aboutyun.com/thread-17663-1-1.html

java 怎么读取hdfs上csv文件的某一列
http://www.aboutyun.com/thread-17669-1-1.html




about云2016年03月14日每日一读

Spark 1.6 内存管理模型( Unified Memory Management)分析
http://www.aboutyun.com/thread-17629-1-1.html
1:spark1.6之前内存怎么管理?
2:spark1.6内存管理UnifiedMemoryManager是怎么实现的?



Spark on Yarn:性能调优
http://www.aboutyun.com/thread-17630-1-1.html
1.spark调优有哪些配置项?
2.工作中怎么去自己调优?


Ceilometer之collector代码分析
http://www.aboutyun.com/thread-17628-1-1.html

马云:最讨厌天天说公司不好还留在公司的人
http://www.aboutyun.com/thread-17652-1-1.html
1.公司为什要有KPI?
2.怎样获得自己应有的报酬?
3.怎样做好公司?


换个思路看12306,其核心模型设计思路到底复杂在哪里?
http://www.aboutyun.com/thread-17653-1-1.html
1.12306系统的需求是什么?
2.12306系统的模型设计是怎样的?
3.12306系统的架构设计是怎样的?

ZooKeeper原理及使用(详细版本)
http://www.aboutyun.com/thread-17636-1-1.html
1.zookeeper的基本原理是什么?
2.zookeeper的特性有哪些?
3.zookeeper的应用场景是怎么样的?


高效、稳定、可复用——手机淘宝主会场框架详解
http://www.aboutyun.com/thread-17637-1-1.html
1.手机淘宝可复用的会场框架是怎么样的?
2.如何应对庞大手机流量?
3.手机淘宝的解决方案是什么?


淘宝大秒系统设计详解
http://www.aboutyun.com/thread-17647-1-1.html
1.秒杀系统怎样实现热点隔离?
2.怎样实现动静分离?
3.怎样处理同一数据大并发读写问题?


美团云分布式块存储系统Ursa的设计与实现
http://www.aboutyun.com/thread-17648-1-1.html
1.有哪些分布式块存储相关项目与技术?
2.怎样设计分布式块存储系统?
3.分布式块存储系统中怎样实现高并发?


Hive优化总结
http://www.aboutyun.com/thread-17649-1-1.html
1. hive常见的优化方式有哪些?
2. hive表怎么优化?
3. hive查询怎么优化?
4. hive job怎么优化?



2016年about云03月第02周经典帖子总结
http://www.aboutyun.com/thread-17655-1-1.html

Spark入门篇第1课:Scala光速入门
http://www.aboutyun.com/thread-17656-1-1.html

条件判断之if语句
http://www.aboutyun.com/thread-17640-1-1.html

条件判断之switch语句
http://www.aboutyun.com/thread-17641-1-1.html

循环之whie
http://www.aboutyun.com/thread-17643-1-1.html

显示前50个素数
http://www.aboutyun.com/thread-17644-1-1.html

打印日历
http://www.aboutyun.com/thread-17659-1-1.html

资源:

连续整合spark apps
http://www.aboutyun.com/thread-17658-1-1.html

大型分布式网站架构设计与实践
http://www.aboutyun.com/thread-17660-1-1.html

问答:

Hadoop 2.6.3 示例中sort运行出错
http://www.aboutyun.com/thread-17631-1-1.html

运行mahout中的范例结果输出为什么是乱码呢?
http://www.aboutyun.com/thread-17633-1-1.html

远程执行程序总是显示:java.io.IOException: Could not acquire 65536 bytes of m...
http://www.aboutyun.com/thread-17634-1-1.html

spark.buffer.pageSize 在哪里调整哪位大神知道呢
http://www.aboutyun.com/thread-17635-1-1.html

spark提交程序出错
http://www.aboutyun.com/thread-17638-1-1.html

请教Hbase的regionserver启动立马挂掉的问题,希望帮忙解决,谢谢!
http://www.aboutyun.com/thread-17639-1-1.html

关于hadoop中两个配置属性的疑惑
http://www.aboutyun.com/thread-17642-1-1.html

在执行hadoop的命令时,加上参数-files 对应的文件会被拷贝到哪里?
http://www.aboutyun.com/thread-17645-1-1.html


分享一篇帖子,解决运行mrunit报错的问题
http://www.aboutyun.com/thread-17646-1-1.html

关于floating ip的一些问题
http://www.aboutyun.com/thread-17650-1-1.html

我们公司的OPENSTACK架构
http://www.aboutyun.com/thread-17651-1-1.html

solr core应经建好,并且有数据了,想调整字段,该如何处理
http://www.aboutyun.com/thread-17654-1-1.html




about云2016年03月11日每日一读

HDFS追本溯源:租约,读写过程的容错处理及NN的主要数据结构
http://www.aboutyun.com/thread-17620-1-1.html
1.hadoop对读写的互斥同步就是靠Lease实现的?
2.LeaseManager中有哪两个时间限制?
3.LeaseManagement是一个什么机制?
4.LeaseManager主要完成哪两部分工作?
5.leaserecovery什么时候收回租约?


大数据时代带来的思想火花
http://www.aboutyun.com/thread-17623-1-1.html

JAVA基本程序设计(一)
http://www.aboutyun.com/thread-17615-1-1.html

java基础程序设计2完整版
http://www.aboutyun.com/thread-17619-1-1.html

资源:

cloudera spark时间序列数据分析【英文版】
http://www.aboutyun.com/thread-17621-1-1.html

流动力的spark可视化数据
http://www.aboutyun.com/thread-17622-1-1.html

问答:

如何用spark连接mysql读取数据,使用python
http://www.aboutyun.com/thread-17614-1-1.html

关于yarn内存分配的问题
http://www.aboutyun.com/thread-17616-1-1.html

求助hdfs追加文件报租约问题
http://www.aboutyun.com/thread-17618-1-1.html

neutron(librity)求教大大们啊
http://www.aboutyun.com/thread-17624-1-1.html

HBASE 1.1.2版本jmx监控不全的问题,求指教!
http://www.aboutyun.com/thread-17625-1-1.html




about云2016年03月10日每日一读

用阿里云配置VPN
http://www.aboutyun.com/thread-17602-1-1.html
1.阿里云如何配置VPN?
2.过程中遇到什么样的问题?
3.如何解决这样的问题?


机器学习大事记:2分钟看尽机器学习66年发展进程
http://www.aboutyun.com/thread-17603-1-1.html
1.机器学习应用有哪些方面?
2.机器学习有哪些突破?
3.机器学习未来如何?



大数据分析工具要怎样适应企业需求
http://www.aboutyun.com/thread-17608-1-1.html


Ceilometer之notification agent代码分析
http://www.aboutyun.com/thread-17609-1-1.html


资源:

spark下的RDD
http://www.aboutyun.com/thread-17604-1-1.html

七周七语言:理解多种编程范型
http://www.aboutyun.com/thread-17605-1-1.html


Python学习资料----最适合新手的入门学习指导文档!
http://www.aboutyun.com/thread-17607-1-1.html


问答:

【求助】CDH5.5.1的HBase删除数据再插入同样的数据无法插入
http://www.aboutyun.com/thread-17606-1-1.html


请问hbase查询一条记录的具体流程是什么?
http://www.aboutyun.com/thread-17610-1-1.html



about云2016年03月09日每日一读

如何透彻的掌握一门机器学习算法
http://www.aboutyun.com/thread-17595-1-1.html
1、什么是研究机器学习算法?
2、怎样研究学习机器学习算法?


基于日志文件的数据挖掘机理分析与研究
http://www.aboutyun.com/thread-17594-1-1.html
1、数据挖掘的含义是什么?
2、日志数据面临的挑战有什么?
3、如何对日志数据进行挖掘工作?


用Spark/DBSCAN做地理定位数据聚类
http://www.aboutyun.com/thread-17593-1-1.html
1、如何利用机器学习对用户事件进行分类?
2、如何利用Spark/DBSCAN进行数据聚类?


如何利用大数据分析工具预测未来?
http://www.aboutyun.com/thread-17591-1-1.html

djunit用法
http://www.aboutyun.com/thread-17587-1-1.html

java-枚举类型用法
http://www.aboutyun.com/thread-17589-1-1.html

资源:

五个原因企业采用spark是不可阻挡的
http://www.aboutyun.com/thread-17585-1-1.html

阿里云-飞天系统-总体框架
http://www.aboutyun.com/thread-17586-1-1.html

问答:

hadoop中combine,partition和shuffle的疑问
http://www.aboutyun.com/thread-17584-1-1.html

Openstack 如何修改已经创建实例的大小
http://www.aboutyun.com/thread-17588-1-1.html

hive无法启动的问题
http://www.aboutyun.com/thread-17590-1-1.html

急,求高手!!hive在向整合hbase的分区表插入数据时报错:Must specify table
http://www.aboutyun.com/thread-17592-1-1.html

在线急等【求助】:hadoop:unable to create new native thread
http://www.aboutyun.com/thread-17599-1-1.html

CDH solrcloud挂掉一个节点后不能正常插入
http://www.aboutyun.com/thread-17600-1-1.html

squirrel sql 连接 hive 问题
http://www.aboutyun.com/thread-17596-1-1.html

关于spark1.5分区的问题
http://www.aboutyun.com/thread-17598-1-1.html




about云2016年03月08日每日一读

Spark 1.6.0 新手快速入门
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17571
1.Spark交互式Shell如何使用?
2.更多RDD操作有什么?
3.缓存机制是怎样的?

在Eclipse上配置Python开发环境
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17572
1.什么是PyDev?
2.如何安装PyDev?

3.安装Eclipse过程中如何解决遇到的问题?


资源:

关于spark和大数据的5个神话
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17576


Yarn上运行spark-1.6.0
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17577


问答:

chang_quanyou@163.com
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17574


dfs、yarn和hbase启动后,jps只有一下六项,eclipse中编写程序无法在hbase中建立表
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17567


新手请教简单操作问题......
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17568


求助关于spark mapToPair和reduceByKey遇到的问题,求助
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17570


请问大家数据倾斜的原因及其解决办法?
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17573


[求助]spoolDir与hdfssink的两个报错channel is full和hdfs IO Error
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17575


spark streaming 把spark.streaming.concurrentJobs设置成2就报错
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17578


hadoop的路径问题
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17579



about云2016年03月07日每日一读


Spark Streaming 详细入门
http://www.aboutyun.com/thread-17562-1-1.html
1.什么是Spark Streaming?
2.怎样配置并运行Spark Streaming?
3.怎样调优Spark Streaming?




老兵谈:如何构建一个融合Docker和虚拟化的云平台?
http://www.aboutyun.com/thread-17564-1-1.html
1.四种开源Docker集群管理平台有哪些不同?
2.Docker集群管理平台资源池层技术思路是什么?
3.怎样构建一个融合Docker和虚拟化的高可用云平台?



基于Spark的异构分布式深度学习平台
http://www.aboutyun.com/thread-17543-1-1.html
1.PADDLE是什么?
2.PADDLE与业务逻辑结合的痛点
3.Spark on PADDLE 2.0的主要目标是什么?


redis-migration:独创的redis在线数据迁移工具
http://www.aboutyun.com/thread-17544-1-1.html
1.常见redis数据迁移方式有哪三种?
2.开发redis-migration的需求是什么?
3.如何开发redis-migration?


MapReduce 学习笔记(1) 以及 Yarn 框架基本介绍
http://www.aboutyun.com/thread-17545-1-1.html
1、MapReduce 是什么?
2、如何完成 属于自己的 wordcount Demo?
3、MapReduce 程序 怎样提交到 yarn集群并运行?

4、MapReduce 程序  Yarn 框架上的运行流程是什么?


大数据 hadoop2.6.0+spark1.6.0 HA 分布式集群搭建(5个节点)【原创】
http://www.aboutyun.com/thread-17546-1-1.html
1.怎么去安装hadoop?
2.怎么去安装zookeeper?
3.怎么去安装spark?
4.怎么去测试安装正确性?


Linux定时器—crontab命令
http://www.aboutyun.com/thread-17548-1-1.html
1. crontab文件的含义?
2.  crontab命令怎么使用?
3. 系统级任务调度与用户级任务调度怎么实现?



HBase——扫描器缓存
http://www.aboutyun.com/thread-17551-1-1.html


Spark 1.6.0 单机安装配置
http://www.aboutyun.com/thread-17554-1-1.html


我是这样克服拖延症的,你也可以试试
http://www.aboutyun.com/thread-17555-1-1.html


资源:

SAE数据存储的演化
http://www.aboutyun.com/thread-17557-1-1.html


支撑华为云计算的虚拟化关键技术
http://www.aboutyun.com/thread-17558-1-1.html



问答:
高薪诚聘Hadoop技术经理(济南)
http://www.aboutyun.com/thread-17540-1-1.html

hadoop yarn怎样杀掉application
http://www.aboutyun.com/thread-17550-1-1.html





storm运行时bolt报异常
http://www.aboutyun.com/thread-17563-1-1.html


eclipse代码读取hdfs上的文件时出错,急诊
http://www.aboutyun.com/thread-17538-1-1.html


mysql 如何读取变量
http://www.aboutyun.com/thread-17539-1-1.html


请教一个问题 关于项目的
http://www.aboutyun.com/thread-17541-1-1.html


查看glance镜像时报错
http://www.aboutyun.com/thread-17547-1-1.html


openstack 实例不能访问百度
http://www.aboutyun.com/thread-17553-1-1.html


单节点无法进入控制台
http://www.aboutyun.com/thread-17556-1-1.html


copyFromLocalFile 无法上传到HDFS
http://www.aboutyun.com/thread-17559-1-1.html


hadoop集群启动
http://www.aboutyun.com/thread-17560-1-1.html






about云2016年03月04日每日一读


Kafka是如何实现高吞吐率的
http://www.aboutyun.com/thread-17525-1-1.html
1.Kafka如何实现分布式消息系统?
2.Kafka是如何实现高吞吐率的?




58同城高性能移动Push推送平台架构演进之路
http://www.aboutyun.com/thread-17524-1-1.html
1.为什么需要移动Push推送?
2.架构如何设计?



hosts文件格式说明,为什么还有域名配置
http://www.aboutyun.com/thread-17531-1-1.html
1.hosts为何有域名?
2.域名的作用是什么?
3.域名是否可以不用配置?


关于hadoop-mapreduce-examples.jar例子程序问题
http://www.aboutyun.com/thread-17533-1-1.html



centos7搭建集群必知:centos7已经无iptables,只有firewall
http://www.aboutyun.com/thread-17535-1-1.html


新手如何选择大数据分析工具
http://www.aboutyun.com/thread-17522-1-1.html


资源:
Spark Summit East 2016 PPT之九:Magellan-spark作为地理空间分析引擎
http://www.aboutyun.com/thread-17526-1-1.html




问答:
hadoop datanode 无法启动
http://www.aboutyun.com/thread-17519-1-1.html



Ceilometer之polling agent代码分析
http://www.aboutyun.com/thread-17516-1-1.html



求助下 在离线安装CDH5.3的时候,遇到oozio的问题
http://www.aboutyun.com/thread-17513-1-1.html



iptables -X 和 -F有什么区别?
http://www.aboutyun.com/thread-17534-1-1.html



KVM有没有类似vmware的“虚拟化VT-x/AMT-V"的功能。
http://www.aboutyun.com/thread-17529-1-1.html


CDH 安装异常(parcel版本太低)
http://www.aboutyun.com/thread-17532-1-1.html


无法创建实例,500报错
http://www.aboutyun.com/thread-17514-1-1.html


关于在Hadoop集群下的几个疑问
http://www.aboutyun.com/thread-17517-1-1.html


计算节点nova启动报错
http://www.aboutyun.com/thread-17518-1-1.html


【求教】硬件配置不一样,如何安装CDH?
http://www.aboutyun.com/thread-17520-1-1.html


计算节点nova启动报错(new)
http://www.aboutyun.com/thread-17521-1-1.html


windows挂载cinder-volume?
http://www.aboutyun.com/thread-17523-1-1.html


Spark Streaming中的ssc.textFileStream(),获取不到数据
http://www.aboutyun.com/thread-17528-1-1.html






about云2016年03月03日每日一读

程序员健康:30岁IT男连续工作一个月 突然失聪
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17506


容器技术究竟为云计算带来了什么?
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17507
1.容器有哪些好处?
2.容器技术究竟给云计算带来什么本质的改变呢?
3.运用容器技术需要注意什么?





资源:

高可用Hadoop2.7、Hbase1.1.3集群配置:高可用集群安装与部署
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17508


Spark Summit East 2016 PPT之八:PB级别的数据科学使用spark和R
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17511


Spark Summit East 2016 PPT之八:PB级别的数据科学使用spark和R
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17511


问答:

求教关于spark streaming 处理时间片数据的调度策略
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17503


请教关于Hadoop集群间认证
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17505




about云2016年03月02日每日一读

比较R语言机器学习算法的性能
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17490
1.如何选择最好的机器学习模型?
2.如何客观地比较R语言机器学习模型?
3.有哪些好的技术用来比较构建模型的估计精度?




机器学习简史——经理人必读
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17491
1、机器学习如何源起?
2、哪些技术实现是机器学习历史突破?




JVM 并发性: 使用 Akka 构建 actor 应用程序
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17494
1、与构建系统相关的actor和消息方面都有哪些?
2、actor系统4种主要的actor类型和两种专业的辅助actor类型是什么?
3、Akka actor系统如何处理故障?



资源:

Spark Summit East 2016 PPT之五:kafka连接和spark流实时数据管道
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17500


Spark Summit East 2016 PPT之六:spark and the enterprise
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17501



问答:

hadoop2.7.0 动态添加节点,无法启动datanode和journnode
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17488


IDEA下新建Maven项目,没有自动生成src文件目录,怎么解决?求解,多谢多谢!
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17492


初次接触大数据,不知道怎么学习流程
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17496


Hadoop在Mapper中这2步如何实现?
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17498



创建的实例启动不了,显示..MP-BIOS bug: 8254 timer not connected to IO-APIC
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17497


openstac创建centos虚机,在虚机上构建ovs,无法获取ip地址
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17499






about云2016年03月01日每日一读


大数据架构的未来
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17483


什么是真正的程序员
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17484

BlockManager原理和源码解密
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17482
1.BlockManager原理是怎么样?
2.怎么在源码中解析BlockManager?


资源:

Spark Summit East 2016 PPT之三:Spark at Bloomberg:Dynamic Composable Analytics
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17485


Spark Summit East 2016 PPT之四:Monte Carlo Simulations in Ad lift Measuremen...
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17486





问答:

用Spark读写Hbase出现Task not serializable
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17476


使用官方原版flume写日志到HDFS异常
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17477


hadoop、hbase 、spark  我该选哪个呢?
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17478


请教一个 集群机器分配部署问题
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17480






about云2016年02月28日每日一读


我所经历的大数据平台发展史(下篇)
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17468
1.非互联网时代的数据模型是什么样的?
2.怎样设计数据模型?
3.设计数据模型的阶段有哪些?





我需要学习 R 吗?
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17447
1.为什么选择R?
2.R是什么?有什么用途?
3.使用R会出现什么问题?


从大数据的风水图,来看到底大数据是怎么回事
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17451
1.企业级技术与大数据有什么关系?
2.大数据目前生态系统怎么样?
3.大数据目前应用状态?


HBase – 并发控制机制解析
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17460
1.HBase同步机制是什么?
2.HBase行锁是怎样实现的?
3.HBase怎样实现数据的读写并发控制?



Facebook 广告系统背后的Pacing算法
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17464
1.在线广告术语有哪些?
2.Facebook Pacing算法是怎么工作的?



TEZ运行时重置reduce个数
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17465
1.tez在性能优化方面做了哪些努力?
2.运行时reduce个数的动态调整是如何实现的呢?


提升R代码运算效率的11个实用方法
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17469
1.怎样简单的逻辑调整设计处理1亿行以上的数据集?
2.怎样并行处理1亿行以上的数据集?
3.怎样利用Rcpp处理1亿行以上的数据集?



使用hadoop2.x RPC框架通讯
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17461




有关“非计算机专业如何转行做程序员”的一点思考
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17455


Google引入云函数(Cloud Functions)服务
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17459

2016年about云02月第04周经典帖子总结
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17473




资源:

Spark Summit East 2016 PPT之一:Office 365 spark
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17470


Spark Summit East 2016 PPT之二:Distributed TIme Travel for Feature Generation
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17472




问答:
安装IDEA,启动时出现错误,求大神解答,万分感谢!
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17457


如何通过debug方式跟踪阅读Hadoop和hbase源码
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17467


咨询)我该如何区别已经部署的opensatck是哪个版本的?
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17474



mr任务输入多个文件的情况
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17440


关于hbase+phoenix 和 hive的问题
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17446


CDH spark无法正常安装
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17449


rdd.saveAsHadoopDataset(jobConf),不能将数据存入hbase,
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17450


搭建openstack-keyston同步数据库时出现以下报错信息
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17458


无法启动Hive,输入bin/hive后出现如下内容,跪求各位骨灰级前辈解答T_T
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17462




about云2016年02月26日每日一读

我所经历的大数据平台发展史(一):非互联网时代 • 上篇
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17435


经典大数据架构案例:酷狗音乐的大数据平台重构
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17437


资源:
Java程序员面试宝典
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17438


hadoop官网帮助手册【第二版】
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17158



问答:

使用CDH添加datanode角色失败
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17432



如何搭建信息时代的大数据分析平台
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17429



创建了租户网络,启动云主机Ping不通,无日志显示,控制台显示不正常
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17431


CDH5.5.2 安装异常
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17433


hadoop2 运行报错 Unable to close file because the last block does not have en...
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17434



about云2016年02月25日每日一读


Java HashMap工作原理及实现
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17420

1.什么时候会使用HashMap?他有什么特点?
2.你知道HashMap的工作原理吗?
3.你知道get和put的原理吗?equals()和hashCode()的都有什么作用?



Spark Streaming实践和优化
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17421
1.什么是Spark Streaming?
2.Spark Streaming如何在Hulu应用?
3.Spark Streaming如何优化?




用redis实现有优先级的"celery"
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17418
1.  celery可以处理异步任务,为什么还需要redis?
2.  redis优先队列是怎么回事?
3.  怎么实现任务动态切换?
4.  怎么实现多进程化?





Redis入门系列总结
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17422


小手机玩转大数据时代
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17423


hadoop入门:第十一章hadoop配置
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17424


hadoop官网帮助手册
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17427



资源:

大运NOSQL系统设计的思考
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17425


360HDFS下载平台介绍
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17426



about云2016年02月24日每日一读

Elasticsearch与Solr有什么区别
http://www.aboutyun.com/thread-17406-1-1.html
1、什么是Elasticsearch、Solr?
2、Elasticsearch与Solr各有什么优势?
3、其他基于Lucene的开源搜索引擎解决方案都有什么?



大型网站架构系列:电商网站架构案例
http://www.aboutyun.com/thread-17407-1-1.html
1、电商网站考虑的客户需求有哪些?
2、网站架构如何演变的?
3、电商架构优化需考虑哪些内容?


大数据分析工具能否拯救贺岁片口碑?
http://www.aboutyun.com/thread-17409-1-1.html

使用hadoop+中文分词统计小说里的用词频率
http://www.aboutyun.com/thread-17410-1-1.html
1.使用hadoop+中文分词统计小说里的用词频率本文是如何实现的?
2.本文基于什么环境?
3.如何在IDEA创建项目?
4.如何在IDEA运行项目?


资源:


Python 数据分析【英文版】
http://www.aboutyun.com/thread-17414-1-1.html

在CentOS6 64上用构建HDFS分布式文件系统【hadoop2.7】
http://www.aboutyun.com/thread-17415-1-1.html

问答:

CDH安装Hadoop出现的问题,请教高手。
http://www.aboutyun.com/thread-17416-1-1.html


rabbitmq-server的服务排障
http://www.aboutyun.com/thread-17413-1-1.html

hbase的查询过程和对hive的映射
http://www.aboutyun.com/thread-17411-1-1.html




about云2016年02月23日每日一读

hadoop入门:第九章hadoop认证
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17398&extra=

Hadoop十岁!Doug Cutting成长史+他眼中大数据技术的未来
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17400&extra=
1.认识 Doug Cutting,hadoop之父吗?
2.hadoop的发展经历了哪些阶段?
3.hadoop的未来会是什么?



Redis入门8--Redis主从复制与分布式
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17401&extra=
1.什么是主从复制?
2.什么是Redis的分布式模式?
3.集群模式存在的问题有哪些?



hadoop入门:第十章hadoop工具
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17402&extra=
1.hadoop有哪些工具?
2.hadoop流的作用是什么?
3.hadoop集群负载如何模拟?
4.hadoop数据提取和分析工具是哪个?



资源:

Fuel6.0之OpenStack Juno
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17403&extra=

Linux命令大全完整版
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17404&extra=

问答:

jobtracker 里面的Task Failures过多
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17395&extra=

为何Openstack的路由网关只能设在外部网络上?子网之间不能互加路由么?
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17396&extra=

hive 查询报错
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17397&extra=

swift stat执行出错
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17399&extra=




about云2016年02月22日每日一读

Redis入门6--Redis发布/订阅
http://www.aboutyun.com/thread-17384-1-1.html
1.Redis发布订阅(pub/sub)是什么?
2.Redis发布订阅(pub/sub)有哪些功能?
3.怎样用JAVA实现Redis发布订阅(pub/sub)?


Redis入门7--Redis持久化
1.Redis支持哪几种持久化方式?
2.Redis默认的持久化方式是什么?
3.Redis持久化的原理是什么?


程序员如何向老板提出加薪的要求?
1.程序员如何向老板提出加薪?
2.真正加薪的原因是什么?
3.提加薪之前需要做哪些功课?


hadoop入门:第七章YARN REST APIs


人工智能的今天
1.什么是人工智能?
2.人工智能将可能会带来哪些威胁?
3.什么是机器学习?


hadoop入门:第八章hadoop兼容文件系统


2016年about云02月第04周经典帖子总结


资源:

最全的大数据解决方案


hadoop-eclipse-plugin插件--hadoop2.6,hadoop2.7.1


问答:

jstorm运行失败
http://www.aboutyun.com/thread-17383-1-1.html

/etc/hadoop/* directory and /var/run/cloudera-scm-agent/process/* directory






about云2016年02月20日每日一读

Redis入门5--Redis事务与Redis管道(pipeline)
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17378
1.redis怎么样处理事务?
2.redis管道有什么作用?
3.如何测试redis事务与管道功能?

Redis入门4--Redis排序
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17377
1.sort key有什么作用?
2.redis有几种常用排序方法?
3.redis排序要注意什么问题?


资源:

分布式存储系统的要点
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17380

hadoop Erasure Code
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17381



问答:

HDFS EC相关
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17373


【新人贴求助】kafkaChannel实践遇到的问题
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17374


spark jobhistory问题
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17376


mysql 存储格式如何修改
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17379





about云2016年02月19日每日一读

数据挖掘的常用方法、功能和一个聚类分析应用案例
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17360
1.数据挖掘的常用方法有哪些?
2.数据挖掘的功能有哪些?
3.数据挖掘的聚类怎么应用?


Redis入门3--Redis键值设计和Redis数据存储优化机制
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17361
1.Redis键值怎么设计?
2.Redis数据存储优化机制是什么样?



资源:

ceph_性能调优
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17369


Scala编程学习:快捷入门Scala编程【英文版】
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17370




问答:

mysql能否进行大规模数据存储
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17354


如何从单节点换为ha结构
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17355


sparkSQL 错误输出
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17356


CDH 域名解析错误问题求助
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17357


cloudera manager上如何设置hive on tez
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17358


kafkaoffsetmonitor 访问异常
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17359


hbase集成phoenix报错问题
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17363


spark SSH端口问题
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17365


实时数据缓存清理问题
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17366


mysql Index 如何检索内容
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17367


这么让root用户jps显示所有的java进程?
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17368






about云2016年02月18日每日一读

Redis入门1--入门篇
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17346
1.什么是Redis?
2.Redis如何安装?
3.Redis客户端有哪些?




Redis入门2--Redis数据类型及相关命令
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17347
1.Redis中keys的相关命令?
2.Redis中string的相关命令?
3.Redis中list的相关命令?




资源:

数据可视化及NEV
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17351


大数据时代的数据银行
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17352



问答:

有用openshift的达人吗
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17344


用oozie提交spark 任务报错
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17345


订阅推送?
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17348


mapreduce的shuffle过程
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17349


spark 无法启动ClassNotFoundException: org.apache.hadoop.conf.Configuration
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17350



about云2016年02月17日每日一读

hadoop入门:第五章MapReduce REST APIs文档概述
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17332


hadoop入门:第六章YARN文档概述
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17338



Twitter的用户推荐算法
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17333
1、Twitter的用户推荐算法是什么?
2、新浪微博的用户推荐类型有什么?
3、Twitter的算法主要关注哪些方面?





Netflix推荐系统:从评分预测到消费者法则
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17331
1、Netflix大奖赛与推荐系统有何渊源?
2、Netflix推荐系统用到哪些机器学习算法?
3、什么事消费者法则?



使用Python实现Hadoop MapReduce程序
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17334
1、Python实现MapReduce程序需要哪些基础?
2、如何使用python实现wordcount程序?



资源:

hadoop应用案例
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17340


CentOS6.5+OpenStack+kvm云平台部署
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17341




问答:

novnc server disconnected (code: 1006)问题
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17330


spark-sql 数据缺失
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17337



about云2016年02月16日每日一读

hadoop入门:第四章mapreduce文档概述
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17319


秒杀系统架构分析与实战
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17322
1.秒杀业务如何分析?
2.秒杀业务有哪些挑战?
3.秒杀业务框架的原则是什么?



Cloudera配置开发环境
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17323
1.如何用Cloudera进行搭建?
2.如何选择相关的maven坐标?





资源:

机器学习英文版-Thoughtful Machine Learning【235页】
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17324


RHEL6.6分布式文件系统方案--ceph-pub
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17325



问答:

/etc/neutron/plugins/ml2/linuxbridge_agent.ini有一个参数不明白
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17320


spark  java.io.IOException: java.lang.reflect.InvocationTargetException
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17321




about云2016年02月15日每日一读


hadoop入门:第三章HDFS文档概述(二)
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17316



Centos7下部署ceph
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17312
1.Centos7怎样配置网络?
2.Centos7怎样实现ssh无密码登录?
3.怎样用ceph-deploy部署集群?



shell awk 检查程序是否执行
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17313
1.Linux中怎样判断某一进程是不是运行?
2.Linux中怎样倒排序查看,服务器各类进程数?
3.Linux中怎样利用awk检查程序是否执行?




资源:

Openstack的Hadoop整合实践
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17314


spring2.5-中文参考手册
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17315



问答:

小白问题---openstack中虚拟机和instance的区别
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17311


mapreducer里的ChainMapper.addMapper
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17317



about云2016年02月14日每日一读

hadoop2.7.2发布
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17300


hadoop入门:第三章HDFS文档概述
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17301


hadoop官网帮助手册:第三章hadoop视图文件系统指南
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17303


hadoop官网帮助手册:第三章HDFS 用户手册
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17304


hadoop官网帮助手册:第三章HDFS快照(HDFS Snapshots)
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17305


hadoop官网帮助手册:第三章HDFS架构(Apache Hadoop 2.1.1-beta)
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17306



hadoop官网帮助手册:第三章离线Edits 阅读器指南
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17307







资源:
大话设计模式带目录完整版
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17309


Openstack 私有云平台搭建(rdo)及KVM基本使用交流
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17308



python从入门到精通视频(全60集)
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17298




问答:

咨询)我们aboutyun的翻译小组在哪
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17297


求助:如何对含有千万条数据的文件进行join合并?
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17302



about云2016年02月06日每日一读

最详细的深度学习硬件指南
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17290
1.深度学习如何选择硬件?
2.CPU能为深度学习做什么?
3.如何寻找合适的RAM频率?



8个提高机器学习模型的准确率的方法
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17291
1.本文讲了哪8个方法?
2.各个方法各有什么特点?




资源:

移动互联网大数据关键技术
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17292


腾讯大数据秘籍;大数据下的移动精细化运营
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17293




about云2016年02月05日每日一读


HBase 协处理器编程详解第一部分:Server 端代码编写
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17285
1.编写 Coprocessor 流程和开发环境需要哪些准备?
2.部署协处理器有哪三种方法?



HBase 协处理器编程详解,第二部分:客户端代码编写
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17286
1.HBase 协处理器客户端Java包是哪个?
2.HBase  coprocessorService 方法是否允许用户定义 callback 行为?
3.调用多个 Region 上的协处理器是否使用callback?



资源:

中国DT城市智能服务指数研究报告
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17287


大数据并行计算框架
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17288



问答:

hive如何与Cassandra整合
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17283


CDH 5.5.1 Installation 离线方式 安装报错
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17284



about云2016年02月04日每日一读


Spark SQL+Hive历险记
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17277
1.Spark SQL接口是什么?
2.sbt的依赖有哪些?
3.
Spark SQL + Hive + Hbase方式集成 操作是什么?



大数据分析的几个案例
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17278


7种最常见的Hadoop和Spark项目
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17279





资源:

名企大数据架构简介学习(淘宝、雅虎、暴风)
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17272


时空大数据环境下的大电网稳定态势量化评估与自适应防控体系构建_刘道伟
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17280


时空大数据分析技术在传染病预测预警中的应用_屈晓晖
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17281




问答:
java连接Hbase时程序一直堵塞
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17270


ceph cluster操作命令
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17271


hive的元数据库mysql配置后建table报错
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17274


Journal 日志配置参考
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17275


Flume close .tmp failed
http://www.aboutyun.com/forum.php?mod=viewthread&tid=17276






about云2016年02月03日每日一读

从技术细节看美团的架构
http://www.aboutyun.com/thread-17251-1-1.html
1、美团架构是如何变化的?
2、美团如何优化架构和业务?
3、美团业务如何运用大数据技术?



Spark Streaming使用Kafka保证数据零丢失
http://www.aboutyun.com/thread-17253-1-1.html
1、spark streaming 1.2 数据零丢失有什么特性?
2、数据可能丢失的场景都有什么?
3、spark streaming 1.3中使用Kafka direct API有什么优势?






资源:
百度大数据架构
http://www.aboutyun.com/thread-17252-1-1.html



对地观测大数据处理 挑战与思考
http://www.aboutyun.com/thread-17265-1-1.html


[超图研究所]面向时空大数据的GIS技术探索与实践-2015地理资源所博士后年会 -王少华
http://www.aboutyun.com/thread-17266-1-1.html


hadoop分布式系统模型分析
http://www.aboutyun.com/thread-17255-1-1.html



问答:
关于About那点事
http://www.aboutyun.com/thread-17250-1-1.html



学hadoop有什么推荐的书籍?
http://www.aboutyun.com/thread-17262-1-1.html


create image时  copy data是什么意思?
http://www.aboutyun.com/thread-17254-1-1.html


Openstack初学者经验分享!!!
http://www.aboutyun.com/thread-17256-1-1.html


学习hadoop要哪些条件呢?有人在学这个吗?
http://www.aboutyun.com/thread-17257-1-1.html


hadoop学习视频有哪些呢?网上能找到吗?
http://www.aboutyun.com/thread-17258-1-1.html


hadoop对于零基础的人学习很难吗?
http://www.aboutyun.com/thread-17259-1-1.html



hadoop小白们,大数据培训你们都是怎么选择机构的
http://www.aboutyun.com/thread-17260-1-1.html


有比较系统的hadoop学习视频吗?哪位晓得呢?
http://www.aboutyun.com/thread-17261-1-1.html





about云2016年02月02日每日一读


精益企业中架构师的角色
http://www.aboutyun.com/thread-17244-1-1.html
1.架构师应该考虑些什么?
2.如何寻找改变的机会?
3.为什么要构建学习社区?


使用Redis作为时间序列数据库:原因及方法
1.什么是竞态与事务?
2.如何保存事务?
3.如何解决性能问题?



资源:

hadoop-eclipse-plugin-2.7.0.jar插件分享
http://www.aboutyun.com/thread-17241-1-1.html

Git权威指南
http://www.aboutyun.com/thread-17246-1-1.html

编写高质量代码:改善Java程序的151个建议
http://www.aboutyun.com/thread-17247-1-1.html

问答:

flume收集rsyslog日志配置
http://www.aboutyun.com/thread-17243-1-1.html

hbase 读性能都是在毫秒级别吗
http://www.aboutyun.com/thread-17248-1-1.html




about云2016年02月01日每日一读

2016年about云01月第05周经典帖子总结
http://www.aboutyun.com/thread-17239-1-1.html


tez本地切分方式和AM端切分方式的区别
http://www.aboutyun.com/thread-17234-1-1.html
1.tez的任务切分方式和MR有什么不同?
2.tez有哪些可选的切分方式?
3.不同的切分方式各有什么优缺点?为什么默认情况下选择在AM Container端切分?
4.切分相关的重要参数有哪些?

探索大数据的商业价值
http://www.aboutyun.com/thread-17237-1-1.html
1.怎样使庞大的机器数据变得可见、可用、更具商业价值?
2.怎样从海量机器数据中提取有价值的信息,并进行实时分析和展现?


使用R进行机器学习(一)
http://www.aboutyun.com/thread-17238-1-1.html
1.为什么用R进行机器学习?
2.R语言的特点有哪些?
3.怎样用R做机器学习?


资源:

深入理解Java虚拟机【书籍】
http://www.aboutyun.com/thread-17235-1-1.html

IBM大数据解决方案
http://www.aboutyun.com/thread-17236-1-1.html

问答:

困惑了一周的hive 查询 ,mapreduce 报错问题,续
http://www.aboutyun.com/thread-17232-1-1.html

有关DataNode内存配置
http://www.aboutyun.com/thread-17233-1-1.html




about云2016年01月31日每日一读


Kafka 的优化及在商业平台中的应用
http://www.aboutyun.com/thread-17229-1-1.html
1.怎样保证保证Kafka端到端的消息可靠性?
2.怎样防止由于越权导致数据方面的问题?
3.怎样设计Kafka应用架构?


手把手教你用Python抓取AWS的日志(CloudTrail)数据
http://www.aboutyun.com/thread-17230-1-1.html
1.怎样配置配置CloudTrail?
2.怎样读取读取SQS消息?
3.怎样从消息中获得响应的日志文件在S3中的地址?


资源:

程序开发心理学
http://www.aboutyun.com/thread-17227-1-1.html

云环境下海量小文件存储技术研究综述_周国安
http://www.aboutyun.com/thread-17228-1-1.html

问答:

求各位专家指点
http://www.aboutyun.com/thread-17226-1-1.html




about云2016年01月30日每日一读


数据科学家每天都在做些什么?
http://www.aboutyun.com/thread-17218-1-1.html
1.科学家是怎么样的生活?
2.科学家每天必须要做什么事情?
3.科学家会使用什么工具?


Hadoop 压缩实现分析
http://www.aboutyun.com/thread-17219-1-1.html
1.什么叫做解压流与解压缩流?
2.hadoop下压缩方法有哪些?
3.压缩框架有哪些?



hive中group by总结
http://www.aboutyun.com/thread-17223-1-1.html

资源:

华为海量视频解决方案
http://www.aboutyun.com/thread-17220-1-1.html

华为金融行业大数据实践分享
http://www.aboutyun.com/thread-17221-1-1.html

问答:

使用hbase coprocessor测试二级索引未生效,求检查
http://www.aboutyun.com/thread-17215-1-1.html

困惑了一周的hive 查询 ,mapreduce 报错问题,求大神解救
http://www.aboutyun.com/thread-17216-1-1.html

hive group by语句的问题
http://www.aboutyun.com/thread-17217-1-1.html

关于“Hadoop大数据处理和Hadoop数据仓库”二者关系的疑问
http://www.aboutyun.com/thread-17222-1-1.html

*求大师指点* 如何将HDFS中的数据安全迁移到swift上。
http://www.aboutyun.com/thread-17224-1-1.html




about云2016年01月29日每日一读

Hadoop平台架构--硬件篇
http://www.aboutyun.com/thread-17211-1-1.html
1.什么决定集群规模?
2.硬件配置如何选择?
3.Hadoop版本如何选择?
4.节点该如何分配?



Hadoop平台架构--存储篇
http://www.aboutyun.com/thread-17212-1-1.html
1.存储格式选择和效率如何权衡?
2.存储如何规划的?
3.为什么走向分布式?



每个架构师都应该研究下康威定律
http://www.aboutyun.com/thread-17205-1-1.html





资源:

机器学习实践指南:案例应用解析
http://www.aboutyun.com/thread-17209-1-1.html


基于HDFS的多用户并行文件IO的设计与实现
http://www.aboutyun.com/thread-17210-1-1.html




问答:

hive无法读取配置文件的问题
http://www.aboutyun.com/thread-17206-1-1.html


cloudera manager怎么添加新主机
http://www.aboutyun.com/thread-17207-1-1.html


HIVE UDTF 简单示例
http://www.aboutyun.com/thread-17213-1-1.html




about云2016年01月28日每日一读

Neutron和SDN集成现状分析
http://www.aboutyun.com/thread-17196-1-1.html
1.什么是Neutron?
2.Neutron有什么主要功能?
3.Neutron如何与SDN集成?


企业级 OpenStack 的六大需求(第 3 部分):弹性架构、全球交付
http://www.aboutyun.com/thread-17198-1-1.html
1.为什么企业级往往和高可靠、高扩展和高性能的高质量系统相关?
2.OpenStack默认使用的网络是个半成品?
3.如何培训你的IT管理员成为新的云管理员?







如何选用一款适合自己的大数据分析工具
http://www.aboutyun.com/thread-17194-1-1.html

离线快速安装分布式kilo版本openstack
http://www.aboutyun.com/thread-17202-1-1.html




问答:

MongoDB 在取String的时候,前面0会丢失的问题
http://www.aboutyun.com/thread-17193-1-1.html


hbase如何实现查字典式的快速查询?
http://www.aboutyun.com/thread-17195-1-1.html


hive与hbase整合的问题
http://www.aboutyun.com/thread-17197-1-1.html


hbase启动后RegionServer自动挂掉,org.apache.hadoop.hbase.tool.Canary
http://www.aboutyun.com/thread-17199-1-1.html


关于云扩展的问题
http://www.aboutyun.com/thread-17201-1-1.html




about云2016年01月27日每日一读

Log4j日志入门
http://www.aboutyun.com/thread-17185-1-1.html
1.什么是log4j ?
2.log4j有哪三个组件?
3.如何配置log4j 配置文件?



MLlib回归算法(线性回归、决策树)实战演练--Spark学习(机器学习)
http://www.aboutyun.com/thread-17183-1-1.html
1、Spark MLlib如何实现线性回归?
2、Spark MLlib如何实现决策树?
3、如何进行性能评估?



MLlib分类算法实战演练--Spark学习(机器学习)
http://www.aboutyun.com/thread-17184-1-1.html
1、如何采用MLlib的方法来实现特征标准化?
2、如何采用MLlib添加类别特征?




注意:

神经网络学习理论基础【英文版400页】
http://www.aboutyun.com/thread-17189-1-1.html



文本挖掘手册【英文版】
http://www.aboutyun.com/thread-17190-1-1.html


问答:

spark的初学Stream开发遇到问题请教
http://www.aboutyun.com/thread-17178-1-1.html


Azure Power Shell 报错namespace无效
http://www.aboutyun.com/thread-17180-1-1.html


分片split和资源容器container之间的关系
http://www.aboutyun.com/thread-17181-1-1.html


大数据时代的数据图书馆
http://www.aboutyun.com/thread-17182-1-1.html


数据可视化其实并不简单
http://www.aboutyun.com/thread-17186-1-1.html


请问有人用过greenplum+hadoop的架构吗?
http://www.aboutyun.com/thread-17187-1-1.html


mapreduce程序中如何把日志打到自己配置在log4j里面的日志文件中?
http://www.aboutyun.com/thread-17188-1-1.html





about云2016年01月26日每日一读

聚焦爬虫原理及其在互联网金融领域应用前景浅析
http://www.aboutyun.com/thread-17177-1-1.html
1.什么是爬虫?
2.本文聚焦爬虫的分为几类?
3.深聚焦爬虫的结构包含哪些内容?



企业级 OpenStack 的六大需求(第 1 部分):API 高可用、管理和安全
http://www.aboutyun.com/thread-17173-1-1.html
1.企业数据中心中的OpenStack是什么?
2.为什么要高可靠的云API?
3.如何健壮的管理?



企业级 OpenStack 的六大需求(第 2 部分):开放架构和混合云兼容
http://www.aboutyun.com/thread-17174-1-1.html
1.什么是消除厂商锁定?
2.混合云如何兼容?
3.OpenStack如何选择参考框架?




资源:
时间序列分析及应用:R语言(原书第2版)
http://www.aboutyun.com/thread-17175-1-1.html


R 数据导入和导出
http://www.aboutyun.com/thread-17176-1-1.html



Spark大数据处理:技术、应用与性能优化
http://www.aboutyun.com/thread-17170-1-1.html




问答:
我想自己买个用于spark的服务器 目前还有几个问题没弄懂 求高手解答
http://www.aboutyun.com/thread-17171-1-1.html


oozie编译报错
http://www.aboutyun.com/thread-17172-1-1.html



neutron router和dhcp namespace,以及floatIP的问题,求指导····
http://www.aboutyun.com/thread-17168-1-1.html


Spark学习
http://www.aboutyun.com/thread-17169-1-1.html




about云2016年01月25日每日一读

Oozie4.2.0配置安装实战
http://www.aboutyun.com/thread-17159-1-1.html
1.怎样安装Oozie?
2.怎样配置任务流程?
3.spark 提交和spark on yarn 方式的区别是什么?


大数据:-JStorm经验总结
1.什么是JStorm?
2.Jstorm/storm优点有哪些?
3.Jstorm应用场景有哪些?


2016年about云01月第04周经典帖子总结


hadoop官网帮助手册:前言
http://www.aboutyun.com/thread-17157-1-1.html


资源:

hadoop官网帮助手册
http://www.aboutyun.com/thread-17158-1-1.html

CDH集群部署手册
http://www.aboutyun.com/thread-17164-1-1.html


问答:

求大神指导一下建的实例windows控制台显示dns无法解析但是能ping通
http://www.aboutyun.com/thread-17156-1-1.html

spark代码阅读,导入idea失败
http://www.aboutyun.com/thread-17166-1-1.html


HBase-1.0.1.1的Java API使用记录【分享】


HBase-1.0.1.1 编写Coprocessor【分享】


HBase条件查询



about云2016年01月24日每日一读

老于聊架构:为什么说架构是一种思维模式
http://www.aboutyun.com/thread-17152-1-1.html
1.为什么要做架构?
2.如何做架构?
3.架构是什么?


Spark Core 问题详解
http://www.aboutyun.com/thread-17151-1-1.html
1.Spark 1.4为什么Master 经常挂掉?
2.为什么只有少数 Executor 在运行,别的 Executor 长时间空闲?
3.Spark 如何支持多用户?


资源:

云计算环境下海量数据挖掘的研究_谢志明

社交云平台下用户行为分析的研究

问答:

openstack horizon&ceilometer开发
http://www.aboutyun.com/thread-17149-1-1.html

求大神指教 glance上传镜像失败 我的环境是ubuntu kilo 一个控制两个计算内存
http://www.aboutyun.com/thread-17147-1-1.html

如何减少后台日志输出
http://www.aboutyun.com/thread-17150-1-1.html




about云2016年01月23日每日一读

大数据时代中的“数据化新闻”
http://www.aboutyun.com/thread-17123-1-1.html

负载均衡之Nginx+tomcat+redis实现session共享的负载均衡
http://www.aboutyun.com/thread-17124-1-1.html
1.怎么样使用软负载实现session共享?
2.怎么样配置tomcat,nginx应用服务器?
3.怎么样搭建session共享环境?



Openstack虚拟机镜像深度实践
http://www.aboutyun.com/thread-17125-1-1.html
1.怎么样制作镜像?
2.怎么样测试镜像?
3.镜像的原理和工作流程是怎么样的?


hadoop入门-第一章General:第一节单节点伪分布
http://www.aboutyun.com/thread-17132-1-1.html
1.从本文部署实际部署,总结本地模式、伪分布、分布式的区别是什么?
2.单机是否是伪分布?
3.本地模式是否可以运行mapreduce?



hadoop入门-第一章General:第二节集群配置
http://www.aboutyun.com/thread-17133-1-1.html
1.说说你对集群配置的认识?
2.集群配置的配置项你了解多少?
3.下面内容让你对集群的配置有了什么新的认识?


hadoop入门-第一章General:第三节Hadoop初级入门之命令指南
http://www.aboutyun.com/thread-17134-1-1.html
1.hadoop daemonlog管理员命令的作用是什么?
2.hadoop如何运行一个类,如何运行一个jar包?
3.hadoop archive的作用是什么?


hadoop入门-第一章General:第四节文件系统shell
http://www.aboutyun.com/thread-17135-1-1.html
1.Hadoop文件系统shell与Linux shell有哪些相似之处?
2.如何改变文件所属组?
3.如何改变hdfs的文件权限?
4.如何查找hdfs文件,并且不区分大小写?


hadoop入门-第一章General:第五节hadoop的兼容性说明
http://www.aboutyun.com/thread-17136-1-1.html
1.根据下文hadoop2.1.1客户端与hadoop2.4.0集群是否可以通信?
2.hadoop2.4.0客户端与hadoop2.3.0集群【服务器】是否可以通信?
3.升级后集群,hdfs,mapreduce,yarn程序是否需要修改?
4.hadoop单独组建是否可以升级?
5.hadoop主版本升级后,如flume是否受影响?


hadoop入门-第一章General:第六节开发人员和用户接口指南:hadoop接口分类
http://www.aboutyun.com/thread-17137-1-1.html
1.hadoop接口分为哪两类?
2.audience分为几类,具体有哪几类?
3.Stability有哪些分类?
4.对于audience和Stability你是如何理解的?


hadoop入门-第一章General:第八节Hadoop 文件系统 API :概述
http://www.aboutyun.com/thread-17138-1-1.html

hadoop入门-第二章common:第一节hadoop 本地库 指南
http://www.aboutyun.com/thread-17139-1-1.html
1.hadoop本地库支持哪些平台?
2.本地库是否有32,64之分?
3.hadoop通过什么工具来检测本地库是否加载正确?
4.如何加载本地库?包含哪些步骤?
5.本地库在什么情况下不需要使用DistibutedCache?


hadoop入门-第二章common:第二节hadoop代理用户 -超级用户代理其它用户
http://www.aboutyun.com/thread-17140-1-1.html
1.你认为什么情况下使用代理用户?
2.代理用户与普通用户的区别是什么?
3.如何配置超级用户代理其它用户?


hadoop入门-第二章common:第三节机架智能感知
http://www.aboutyun.com/thread-17141-1-1.html
1.Hadoop组件机架感知的作用是什么?
2.拓扑信息以什么格式保存,各自的含义是什么?
3.hadoop master保存slave集群机架id由哪两种方式,该如何配置?
4.如何指定Java类实现拓扑映射?


hadoop入门-第二章common:第四节安全模式说明
http://www.aboutyun.com/thread-17142-1-1.html
1.什么是Kerberos Principal?
2.Hadoop守护进程是否使用不同的用户?
3.各个守护进程keytab 文件各有什么特点?区别在什么地方?



hadoop入门-第二章common:第五节服务级别授权指南
http://www.aboutyun.com/thread-17143-1-1.html
1.hadoop默认是否启用服务级别授权?
2.访问控制列表该如何配置?
3.访问控制列表的格式是什么?
4.如何刷新服务级别授权配置?是否需要重启?


hadoop入门-第二章common:第六节Hadoop HTTP web-consoles认证机制
http://www.aboutyun.com/thread-17144-1-1.html
1.如何配置 Hadoop HTTP web-consoles 所需要的用户身份验证?
2.哪个配置文件可以配置 Hadoop HTTP认证?
3.hadoop.http.authentication.type的默认值是什么?
4.你认为Hadoop HTTP web认证的价值是什么?


hadoop入门-第二章common:第七节Hadoop Key管理服务器(KMS) - 文档集
http://www.aboutyun.com/thread-17145-1-1.html
1.Hadoop KMS是什么?
2.如何启动/停止KMS?
3.KMS的安全如何配置?


资源:

Hadoop云平台的入侵检测系统优化设计
http://www.aboutyun.com/thread-17130-1-1.html

Zookeeper可视化工具
http://www.aboutyun.com/thread-17131-1-1.html


问答:

regionserver无法启动错误
http://www.aboutyun.com/thread-17122-1-1.html

Exception while invoking getBlockLocations of class
http://www.aboutyun.com/thread-17126-1-1.html

hadoop在非联网的情况下无法编译?
http://www.aboutyun.com/thread-17127-1-1.html

kilo Lbaas安装后无法正常运行
http://www.aboutyun.com/thread-17129-1-1.html





about云2016年01月22日每日一读

30岁的程序员,你迷惘了吗?
http://www.aboutyun.com/thread-17117-1-1.html


Spark的性能调优
http://www.aboutyun.com/thread-17118-1-1.html
1.spark如何增加CPU利用率?
2.partition是什么?
3.并行的executor的数量,有哪两种方式?




资源:
使用_Hive_构建数据库和数据仓库
http://www.aboutyun.com/thread-17119-1-1.html


云计算HIVE使用
http://www.aboutyun.com/thread-17120-1-1.html



Hadoop权威指南(中文版)
http://www.aboutyun.com/thread-17106-1-1.html



问答:
关于从oracle表到hbase表的设计问题?
http://www.aboutyun.com/thread-17116-1-1.html



neutron agent-list 看不到computer的linuxbridge怎么办
http://www.aboutyun.com/thread-17107-1-1.html


HBASE插入数据但是phoenix查询主键为空
http://www.aboutyun.com/thread-17108-1-1.html


菜鸟学习OpenStack部署
http://www.aboutyun.com/thread-17109-1-1.html


导入hbase的表之间有字段冲突怎么解决?
http://www.aboutyun.com/thread-17110-1-1.html


hbase怎么方便直观的查看表里面的数据呢~
http://www.aboutyun.com/thread-17111-1-1.html


l3-agent 有个错误请看下
http://www.aboutyun.com/thread-17113-1-1.html


大数据时代的数据价值与利用
http://www.aboutyun.com/thread-17114-1-1.html


mapreduce hbase实现云存储
http://www.aboutyun.com/thread-17115-1-1.html





about云2016年01月21日每日一读

爬虫的常见陷阱以及Java的爬虫思路
http://www.aboutyun.com/thread-17100-1-1.html
1.网络爬虫的基本原理是什么?
2.什么是Jsoup?

3.爬虫的难点都有什么?


MapReduce过程、Spark和Hadoop以Shuffle为中心的对比分析
http://www.aboutyun.com/thread-17101-1-1.html
1.mapreduce过程如何解析?
2.Spark Shuffle过程如何解析?

3.hash-based 与sort-based的对比?



资源:

Hive开发规范、最佳实践
http://www.aboutyun.com/thread-17103-1-1.html


hive开发资料
http://www.aboutyun.com/thread-17104-1-1.html


问答:
HBase启动后马上挂掉,求解决!
http://www.aboutyun.com/thread-17095-1-1.html


执行DataFrame.count的时候遇到的问题,求大神帮忙
http://www.aboutyun.com/thread-17096-1-1.html


hadoop群集坏一块硬盘,更换硬盘遇到问题总结【工作总结】
http://www.aboutyun.com/thread-17097-1-1.html


大数据分析工具即将改变我们的生活
http://www.aboutyun.com/thread-17098-1-1.html


hive查询一个奇怪的问题
http://www.aboutyun.com/thread-17099-1-1.html


hive执行查询出现:org.apache.hadoop.hive.ql.metadata.HiveException: Hive Runt...
http://www.aboutyun.com/thread-17102-1-1.html




about云2016年01月20日每日一读


最火搜索引擎:ElasticSearch详解与优化设计
http://www.aboutyun.com/thread-17078-1-1.html
1、什么是ElasticSearch?
2、ElasticSearch有什么作用?
3、如何优化ElasticSearch?




淘宝商品详情平台化思考与实践
http://www.aboutyun.com/thread-17079-1-1.html
1、什么是平台?
2、模块与平台的关系是什么?
3、设计平台应考虑哪些方面?





资源:

优酷:基于Spark的实时用户画像分析系统-汪飞-1027
http://www.aboutyun.com/thread-17087-1-1.html



Spark入门之运行wordcount
http://www.aboutyun.com/thread-17088-1-1.html




问答:
java  api中得到一个用户的hdfs的剩余空间,和总空间,怎么办
http://www.aboutyun.com/thread-17092-1-1.html



关于sqoop把oracle的数据导入hive,数据类型的问题
http://www.aboutyun.com/thread-17090-1-1.html



spark处理1亿行的数据耗时应为多少?
http://www.aboutyun.com/thread-17085-1-1.html


HBase二级索引用自带的coprocessor实现还是用sorl实现比较好?
http://www.aboutyun.com/thread-17074-1-1.html


[求助]启动slaves节点的NodeManager无法启动
http://www.aboutyun.com/thread-17075-1-1.html


hive启用ACID后的性能损失
http://www.aboutyun.com/thread-17076-1-1.html


suse11下无法启动Glances
http://www.aboutyun.com/thread-17077-1-1.html


如何让你的可视化更动人
http://www.aboutyun.com/thread-17080-1-1.html


大数据分析平台给社会带来了更多选择
http://www.aboutyun.com/thread-17086-1-1.html


java中的double精度,sqoop从oracle导出到hive
http://www.aboutyun.com/thread-17091-1-1.html





about云2016年01月19日每日一读

大数据分析师——站在时代顶端的人
http://www.aboutyun.com/thread-17064-1-1.html


Hadoop Key管理服务器(KMS) - 文档集
http://www.aboutyun.com/thread-17044-1-1.html
1.Hadoop KMS是什么?
2.如何启动/停止KMS?
3.KMS的安全如何配置?

程序员保持健康的7个秘诀
http://www.aboutyun.com/thread-17067-1-1.html
1.程序员如何保持健康呢?
2.要学会“失联”?
3.容易忽略的方面,你中招了吗?


远程接口设计经验分享
http://www.aboutyun.com/thread-17068-1-1.html
1.远程接口的系统架构是什么?
2.什么是RPC调用?
3.为什么要有Client层?



资源:

基于MapReduce_的分布式光线跟踪的设计与实现
http://www.aboutyun.com/thread-17070-1-1.html

GDB学习资料
http://www.aboutyun.com/thread-17072-1-1.html


hadoop版本差异详解
http://www.aboutyun.com/thread-17069-1-1.html


问答:

hue高手请进
http://www.aboutyun.com/thread-17065-1-1.html

run_psw@163.com
http://www.aboutyun.com/thread-17062-1-1.html

centos7搭建L版本,实例创建问题
http://www.aboutyun.com/thread-17061-1-1.html

launch instance
http://www.aboutyun.com/thread-17066-1-1.html

Safe mode is ON
http://www.aboutyun.com/thread-17071-1-1.html




about云2016年01月18日每日一读

程序员的知识管理
http://www.aboutyun.com/thread-17056-1-1.html
1.什么是知识管理?
2.为什么要管理知识?
3.如何管理知识?



Apache Spark DataFrames入门指南:操作DataFrame
http://www.aboutyun.com/thread-17057-1-1.html
1.怎样对DataFrame里面的数据进行采样?
2.怎样查询DataFrame里面的数据?
3.怎样将DataFrame保存成文件?


2016年about云01月第03周经典帖子总结
http://www.aboutyun.com/thread-17058-1-1.html


资源:

SPARK-RDD-API
http://www.aboutyun.com/thread-17053-1-1.html

大数据计算平台Spark内核全面解读
http://www.aboutyun.com/thread-17054-1-1.html


问答:

Spark的Partition是如何形成的?
http://www.aboutyun.com/thread-17052-1-1.html

glance上传image失败,新手请教
http://www.aboutyun.com/thread-17055-1-1.html




about云2016年01月17日每日一读

深度学习入门,以及它在物联网和智慧城市中的角色
http://www.aboutyun.com/thread-17045-1-1.html
1.什么是深度学习?
2.计算机如何学习?
3.深度学习算法如何学习?




手机淘宝推荐中的排序学习
http://www.aboutyun.com/thread-17046-1-1.html
1.用户的Session 特征 怎么办?
2.怎样结合业务实例设计推荐系统?
3.怎样优化推荐系统?



资源:

Apache_Hive入门
http://www.aboutyun.com/thread-17048-1-1.html



Hadoop安全总体架构设计建议
http://www.aboutyun.com/thread-17049-1-1.html




问答:

整理讨论:一个hadoop集群中,如果节点的内存偏小,在处理一些大文件任务时,是时...
http://www.aboutyun.com/thread-17047-1-1.html


数据挖掘和机器学习的区别和联系
http://www.aboutyun.com/thread-17050-1-1.html




about云2016年01月16日每日一读

献给初学者:谈谈如何学习Linux
http://www.aboutyun.com/thread-17037-1-1.html
1.linux有什么作用?为什么要学习linux?
2.linux在各领域的发展怎么样?
3.怎么样循序渐进学习linux?



OpenStack实战系列:深入探秘Neutron API
http://www.aboutyun.com/thread-17039-1-1.html
1.Neutron API的运行机制是怎么样的?
2.如何为Neutron API增加WSGI APP资源?
3.Neutron API文件结构是怎么样的?


MongoDB MapReduce速度提升20倍的优化宝典
http://www.aboutyun.com/thread-17040-1-1.html

资源:

数据挖掘十大算法及案例
http://www.aboutyun.com/thread-17041-1-1.html

机器学习与数据挖掘基础
http://www.aboutyun.com/thread-17042-1-1.html

问答:

MapReduce中使用Mongodb查询数据特别慢
http://www.aboutyun.com/thread-17038-1-1.html

eclipse中写mapreduce程序,请小伙伴们帮忙看看
http://www.aboutyun.com/thread-17030-1-1.html

spark DataFrame遇到的问题,求大神解答
http://www.aboutyun.com/thread-17036-1-1.html



about云2016年01月14日每日一读

使用 NoSQL 数据库提供云级别数据可伸缩性
http://www.aboutyun.com/thread-17019-1-1.html
1.Nosql数据库的设计原理是什么?
2.Hbase原理是什么样?
3.举例介绍MongoDB的运行原理怎么样?



HBase 数据导入功能实现方式解释
http://www.aboutyun.com/thread-17016-1-1.html
1.向hbase中导入数据分为几种方式?
2.Bulk load 怎么导入数据
3.Sqoop怎么导入到Hbase数据库中?



资源:

Spark技术及应用
http://www.aboutyun.com/thread-17028-1-1.html


内存计算Spark
http://www.aboutyun.com/thread-17027-1-1.html



问答:

Hadoop集群间数据传输工具---Distcp
http://www.aboutyun.com/thread-17011-1-1.html


regionserver无法连接hdfs的问题
http://www.aboutyun.com/thread-17017-1-1.html


使用java上传文件到HDFS,需要读取哪些配置文件呢?
http://www.aboutyun.com/thread-17021-1-1.html


hbase集群部署
http://www.aboutyun.com/thread-17022-1-1.html


Spark新手求教 SparkStreaming能否连接MySQL进行查询操作
http://www.aboutyun.com/thread-17023-1-1.html


eclipse中搭建hbase开发环境
http://www.aboutyun.com/thread-17024-1-1.html



about云2016年01月13日每日一读

对比Pig、Hive和SQL,浅看大数据工具之间的差异
http://www.aboutyun.com/thread-17005-1-1.html
1. 什么时候用Apache Pig?
2. 什么时候用Apache Hive?
3. 什么时候用SQL?


2016年,数据、分析和机器学习趋势五大预测
http://www.aboutyun.com/thread-17006-1-1.html
1.你是如何预测大数据行业的?
2.本文是如何预测的?
3.你认为该如何根据行业来计划自己的2016?


Neutron系列(21):OpenStack 高可用和灾备方案 [OpenStack HA and DR]【上】
http://www.aboutyun.com/thread-17002-1-1.html
1.什么是高可用?
2.HA和DR有什么关系?
3.什么是OpenStack HA?


Neutron系列(22):OpenStack 高可用和灾备方案 [OpenStack HA and DR]【下】
http://www.aboutyun.com/thread-17003-1-1.html
1.RDD HA的部署方案都有哪些?
2.什么是A/A 方案?
3.网易 OpenStack 云的 HA 方案是什么?






大数据分析工具能给企业带来多少价值?
http://www.aboutyun.com/thread-16997-1-1.html


资源:

hadoop入门实战手册
http://www.aboutyun.com/thread-17008-1-1.html


Storm中文学习手册
http://www.aboutyun.com/thread-17007-1-1.html



问答:
利用Flume进行安卓手机日志收集的问题,恳请解答!
http://www.aboutyun.com/thread-16998-1-1.html


求问 hive 本地mapjoin的内存设置方法
http://www.aboutyun.com/thread-17000-1-1.html



network 节点
http://www.aboutyun.com/thread-16996-1-1.html


Hadoop集群间数据拷贝【分享】
http://www.aboutyun.com/thread-16999-1-1.html


各位Agent的高可用是怎么做的
http://www.aboutyun.com/thread-17001-1-1.html


【求助】python 通过thrift 连接hive时,hive正则表达式函数不起作用
http://www.aboutyun.com/thread-17004-1-1.html






about云2016年01月12日每日一读

Neutron系列(19):Neutron L3 Agent HA 之 虚拟路由冗余协议(VRRP)【上】
http://www.aboutyun.com/thread-16968-1-1.html
1.虚拟路由冗余协议是什么?
2.什么是Keepalived?
3.如何创建 HA Router?



Neutron系列(20):Neutron L3 Agent HA 之 虚拟路由冗余协议(VRRP)【下】
http://www.aboutyun.com/thread-16969-1-1.html
1.HA Router如何高度?
2.Juno VRRP 实现需要注意什么?
3.Neutron Kilo 新版本都有什么?



Apache Spark 1.6 正式发布,做了哪些改变
http://www.aboutyun.com/thread-16973-1-1.html
1.spark1.6做了哪些改变?
2.性能提升做了哪些改进?
3.增加了哪些新的算法和功能?


总结2015之Spark篇:新生态系统的形成
http://www.aboutyun.com/thread-16974-1-1.html
1.为什么DataFrame比RDD在存储和计算上的效率更高?
2.Spark从API的角度看,可以分为哪两大类?
3.Spark支持的外部数据源有很多种,本文列举了哪些数据源?你知道哪些数据源?
4.spark在机器学习领域有哪些亮点?



求问cloudera装好服务后,各用户密码存在哪
http://www.aboutyun.com/thread-16970-1-1.html


spark thriftserver 问题
http://www.aboutyun.com/thread-16967-1-1.html  



大数据时代留给数据分析师的羁绊
http://www.aboutyun.com/thread-16966-1-1.html

将 Tor socks 转换成 http 代理
http://www.aboutyun.com/thread-16965-1-1.html


资源:

R导论【书籍】
http://www.aboutyun.com/thread-16975-1-1.html

cloudera-quickstart安装使用总结
http://www.aboutyun.com/thread-16976-1-1.html

问答:

yarn自带管理界面Lost Nodes数据过期的问题
http://www.aboutyun.com/thread-16964-1-1.html

install neutron-plugin-openvswitch-agent 失败
http://www.aboutyun.com/thread-16971-1-1.html

hadoop fs -du -sh /hbase/data 输出结果疑问
http://www.aboutyun.com/thread-16972-1-1.html





about云2016年01月11日每日一读

2016年大数据及其分析将影响深远
http://www.aboutyun.com/thread-16962-1-1.html
1.什么是实时大数据技术?
2.2016年大数据及其分析将有哪些影响?
3.实时大数据怎样打破传统商业模式?


Hadoop HTTP web-consoles认证机制
http://www.aboutyun.com/thread-16955-1-1.html
1.如何配置 Hadoop HTTP web-consoles 所需要的用户身份验证?
2.哪个配置文件可以配置 Hadoop HTTP认证?
3.hadoop.http.authentication.type的默认值是什么?
4.你认为Hadoop HTTP web认证的价值是什么?


如何让神经网络把熊猫识别为秃鹫
http://www.aboutyun.com/thread-16961-1-1.html
1.怎样安装神经网络软件Caffe?
2.什么是逻辑回归?
3.什么是神经网络?


25个Java机器学习工具&库
http://www.aboutyun.com/thread-16956-1-1.html



hbase中的scan全表扫描,是所有的regionServer都并行扫描,还是一个regionServer完...
http://www.aboutyun.com/thread-16954-1-1.html


2016年about云01月第02周经典帖子总结
http://www.aboutyun.com/thread-16960-1-1.html


资源:

数据挖掘模型-Models_of_DM
http://www.aboutyun.com/thread-16958-1-1.html

基于粗糙集理论的数据挖掘模型
http://www.aboutyun.com/thread-16959-1-1.html

问答:


glance imagle-list 提示错误
http://www.aboutyun.com/thread-16957-1-1.html




about云2016年01月10日每日一读

如何根据性能选择内存NoSQL数据库?
http://www.aboutyun.com/thread-16949-1-1.html
1.如何根据性能选择内存NoSQL数据库?
2.什么是YCSB测试工具?
3.怎样利用YCSB进行NoSQL数据库测试?




快的打车架构实践
http://www.aboutyun.com/thread-16950-1-1.html
1.客户端与服务端通信会遇到哪些问题?
2.怎样基于Storm和HBase打造实时监控平台?
3.怎样对Web系统进行分布式改造?




资源:
[网络存储技术].赵文辉.周加林.徐俊.李晨.扫描版
http://www.aboutyun.com/thread-16951-1-1.html



OpenStack L版 操作指南【英文版】
http://www.aboutyun.com/thread-16952-1-1.html



问答:

openstack【Liberty 】一些相关资料
http://www.aboutyun.com/thread-16947-1-1.html


请教大家一个预测问题
http://www.aboutyun.com/thread-16948-1-1.html


关于实例创建失败的问题,提示model server went away
http://www.aboutyun.com/thread-16946-1-1.html



about云官网能否有收藏文章功能
http://www.aboutyun.com/thread-16944-1-1.html



L版和K版 网络部分有不同 看不懂了
http://www.aboutyun.com/thread-16943-1-1.html



about云2016年01月09日每日一读


初学编程者,从一开始就值得坚持的习惯
http://www.aboutyun.com/thread-16940-1-1.html


深入理解同步/异步与阻塞/非阻塞区别
http://www.aboutyun.com/thread-16941-1-1.html
1.同步与异步本文是如何理解的?
2.阻塞与非阻塞与什么有关?







资源:
算法导论 第三版
http://www.aboutyun.com/thread-16938-1-1.html


算法(第四版).中文版.谢路云.影印版(高清)
http://www.aboutyun.com/thread-16939-1-1.html




问答:
nova各个服务的作用
http://www.aboutyun.com/thread-16928-1-1.html


求助,SparkSQL和Streaming结合程序出现的问题
http://www.aboutyun.com/thread-16930-1-1.html



有不有什么方法可以通api查看一个已经执行成功的job呢?
http://www.aboutyun.com/thread-16934-1-1.html



nova一个配置不明白
http://www.aboutyun.com/thread-16932-1-1.html


/etc/neutron/neutron.conf 有几个参数不明
http://www.aboutyun.com/thread-16935-1-1.html


安装配置网络组建遇到的不明问题
http://www.aboutyun.com/thread-16936-1-1.html



systemctl start neutron-server.service 报错了
http://www.aboutyun.com/thread-16937-1-1.html


各位大拿都是怎么管理hadoop(及其生态圈)集群的
http://www.aboutyun.com/thread-16929-1-1.html


Centos 7.2 1511 安装L时遇到的报错
http://www.aboutyun.com/thread-16931-1-1.html




about云2016年01月08日每日一读

Spark算子:统计RDD分区中的元素及数量
http://www.aboutyun.com/thread-16917-1-1.html
1.spark算子分区怎么理解?
2.怎么用代码去查找分区及分区中的数据?



Spark算子:RDD键值转换操作(1)–partitionBy、mapValues、flatMapValues
http://www.aboutyun.com/thread-16919-1-1.html
1.spark中的partitionBy怎么理解?
2.spark中的mapValues怎么理解?
3.spark中的flatMapValues怎么理解?




资源:

Zookeeper程序员指南《自译》
http://www.aboutyun.com/thread-16924-1-1.html

zookeeper文字稿
http://www.aboutyun.com/thread-16925-1-1.html

问答:

求助~hbase-1.0版本删除释放region问题
http://www.aboutyun.com/thread-16912-1-1.html

kettle5.4 工具使用关于java代码怎么用?
http://www.aboutyun.com/thread-16915-1-1.html

flume 如何采集gz 文件
http://www.aboutyun.com/thread-16918-1-1.html


glance转格式
http://www.aboutyun.com/thread-16921-1-1.html


创建实例失败,显示一直处于build状态
http://www.aboutyun.com/thread-16922-1-1.html

刚刚注册的新人请教几个问题?
http://www.aboutyun.com/thread-16923-1-1.html






about云2016年01月07日每日一读

图表编织的数据分析报告
http://www.aboutyun.com/thread-16899-1-1.html


Neutron VxLAN + Linux Bridge 环境中的网络 MTU【上】
http://www.aboutyun.com/thread-16905-1-1.html
1.什么是MTU?
2.怎样VxLAN封包和GRE封包?
3.Linux vxlan + bridge 环境中的网络栈是什么?


Neutron VxLAN + Linux Bridge 环境中的网络 MTU【下】
http://www.aboutyun.com/thread-16906-1-1.html
1.如何设置Neutorn 网络节点的 eth1?
2.Neutron MTU 方案有哪些?
3.怎样配置VxLAN + Linux bridge 网络环境中的 MTU ?



资源:

linux_kernel核心中文手册(内核图解)
http://www.aboutyun.com/thread-16910-1-1.html

linux的多线程编程的高效开发经验
http://www.aboutyun.com/thread-16909-1-1.html

问答:

openstack
http://www.aboutyun.com/thread-16892-1-1.html

Storm实时处理问题
http://www.aboutyun.com/thread-16893-1-1.html

hbase94 api 和10api如何共存呢
http://www.aboutyun.com/thread-16895-1-1.html

hive1.2.1 启动缓慢问题
http://www.aboutyun.com/thread-16896-1-1.html

求助!openstack-kilo network网络模式启动实例验证过程
http://www.aboutyun.com/thread-16898-1-1.html

zookeeper数据如何备份
http://www.aboutyun.com/thread-16901-1-1.html

ping不通外网
http://www.aboutyun.com/thread-16904-1-1.html

kettle5.4 工具使用关于java代码怎么用?
http://www.aboutyun.com/thread-16907-1-1.html




about云2015年01月06日每日一读

Deep Learning(深度学习)系列:(五)卷积神经网络
http://www.aboutyun.com/thread-16877-1-1.html
1、什么是卷积神经网络?
2、什么是参数减少与权值共享?



Azkaban2.5工作流调度框架配置方式
http://www.aboutyun.com/thread-16879-1-1.html
1、什么是Azkaban,用途是什么?
2、Azkaban Web Server如何部署?
3、Azkaban Executor Server如何部署?



Scala环境安装设置【分享】
http://www.aboutyun.com/thread-16878-1-1.html


Scala支持与Java的隐式转换
http://www.aboutyun.com/thread-16875-1-1.html

小企业也能用大数据分析工具?
http://www.aboutyun.com/thread-16883-1-1.html


资源:

设计模式:可复用面向对象软件的基础2013.pdf
http://www.aboutyun.com/thread-16890-1-1.html

linux内核分析及编程(倪继利)2005.pdf
http://www.aboutyun.com/thread-16889-1-1.html


问答:

求问用cloudera装好CDH启动datanode会超时,log如下
http://www.aboutyun.com/thread-16873-1-1.html

scala怎么强转类型
http://www.aboutyun.com/thread-16874-1-1.html

求助 Hadoop 目录里面东西完全变了,求大神解答原因
http://www.aboutyun.com/thread-16876-1-1.html

ceph集群部署工具有哪些好用的?
http://www.aboutyun.com/thread-16885-1-1.html

CM安装每次到hive就失败,帮忙看看什么问题
http://www.aboutyun.com/thread-16884-1-1.html


spark streaming saveAsTextFile的问题
http://www.aboutyun.com/thread-16888-1-1.html

openstack
http://www.aboutyun.com/thread-16887-1-1.html



about云2016年01月05日每日一读

Neutron 系列 (17): Neutron 分布式虚拟路由【上】
http://www.aboutyun.com/thread-16860-1-1.html
1.路由的相关知识有哪些?
2.Neutron 的传统和 DVR Router是什么?
3.DVR的功能有哪些?


Neutron 系列 (18): Neutron 分布式虚拟路由【下】
1.Neutron的代码分析?
2.Neutron 其它服务有哪些?
3.后续版本中 DVR 开发?


程序员如何谋划出月薪 3 万


数据挖掘的概率事件


Spark streaming的入门级理解


探索Spark源码---RDD模型


真正的团队,必须要拍死这6大负能量


2015年about云01月第01周经典帖子总结
http://www.aboutyun.com/thread-16856-1-1.html

about云2016年每周经典回顾汇【第三篇】
http://www.aboutyun.com/thread-16857-1-1.html

被时代召唤的大数据分析工具
http://www.aboutyun.com/thread-16859-1-1.html


资源:


Hadoop原理介绍
http://www.aboutyun.com/thread-16867-1-1.html

新浪微博数据分析与微博营销案例
http://www.aboutyun.com/thread-16868-1-1.html


问答:

用IDEA打包scala程序出现问题
http://www.aboutyun.com/thread-16858-1-1.html


Hadoop HA后,eclipse怎样环境搭建
http://www.aboutyun.com/thread-16869-1-1.html


网外无法访问instance的特定服务端口
http://www.aboutyun.com/thread-16870-1-1.html

用ambari2.2安装hdp2.3.4,组件启动报错TypeError: 'int' object is unsubscriptable
http://www.aboutyun.com/thread-16871-1-1.html





about云2016年01月04日每日一读

Spark UI (基于Yarn) 分析与定制
http://www.aboutyun.com/thread-16850-1-1.html
1.Spark UI的处理流程是什么?
2.这样分析现有Executors页面?
3.怎样自己编写一个HelloWord页面?



Spark 实战, 第 2 部分:使用 Kafka 和 Spark Streaming 构建实时数据处理系统
http://www.aboutyun.com/thread-16851-1-1.html
1.Kafka和Spark Steaming分别是什么?
2.怎样搭建Kafka 集群?
3.怎样使用 Kafka 和 Spark Streaming 构建实时数据处理系统?


YARN Timeline Server
http://www.aboutyun.com/thread-16852-1-1.html
1.如何将应用程序的相关数据发布到timeline server?
2.如何通过web UI访问应用程序的历史信息?


资源:

多线程编程指南
http://www.aboutyun.com/thread-16854-1-1.html

《Linux内核修炼之道》(pdf版)
http://www.aboutyun.com/thread-16853-1-1.html

问答:

dashboaed手动装出错
http://www.aboutyun.com/thread-16849-1-1.html





about云2016年01月03日每日一读

分布式健康检查:实现OpenStack计算节点高可用
http://www.aboutyun.com/thread-16844-1-1.html
1.什么叫计算节点高可用?
2.什么是Consul?
3.怎样实现OpenStack计算节点高可用?


通过demo学习OpenStack开发--API服务(1)
1.OpenStack有哪几种使用方式?
2.Python如何实现RESTful API?
3.怎样在OpenStack中开发RESTful API?


资源:

人工神经网络讲稿
http://www.aboutyun.com/thread-16846-1-1.html

让数据说话——销售数据分析方法
http://www.aboutyun.com/thread-16847-1-1.html

问答:


求指点为什么错呢?hadoop2.7.1的API就是这样的啊
http://www.aboutyun.com/thread-16843-1-1.html





about云2016年01月02日每日一读

Hadoop年度回顾与2016发展趋势
http://www.aboutyun.com/thread-16837-1-1.html
1.Hadoop在2015年发展怎么样?
2.2016年Hadoop的发展趋势怎么样?
3.Hadoop在2015年影响了哪些技术的发展?

如何设计你的2016年年度计划
http://www.aboutyun.com/thread-16838-1-1.html
1.如何设计2016年的年度计划?
2.SMART原则是什么意思?
3.如何制定学习计划?

about云每日一读汇总(第十二篇2016.01.01)
http://www.aboutyun.com/thread-16833-1-1.html

资源:

《现代操作系统(原书第3版)》(Modern Operating Systems (3rd Edition) )扫描版[PDF]
http://www.aboutyun.com/thread-16840-1-1.html

计算机的心智_操作系统之哲学原理
http://www.aboutyun.com/thread-16841-1-1.html


问答:

。。。一大堆警告····求解救
http://www.aboutyun.com/thread-16834-1-1.html

请教大神,hadoop增加节点后,map和reduce都感觉慢了,是什么原因
http://www.aboutyun.com/thread-16835-1-1.html

openstack--nova
http://www.aboutyun.com/thread-16836-1-1.html




about云2016年01月01日每日一读

hadoop2.7.1服务级别授权指南
http://www.aboutyun.com/thread-16769-1-1.html
1.hadoop默认是否启用服务级别授权?
2.访问控制列表该如何配置?
3.访问控制列表的格式是什么?
4.如何刷新服务级别授权配置?是否需要重启?



如何学习OpenStack
http://www.aboutyun.com/thread-16825-1-1.html
1.如何通过官网学习OpenStack?
2.怎么参与OpenStack的开发?
3.建议大学生怎么去学习?



Spark 实战,第 1 部分: 使用 Scala 语言开发 Spark 应用程序
http://www.aboutyun.com/thread-16826-1-1.html
1.怎么去搭建spark开发环境?
2.怎么去现实案例分析?
3.spark job的执行流程是怎么样的?





hadoop2.2在线取消datanode节点
http://www.aboutyun.com/thread-16824-1-1.html


资源:

云上运维专题_程长高_基于云端构建安全体系
http://www.aboutyun.com/thread-16830-1-1.html


HBase权威指南
http://www.aboutyun.com/thread-16823-1-1.html


云上运维专题_韩拓_container与微服务架构
http://www.aboutyun.com/thread-16831-1-1.html



问答:

neutron network0日志不写??
http://www.aboutyun.com/thread-16820-1-1.html


求帮忙解决错误日志?
http://www.aboutyun.com/thread-16821-1-1.html


Agent out of sync with plugin!
http://www.aboutyun.com/thread-16827-1-1.html


neutron.agent.linux.ovs_lib [-] Found failed openvswitch
http://www.aboutyun.com/thread-16828-1-1.html


openstack neutron(tap、qvb、qvo详解)
http://www.aboutyun.com/thread-16829-1-1.html









已有(2)人评论

跳转到指定楼层
Infinite 发表于 2016-4-1 11:35:30
刘明  谢谢总结
回复

使用道具 举报

是饭饭 发表于 2016-10-10 10:12:20
长姿势了,感谢楼主精彩讲解。。。。。。。。。。。。。。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

推荐上一条 /2 下一条