本帖最后由 Tank_2000 于 2016-7-17 21:12 编辑
about云每日一读汇总(第一篇)
about云每日一读汇总(第二篇)
about云每日一读汇总(第三篇2014.10.20)
about云每日一读汇总(第四篇2014.12.10)
about云每日一读汇总(第五篇2015.01.01)
about云每日一读汇总(第六篇2015.02.01)
about云每日一读汇总(第七篇2015.03.01)
about云每日一读汇总(第八篇2015.05.01)
about云每日一读汇总(第九篇2015.06.21)
about云每日一读汇总(第十篇2015.09.01)
about云每日一读汇总(第十一篇2015.11.14)
about云每日一读汇总(第十二篇2016.01.01)
about云每日一读汇总(第十三篇2016.04.01)
about云每日一读汇总(第十四篇2016.05.16)
about云2016年07月18日每日一读
sqoop操作命令总结
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19190
Apache Kylin的快速入门
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19193
1Kylin是如何产生的?
2.什么时候会用到Apache Kylin?
3.Apache Kylin发展到了什么程度?
京东王晓雨:在云海实践Apache Kylin
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19200
1.什么是Apache Kylin? 2.Apache Kylin有哪些性能优势? 3.怎样基于Apache Kylin做二次开发?
hadoop,CDH如何实现 HDFS的Block数据balancer重分布
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19194
1.如何判断一个集群是否数据倾斜?
2.balancer的原理是什么?
3.CDH集成平台如何实现数据重分布?
机器学习和图像识别是怎样彻底改变搜索的?
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19198
1.机器学习在图像识别中有哪些优势? 2.Adam项目是什么? 3.怎样做到检索多种格式的电子文件?
从零开始,构建一套网红电商搜索系统
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19199
1.怎样从零开始,构建一套网红电商搜索系统? 2.电商平台有哪几种搜索形式? 3.电商平台怎样对搜索结果排序?
Spark 附带示例完整解释
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19201
1.怎样利用Spark分析日志文件? 2.Spark 属性配置方式有哪几种? 3.Spark作业调度的基本工作流程是什么?
资源:
数据仓库1:决策支持系统的发展
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19206
数据仓库2:数据仓库环境
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19207
问答:
sqoop导入parquet问题
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19191
求助hive建表失败
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19192
about云2016年07月15日每日一读
新浪微博混合云架构实践弹性调度介绍
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19180
1.新浪混合云弹性调度系统架构是如何演进的?
2.新浪混合云如何将业务合理调度到计算节点上?
3.Swarm是什么?
使用Phoenix将SQL代码移植至HBase
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19182
1. HBase Shell如何使用?
2. Java如何远程连接HBase?
3. 如何安装和配置Phoenix?
4. Phoenix的语法有哪些?
5. 如何安装和使用SQuirrel?
6. 如何使用Phoenix移植SQL代码至HBase?
7. Phoenix如何进行性能调优?
资源:
dubbo视频系列之五源码及相关例子【限时分享】
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19183
MLlib在淘宝的应用和改进
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19184
问答:
使用flume,如何保证source的各个文件在sink出去之后依然是这些文件?
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19181
创建image时候--public --share --private 该怎么用
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19186
kilo版nova image-create snapshot问题
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19188
about云2016年07月14日每日一读
Spark 2.0技术新特性总结
http://www.aboutyun.com/thread-19170-1-1.html
1.Spark 2.0SQL做了哪些改变?
2.Spark 2.0,DataFrame、Dataset API做了哪些改变?
3.Structured Streaming APIs是什么?
Spark2.0 SQL中的Time Window实例
http://www.aboutyun.com/thread-19171-1-1.html
1.Spark SQL中的window API是哪个版本引入的?
2.本文通过什么例子解释了Window API的使用?
资源:
dubbo视频系列之四相关文档及所用资源【限时分享】
http://www.aboutyun.com/thread-19172-1-1.html
RDD(弹性分布式数据集)-内存集群计算容错抽象【英文】
http://www.aboutyun.com/thread-19173-1-1.html
问答:
keystone与barbican联调问题
http://www.aboutyun.com/thread-19168-1-1.html
flume收集,gzip压缩损坏
http://www.aboutyun.com/thread-19169-1-1.html
openstack创建了ubuntu及其他系统的实例,都无法成功i安装
http://www.aboutyun.com/thread-19174-1-1.html
无法创建网络,大神们帮忙看看啊
http://www.aboutyun.com/thread-19175-1-1.html
关于大数据技术选型的困惑
http://www.aboutyun.com/thread-19176-1-1.html
about云2016年07月13日每日一读
【Lucene】Apache Lucene全文检索引擎架构之入门实战
http://www.aboutyun.com/thread-19160-1-1.html
1、Lucene中的全文搜索原理是什么?
2、如何使用Lucene处理问题?
轻松理解隐马尔可夫模型(HMM)
http://www.aboutyun.com/thread-19161-1-1.html
1、什么是熵(Entropy)?
2、如何理解最大熵模型?
3、如何理解隐马尔可夫模型(HMM)?
资源:
dubbo视频系列之三高可用架构篇【限时分享】
http://www.aboutyun.com/thread-19165-1-1.html
使用spark监控电子交易环境【英文】
http://www.aboutyun.com/thread-19166-1-1.html
问答:
linux全文复制
http://www.aboutyun.com/thread-19159-1-1.html
neutron外部网络down
http://www.aboutyun.com/thread-19162-1-1.html
CM 安装的oozie调用hive任务报找不到数据库
http://www.aboutyun.com/thread-19163-1-1.html
关于provider network的含义
http://www.aboutyun.com/thread-19164-1-1.html
about云2016年07月12日每日一读
算法入门-算法和菜谱之间的联系
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19152
1.算法和菜谱有什么共同点?
2.本文认为什么是算法?
3.算法有哪两个必要条件?
4.算法有哪两大支柱?
学会如何学习
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19153
资源:
dubbo视频系列之二入门高级篇【限时分享】
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19154
大型集群上的快速和通用数据处理架构(修正版)
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19155
问答:
详解MapReduce中shuffle过程
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19149
Hbase启动报错,只有Hquorumpeer起来的
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19150
about云2016年07月11日每日一读
推荐系统:个性化推荐-协同过滤
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19128
1. 什么是协同过滤?
2. UserCF主要思想是什么?
3. 用户相似度的度量方法有哪些?
4. UserCF存在的问题有哪些?如何改进?
5. ItemCF的主要思想是什么?
6. ItemCF如何实现?
7. ItemCF如何进行改进?
8. UserCF和ItemCF的相比较各自的特点是什么?
机器学习教程 十一-用scikit-learn做聚类分析大数据
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19129
1.监督学习方法你认为会有哪些?
2.什么是K-means聚类算法?
大数据成熟度模型
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19135
1.什么是大数据成熟度模型? 2.大数据成熟度模型有哪几个框架? 3.大数据如何助力于业务价值创造?
Solr特性总结
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19136
1.什么是Solr? 2.Solr有哪些特性?
Redis Cluster分区实现原理
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19142
1.数据是如何被自动分散到不同的节点的? 2.客户端是如何能够正确找到节点的? 3.键空间迁移过程是怎么样的?
企业数据分析的架构和方法
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19143
1.怎么做企业数据分析? 2.有哪些数据分析方法? 3.数据处理流程有哪些?
Hadoop学习之环境搭建
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19141
hadoop学习之hdfs
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19138
Hadoop学习之mapreduce及示例代码
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19140
资源:
经典算法大全
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19145
老外视频教程:SQL on Hadoop - 使用hive分析大数据汇总
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19147
dubbo视频系列之一入门基础篇【限时分享】
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19146
Neutron理解(一)
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19125
Neutron理解(二)
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19126
问答:
VM平台虚机迁移至OPenstack平台,怎么搞?
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19127
怎么计算或确定运行一个第三方模型(可以理解为MR)所用到的资源(数据量已确定)
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19130
关于kylin构建cube中step2时报connection exception异常
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19131
yum 安装了ceph 为什么 /etc/init.d/ceph 会报错
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19132
独立集群?
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19133
关于hmaster和jobtracker的节点选择
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19134
spark on yarn 运行问题,一直循环
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19139
about云2016年07月08日每日一读
机器学习教程十-用scikit-learn的网格搜索快速找到最优模型参数
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19120
1.什么是网格搜索?
2.网格搜索本文举了什么例子?
机器学习算法入门
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19121
1.什么是程序?
2.什么是算法?
3.什么是机器学习算法?
4.机器学习的主要任务是什么?
5.机器学习+数据库=?
6.什么是自然语言处理?
资源:
OpenStack实战指南(全)
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19117
智慧城市中的大数据-李德仁
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19122
问答:
mapreduce报错
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19114
CDH agen节点会自动挂载一个目录,这是做什么的
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19115
Hadoop-2.7.2集群安装后命令行报错 Couldn't create proxy provider null
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19116
求助Vxlan下,Bridge br-int 的隧道端点问题
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19118
ceph中怎么删除pool
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19119
MapReduce基础知识总结1 思维导图版
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19123
about云2016年07月07日每日一读
机器学习教程 九-二元分类效果的评估方法
http://www.aboutyun.com/thread-19107-1-1.html
1.如何评估真阳性?
2.如何评估真阴性?
3.如何评估假阳性?
4.如何评估假阴性?
5.如何评估准确率?
6.如何评估精确率?
7.如何评估召回率?
8.如何评估召回率?
9.如何评估误警率?
10.如何评估ROC?
11.如何评价AUC?
机器学习助力神经科学的高维数据分析,两者如何相互激励与促进
http://www.aboutyun.com/thread-19108-1-1.html
1.如何进行高维数据分类?
2.什么是机器学习?
3.什么是基于模型的分析和无监督机器学习?
4.机器学习分类器有多好?
5.为什么是用于联接组学的机器学习?
6.什么是对标签的需求——人vs.机器?
7.什么是前馈 vs 递归( Recurrent )神经网络架构?
8.如何发现大脑分类技巧的策略?
资源:
看看老外视频教程系列5:SQL on Hadoop - 使用hive分析大数据-存储与生态系统
http://www.aboutyun.com/thread-19111-1-1.html
实现近实时健康数据中心数据分析使用模型驱动编程在Spark-Streaming和GraphX
http://www.aboutyun.com/thread-19112-1-1.html
问答:
大数据找工作
http://www.aboutyun.com/thread-19101-1-1.html
各位大神请教一个solr的问题
http://www.aboutyun.com/thread-19102-1-1.html
cm能管理使用tar包安装的服务吗
http://www.aboutyun.com/thread-19103-1-1.html
CM安装时的JDK选择问题
http://www.aboutyun.com/thread-19106-1-1.html
openstack neutron创建网络后外部网络网关接口down
http://www.aboutyun.com/thread-19109-1-1.html
到底是哪超时了
http://www.aboutyun.com/thread-19110-1-1.html
about云2016年07月06日每日一读
如何用深度学习识别网络欺诈?
http://www.aboutyun.com/thread-19094-1-1.html
1、当前欺诈广告是什么现状?
2、什么是深度学习?
3、如何用卷积类神经网络算法构建系统?
机器学习教程 八-用scikit-learn做特征提取
http://www.aboutyun.com/thread-19095-1-1.html
1、sk-learn分类变量的特征提取如何实现?
2、如何实现文字特征提取?
3、如何对矩阵做标准化?
资源:
Spinach-构建于Spark之上的即席查询引擎
http://www.aboutyun.com/thread-19097-1-1.html
看看老外视频教程系列4:SQL on Hadoop - 使用hive分析大数据-高级HiveSQL
http://www.aboutyun.com/thread-19096-1-1.html
问答:
hive执行drop table的命令时,会擦死!各位大神帮忙看看
http://www.aboutyun.com/thread-19091-1-1.html
storm-kafka整合问题
http://www.aboutyun.com/thread-19092-1-1.html
hive权限控制无效问题
http://www.aboutyun.com/thread-19093-1-1.html
给solr添加数据总是报错,
http://www.aboutyun.com/thread-19099-1-1.html
about云2016年07月05日每日一读
OpenStack云端的资源调度和优化剖析
http://www.aboutyun.com/thread-19085-1-1.html
1.OpenStack如何资源调度? 2.PRS是什么? 3.OpenStack调度如何优化?
机器学习教程 七-用随机梯度下降法(SGD)做线性拟合
http://www.aboutyun.com/thread-19086-1-1.html
1.什么是梯度下降法?
2.利用Python如何实验?
3. 如何进行优化?
MapReduce实现多矩阵乘法计算,Map准备数据,Reduce无法实现分布式计算问题
http://www.aboutyun.com/thread-19079-1-1.html
贵州数据宝:做大数据行业的“淘宝”
http://www.aboutyun.com/thread-19082-1-1.html
非常的好的协同过滤入门文章
http://www.aboutyun.com/thread-19081-1-1.html
资源:
看看老外视频教程系列3:SQL on Hadoop - 使用hive分析大数据-hive查询语言
http://www.aboutyun.com/thread-19088-1-1.html
计算机的心智操作系统之哲学原理
http://www.aboutyun.com/thread-19090-1-1.html
问答:
Sqoop export 多map情况下数据库事务死锁问题
http://www.aboutyun.com/thread-19083-1-1.html
oozie调用hive过程中报错
http://www.aboutyun.com/thread-19084-1-1.html
大神们 说说ceph安装报错这是怎么回事
http://www.aboutyun.com/thread-19087-1-1.html
about云2016年07月04日每日一读
美团Spark性能优化指南——基础篇
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19058
1. Spark开发调优常见的有哪几个原则?如何使用?
2. Spark作业运行的基本原理是什么?
3. Spark资源调优可以有哪些参数?
机器学习教程 五-用matplotlib绘制精美的图表
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19060
1.怎么样安装matlab?
2.怎么样用matlab绘制图像?
教你如何用R进行数据挖掘(一)
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19063
1.为什么学习R语言?
2.怎么样用R语言进行计算?
教你如何用R进行数据挖掘(二)
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19064
1.怎么用R进行数据处理?
2.怎么用R进行建模?
网络爬虫项目介绍及简单例子
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19067
朴素贝叶斯之MapReduce版
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19070
1.怎样计算类别的先验概率? 2.怎样计算每个词的条件概率? 3.什么是假设二分类问题?
Google深度学习笔记 循环神经网络实践
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19069
1.怎样构建计算单元? 2.什么是CBOW? 3.怎样优化lstm?
HBase最佳实践-列族设计优化
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19072
1.BLOCKSIZE属性在不同场景下应该如何设置?
2.COMPRESSION属性和DATA_BLOCK_ENCODING属性的区别是什么? 3.Hbase需要注意哪些设计原则?
机器学习教程 六-用scikit-learn求解多项式回归问题
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19073
1.怎样利用scikit-learn解决多项式回归问题? 2.python怎样做线性回归? 3.python怎样做多项式回归?
资源:
看看老外视频教程系列2:SQL on Hadoop - 使用hive分析大数据-hive入门
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19074
广义线性模型在spark MLlib和SparkR
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19075
问答:
求一spark mllib视频
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19061
Hbase集群scan命令rowkey检索问题
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19062
spark默认分区
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19065
新手请教集群的角色分配问题
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19066
创建实例求助
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19071
about云2016年07月01日每日一读
深度学习与自然语言处理(4)_斯坦福cs224d 大作业测验1与解答
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19041
1.什么是Softmax ?
2.神经网络怎样学习?
3.什么是word2vec?
4.如何进行情感分析?
机器学习教程 四-用scikit-learn求解多元线性回归问题
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19042
1.多元线性回归模型是什么?
2.如何用使用scikit-learn求解多元线性回归?
redis应用之本机搭建redis集群具体实现
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19043
资源:
使用不同的功能构建推荐【英文】
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19055
看看老外视频教程系列1:SQL on Hadoop - 使用hive分析大数据-hadoop入门
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19056
问答:
感觉hadoop基本没有用户认证体系
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19044
sqoop 将oracle数据导入hive报错,报错信息如下
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19047
基于Hadoop的日志分析Demo
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19048
CDH 配置文件以我代码文件夹下的为准还是以管理界面为准
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19050
关于hdfs和本地文件系统的疑问
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19051
Oozie启动过程没有出错,但是webUI界面报错
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19052
HDFS上存储的是GBK编码的文件,mapreduce可以使用gbk编码读取文件吗?
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19054
about云2016年06月30日每日一读
使用深度学习实现智能聊天机器人
http://www.aboutyun.com/thread-19037-1-1.html
1.聊天机器人的类型本文分为了哪些类型?
2.聊天机器人的有几种主流技术?
3.如何利用深度学习构建聊天机器人?
顶尖程序员的5个特点
http://www.aboutyun.com/thread-19038-1-1.html
初学redis数据库笔记
http://www.aboutyun.com/thread-19029-1-1.html
资源:
spark:分析操作系统【about云】
http://www.aboutyun.com/thread-19030-1-1.html
从非结构化文本基于NLP使用spark提取关系【英文about云】
http://www.aboutyun.com/thread-19031-1-1.html
问答:
openstack云主机ping不通物理机
http://www.aboutyun.com/thread-19027-1-1.html
新人初学,有没有一起交流的群或者朋友一起探讨
http://www.aboutyun.com/thread-19032-1-1.html
hbase如何分页(比如跳到某一页)
http://www.aboutyun.com/thread-19033-1-1.html
hbase shell中scan命令的formatter不起作用是怎么回事?
http://www.aboutyun.com/thread-19035-1-1.html
hiveserver2启动失败
http://www.aboutyun.com/thread-19036-1-1.html
请教一个clouder manage 集群调优的问题
http://www.aboutyun.com/thread-19039-1-1.html
about云2016年06月29日每日一读
深度学习与自然语言处理(3)_斯坦福cs224d Lecture 3
http://www.aboutyun.com/thread-19018-1-1.html
1、如何理解神经网络?
2、什么是正向计算,反向传播?
3、如何理解梯度检验、参数的哈维初始化和学习速率?
机器学习教程 三-用scikit-learn求解一元线性回归问题
http://www.aboutyun.com/thread-19020-1-1.html
1、scikit-learn如何实现一元线性回归模型?
2、如何使用matplotlib画一元线性图像?
3、如何进行模型评估?
资源:
使用spark sql旋转【行列转换】数据
http://www.aboutyun.com/thread-19024-1-1.html
Reactive Feature Generation使用Spark和MLlib
http://www.aboutyun.com/thread-19025-1-1.html
问答:
请教一些大数据业务处理场景解决方案
http://www.aboutyun.com/thread-19015-1-1.html
HDFS文件上传加速问题
http://www.aboutyun.com/thread-19016-1-1.html
sentry oozie的配置问题
http://www.aboutyun.com/thread-19017-1-1.html
集群删除节点问题
http://www.aboutyun.com/thread-19019-1-1.html
使用mapReduce分析HDFS中大文件只起一个map的问题?
http://www.aboutyun.com/thread-19021-1-1.html
双击eclipse显示没有虚拟机
http://www.aboutyun.com/thread-19023-1-1.html
about云2016年06月28日每日一读
深度学习在自然语言处理上的应用(2)_斯坦福cs224d Lecture 2
http://www.aboutyun.com/thread-19005-1-1.html
1.如何词向量评价? 2. 对外在性任务如何进行训练? 3.什么是词窗分类?
机器学习教程 二-安装octave绘制3D函数图像
http://www.aboutyun.com/thread-19006-1-1.html
1.mac系统如何安装? 2.centos7系统如何安装? 3.效果图如何?
联想企业网盘:SaaS服务集群化持续交付实践
http://www.aboutyun.com/thread-19008-1-1.html
资源:
spark学习深递归神经网络【about云】
http://www.aboutyun.com/thread-19010-1-1.html
spark sql优化器的改进【about云】
http://www.aboutyun.com/thread-19011-1-1.html
问答:
请教大家一个关于spout failed的问题解决方案
http://www.aboutyun.com/thread-19003-1-1.html
CDH集群突然变慢,ParcelUpdateService报错,求指点
http://www.aboutyun.com/thread-19007-1-1.html
storm startOffsetTime的问题
http://www.aboutyun.com/thread-19009-1-1.html
怎么修改cdh默认配置的默认值
http://www.aboutyun.com/thread-19012-1-1.html
flume java.lang.NoClassDefFoundError: org/apache/hadoop/io/SequenceFile$Compr...
http://www.aboutyun.com/thread-19013-1-1.html
about云2016年06月27日每日一读
用Akka解决Spark+ElasticSearch实时计算平台的瓶颈
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18982
1.Spark和ElasticSearch怎么解决实时计算瓶颈?
2.Akka和ElasticSearch怎么解决实时计算瓶颈?
Spark Streaming性能优化系列-如何获得和持续使用足够的集群计算资源?
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18984
1.数据峰值有什么影响?
2.如何限制Spark的接收速度?
Spark python开发---Spark处理后的数据可视化
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18992
1.怎样进行数据可视化的预处理? 2.怎样创建wordcloud? 3.怎样进行tweets定位并在地图上显示?
深度学习与自然语言处理(1)_斯坦福cs224d Lecture 1
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18996
1.什么是自然语言处理? 2.什么是词向量? 3.有哪些分词模型?
机器学习教程 一-不懂这些线性代数知识 别说你是搞机器学习的
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18997
1.机器学习需要掌握哪些线性代数知识? 2.什么是矩阵? 3.什么是奇异值分解?
资源:
大数据结构中如何使用spark属性2016
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18999
构建实时数据仓库【英文】
http://www.aboutyun.com/forum.php?mod=viewthread&tid=19000
问题:
hdfs出现了Datanode Volume Failures怎么处理
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18972
awk实现简单日志分析
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18973
Linux简单笔记
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18974
storm数据重复消费
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18975
Linux常用命令大全
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18976
spark jobhistory 查看问题
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18977
kvm创建win7和2008虚拟机失败问题
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18978
spout 的Acked为何还比Emitted大?
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18979
Hadoop 历史
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18980
Spark历史
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18981
idea通过jdbc连接hive一直报错
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18983
求助,关于mapreduce的map输入类型
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18985
好书就要分享
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18986
求助:安装hive报这个错
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18988
hue新建用户无法访问hive
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18989
mitaka版本安装Win7找不到硬盘驱动
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18990
sqoop mapreduce job卡着
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18991
关于spark监护的rest api访问报错问题
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18995
scala8进行编译报错
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18998
about云2016年06月24日每日一读
MapReduce 进阶:Partitioner 组件
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18959
1. Hadoop默认的HashPartitioner是如何进行分区的?
2. 如何自定义HashPartitioner?
3. 如何自定义Partitioner?
4. 其他的Partitioner有哪些?
Hadoop源码分析1——数据节点写数据
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18966
1.客户端写文件时系统各节点是如何配合的?
2.你认为DistributedFileSystem的作用是什么?
3.写数据包括哪些字段?
Hadoop源码分析——数据节点写数据2
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18967
资源:
机器学习的一本书
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18954
hadoop实战系列7:流量项目背景简介及行为轨迹增强模块等视频
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18969
spark2.0文档【2016英文】
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18970
问答:
linux环境变量问题 无法登陆
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18955
hadoop使用交换内存的问题
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18957
hive中各个队列属性设置
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18960
eclipse 安装hadoop 插件出的问题 求帮助
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18962
openstack-kilo-neutron-agent服务实际是active的-但是显示为XXX
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18963
求助,Hadoop执行打包好的jar程序报错
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18964
Hadoop执行打包好的jar程序报错
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18965
开始跑后20秒内,其中一台SLAVE会SSH断线,DataNode与TaskTracker挂掉
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18968
openstack如何制作操作系统镜像?
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18961
about云2016年06月23日每日一读
李开复万字长文科普人工智能:AI是什么 如何改变当今世界?
http://www.aboutyun.com/thread-18948-1-1.html
1.人工智能是一种怎样的工具?
2.何为人工智能?
3.如何进行科普深度学习?
4.什么是深度学习的应用领域?
5.为什么人工智能将重塑亿万级别的领域?
6.Google的野心是什么?
7.何为深度学习的挑战?
8.人工智能如何快速商业化?
9.人工智能的未来蓝图是什么样的?
2016 Spark旧金山峰会-Spark 2.0成为焦点及对未来技术展望
http://www.aboutyun.com/thread-18949-1-1.html
1.Spark 2.0是什么样的?
2.Structured API是什么?
3.Structured Streaming怎样工作?
4.机器学习与数据科学是什么?
5.Spark&深度学习怎样?
6.机器学习如何?
7.怎样展望未来?
函数式思维和函数式编程
http://www.aboutyun.com/thread-18950-1-1.html
1.本文是如何理解函数式编程的?
2.如何用函数式的方式思考、函数式的方式编程实现?
资源:
hadoop实战系列6:hive及hbase入门相关视频
http://www.aboutyun.com/thread-18951-1-1.html
sparkling water介绍【英文】
http://www.aboutyun.com/thread-18952-1-1.html
问答:
机器学习,各位是怎么学的?
http://www.aboutyun.com/thread-18942-1-1.html
hdfs数据移动问题
http://www.aboutyun.com/thread-18943-1-1.html
mapreduce map task并发性问题
http://www.aboutyun.com/thread-18945-1-1.html
hql中的数据类型转换
http://www.aboutyun.com/thread-18946-1-1.html
flume syslog to hdfs 如何给信息添加时间
http://www.aboutyun.com/thread-18947-1-1.html
about云2016年06月22日每日一读
使用HMM【隐马尔科夫模型】实现简单拼音输入法
http://www.aboutyun.com/thread-18929-1-1.html
1、什么是隐马尔科夫模型?
2、如何通过拼音推测汉字?
3、如何理解前向概率Viterbi算法?
HBase最佳实践网易视频云--内存规划
http://www.aboutyun.com/thread-18932-1-1.html
1.本文hbase是如何规划内存的?
2.写多读少型 + LRUBlockCache 内存规划思路是什么?
3.读多写少型 + BucketCache 内存你认为内存该如何规划?
Kafka设计解析(五)- Kafka性能测试方法及Benchmark报告
http://www.aboutyun.com/thread-18930-1-1.html
1、如何利用自带的性能测试脚本测试Kafka的性能?
2、如何通过Kafka Manager查看整个集群的Metrics?
3、如何使用Kafka Manager监控Kafka的工作状态?
hadoop使用小技巧
http://www.aboutyun.com/thread-18934-1-1.html
资源:
hadoop实战系列5:hadoop HA原理、部署及相关zookeeper
http://www.aboutyun.com/thread-18938-1-1.html
spark配置-企业系统管理员【英文资料】
http://www.aboutyun.com/thread-18939-1-1.html
问答:
Ignite as Secondary File System 启动出错
http://www.aboutyun.com/thread-18931-1-1.html
计算节点单独安装在物理服务器无法SSH实例
http://www.aboutyun.com/thread-18933-1-1.html
gitreview ssh 失败
http://www.aboutyun.com/thread-18935-1-1.html
hbase 写数据进不去
http://www.aboutyun.com/thread-18936-1-1.html
请教hbase等待线程数过多问题?
http://www.aboutyun.com/thread-18937-1-1.html
about云2016年06月21日每日一读
别因为要学的太多反而压垮自己
http://www.aboutyun.com/thread-18919-1-1.html
1.不要学习的太多?
2.什么是及时的学习?
3.你不可能什么都知道吧?
Kafka设计解析(四)- Kafka Consumer设计解析
http://www.aboutyun.com/thread-18921-1-1.html
1.什么是High Level Consumer?
2.如何使High Level Consumer Rebalance?
3.如何观察Consumer状态机?
资源:
刘永平-Spark-streaming在京东的项目实践
http://www.aboutyun.com/thread-18924-1-1.html
hadoop实战系列4:自定义bean及hadoop序列化接口等自定义
http://www.aboutyun.com/thread-18926-1-1.html
问答:
如何获取spark streaming正在运行的 Application
http://www.aboutyun.com/thread-18911-1-1.html
感觉apache ambri 没有cloudera management火
http://www.aboutyun.com/thread-18912-1-1.html
怎样修改Cloudera hadoop里面的默认配置
http://www.aboutyun.com/thread-18914-1-1.html
求助 hive 分区表导出
http://www.aboutyun.com/thread-18915-1-1.html
使用apache的顶级项目之一的zeppelin出现的问题
http://www.aboutyun.com/thread-18916-1-1.html
请教各位大牛,创建实例(实例处于错误状态)IP可以获得
http://www.aboutyun.com/thread-18917-1-1.html
openstack-kilo-neutron-创建网络后无法ping通router网关
http://www.aboutyun.com/thread-18918-1-1.html
cloudera manager 如何修改配置文件
http://www.aboutyun.com/thread-18920-1-1.html
Hadoop搭建集群时相关问题
http://www.aboutyun.com/thread-18922-1-1.html
在openstack使用云主机的时候会被要求操作系统重置密码,这应该怎么做
http://www.aboutyun.com/thread-18923-1-1.html
各位大神请教一个存储hbase出现的问题
http://www.aboutyun.com/thread-18927-1-1.html
about云2016年06月20日每日一读
Kafka设计解析(一)- Kafka背景及架构介绍
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18894
1.kafka有什么作用?
2.常用的消息队列有哪些?
3.Kafka的设计理念是什么?
Kafka设计解析(二)- Kafka HA高可用(上)
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18903
1.Kafka为何需要High Available?
2.Kafka为何需要Replication?
3.如何将所有Replica均匀分布到整个集群?
Kafka设计解析(三)- Kafka HA高可用(下)
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18904
1.如何创建/删除Topic?
2.Broker响应请求包含哪些流程?
3.LeaderAndIsrRequest是如何响应的?
HBase性能优化方法总结
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18909
1.HBase有哪几种性能优化方法? 2.HBase怎样做到高并发、批量读写? 3.怎样优化Rowkey?
我是如何面试的
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18893
1.简历造假严重吗?
2.面试会问什么问题?
3.怎么样提高自己面试的成功率?
Hive的HQL语句及数据倾斜解决方案
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18889
1. Hive如何创建内部表和外部表? 2. Hive如何进行分区? 3. Hive常用的基本操作有哪些? 4. Hive如何自定义函数? 5. Hive中常见的数据倾斜有哪些?如何解决?
大数据统计:怎样的程序员最抢手?
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18899
1.怎样的程序员最抢手? 2.互联网公司怎样吸引优秀程序员加盟? 3.程序员应该怎样跳槽?
中文分词原理和实现
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18901
1.有哪些主流分词方法? 2.什么是基于规则或词典的方法的分词方法? 3.什么是基于统计的分词?
怎样成为你圈子中最牛逼的那种人?
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18907
1.如何才能脱颖而出? 2.如何快速提升自己,而不使自己的梦想被社会和现实所打碎? 3.如何实现巨大的飞越使自己能够跨过同一岗位上疯狂的竞争?
资源:
hadoop实战系列3:hdfs源码跟踪及job提交源码跟踪等
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18905
加速企业spark【英文版】
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18906
问答:
协处理器能不能跨region做逻辑
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18888
spark Streaming 有几种运行方式
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18890
spark Streaming 有几种运行方式
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18890
openstack_auth 中要求session中存放token对象, 这种情况下如何进行跨域共享session?
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18891
hdfs如何实现datanode和disk之间数据传输,
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18895
openstack 使用nova命令报错
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18896
请教各位大牛创建实例 (HTTP 500)错误
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18897
kudu cloudera怎么样?有人有使用经验吗
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18898
IDEA中本地运行spark程序报错
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18908
about云2016年06月16日每日一读
Spark python 开发者 ---Spark流式数据处理
http://www.aboutyun.com/thread-18866-1-1.html
1.Spark Streaming在数据密集型应用中的位置在哪?
2.Spark Streaming 内部工作方式是什么样的?
3.Spark Streaming 的底层基础怎么实现?
4.如何构建容错系统?
5.怎样以TCP sockets处理实时数据?
6.如何实时控制Twitter数据 ?
7.如何实时处理Tweets?
8.怎样构建一个稳定缩放的流式应用?
9.如何搭建 Kafka?
10.怎么开发 producers?
11.如何开发 consumers?
12.如何在Kafka 上开发Spark Streaming consumer?
13.如何探索flume?
14.基于Flume, Kafka和Spark开发数据流水线是什么样的?
大数据系统数据采集产品的架构总结与介绍、分析
http://www.aboutyun.com/thread-18869-1-1.html
1.什么是Apache Flume?
2.什么是Fluentd?
3.什么是Logstash?
4.什么是Scribe?
5.什么是Chukwa?
6.什么是Splunk Forwarder?
资源:
spark编程
http://www.aboutyun.com/thread-18859-1-1.html
hadoop实战系列1:hadoop入门及hadoop岗位要求等
http://www.aboutyun.com/thread-18873-1-1.html
OpenStack-Mirantis-8.0-版本发布说明
http://www.aboutyun.com/thread-18875-1-1.html
问答:
hadoop : Permission denied by sticky bit setting
http://www.aboutyun.com/thread-18860-1-1.html
spark分布式处理同一个文件的问题
http://www.aboutyun.com/thread-18861-1-1.html
hive 调hadoop job 挂掉,帮忙看下
http://www.aboutyun.com/thread-18863-1-1.html
hadoop集群监控工具有哪些,推荐一下
http://www.aboutyun.com/thread-18864-1-1.html
同过CM web界面删除节点后nodemanager无法启动
http://www.aboutyun.com/thread-18865-1-1.html
map reduce卡住
http://www.aboutyun.com/thread-18868-1-1.html
openstack中的metadata疑问
http://www.aboutyun.com/thread-18870-1-1.html
about云2016年06月15日每日一读
使用混淆矩阵对分类模型进行评估-Confusion matrix
http://www.aboutyun.com/thread-18847-1-1.html
1、什么是混淆矩阵(Confusion matrix)模型?
2、如何使用混淆矩阵进行实例分析?
3、如何使用混淆矩阵对预测的结果进行评估?
Mirantis OpenStack 8.0 版本大概性分析
http://www.aboutyun.com/thread-18849-1-1.html
1、Mirantis OpenStack 8.0有哪些组件?
2、MOS 8.0新增哪些特性?
3、裸机服务管理和Murano+ Kubernetes+ GCE支持混合云如何使用?
sparkSQL 问题
http://www.aboutyun.com/thread-18846-1-1.html
网站编辑功能
http://www.aboutyun.com/thread-18850-1-1.html
资源:
淘宝云梯分布式计算平台整体架构
http://www.aboutyun.com/thread-18854-1-1.html
Spark源码解读迷你【书籍推荐】
http://www.aboutyun.com/thread-18855-1-1.html
问答:
MR程序在eclipse就能跑,打成jar包放到外名就不能跑,求救
http://www.aboutyun.com/thread-18845-1-1.html
求CDH maven pom,官网的只有列表,需要一个个手动添加
http://www.aboutyun.com/thread-18848-1-1.html
自己总结的mapreduce Shuffle流程图
http://www.aboutyun.com/thread-18852-1-1.html
shuffle流程图
http://www.aboutyun.com/thread-18853-1-1.html
常见的资源有没有百度盘下载的
http://www.aboutyun.com/thread-18856-1-1.html
about云2016年06月14日每日一读
Spark:value registerTempTable is not a member of org.apache.spark.rdd.RDD解决
http://www.aboutyun.com/thread-18823-1-1.html
1.如何将标准的RDD(org.apache.spark.rdd.RDD)转换成SchemaRDD?
2.什么是SchemaRDD?
数据分析之共同好友统计
http://www.aboutyun.com/thread-18826-1-1.html
1.如何统计好友?
2.如何用代码实现?
3.用到的算法是什么?
Kafka Streams入门指南
http://www.aboutyun.com/thread-18827-1-1.html
1.什么是Kafka Streams?
2.有哪些核心概念?
3.参数如何配置?
hadoop伪分布式安装
http://www.aboutyun.com/thread-18835-1-1.html
资源:
hadoop2.6+zookeeper-3.4.6+hbase-1.0.3+hive1.2.1环境搭建
http://www.aboutyun.com/thread-18824-1-1.html
hive编程入门课程——少杰
http://www.aboutyun.com/thread-18839-1-1.html
hive随谈之hive入门
http://www.aboutyun.com/thread-18840-1-1.html
问答:
sparkSQL问题
http://www.aboutyun.com/thread-18822-1-1.html
hive加载hbase表出错
http://www.aboutyun.com/thread-18832-1-1.html
swift存储问题
http://www.aboutyun.com/thread-18836-1-1.html
spark sql 最简单的例子一直运行不成功
http://www.aboutyun.com/thread-18837-1-1.html
求解 namenode启动失败
http://www.aboutyun.com/thread-18838-1-1.html
Eclipse向Spark集群提交任务时找不到主类
http://www.aboutyun.com/thread-18841-1-1.html
openstack访问keystone获得的token是保存在哪里的?
http://www.aboutyun.com/thread-18842-1-1.html
求Intellij idea开发spark应用程序完全教程
http://www.aboutyun.com/thread-18843-1-1.html
about云2016年06月13日每日一读
Kylin环境搭建和操作
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18809
1.什么是Kylin? 2.怎样搭建Kylin环境? 3.Kylin工作原理是什么?
支持关系型数据库及NoSQL的统一数据建模方案
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18811
1.什么是Unified Modelset? 2.Unified Modelset中怎样查询? 3.Unified Modelset中怎样统一链接数据库?
分享:
spark on yarn UI界面问题
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18800
资源:
IBM-bigtable系统和结构【英文】
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18817
基于hadoop的统一数据存储和分析平台
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18818
问答:
请问kylin如何做增量cube?
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18802
该运行状况测试不良,因为 Service Monitor 未找到活动 XXX
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18812
【求助】cloudera-scm-server启动后就吊死
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18813
Kylin Cube 创建教程
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18803
spark运行不报错,但是没有正确结果出现
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18804
求助 flume + kafka 异常 java.nio.BufferUnderflowException
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18805
新手提问,swift可以单独安装不?
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18806
about云2016年06月12日每日一读
Kafka - SQL 引擎分享
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18793
1.在Kafka中使用SQL的流程是什么? 2.怎样配置Kafka,使得在Kafka中使用SQL? 3.在Kafka中使用SQL有哪些注意事项?
入职阿里巴巴数据分析师——我的10个关键转折点
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18794
1.怎样成为一名数据分析师? 2.怎样做好定位? 3.怎样调整学习方向?
Spark 2.0中Dataset介绍和使用
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18780
1.什么是dataset?
2.本文认为DataSet和RDD主要的区别是是什么?
3.Dataset Wordcount实例本文用了几步?
绝不能错过的10款最新OpenStack网络运维&监控工具
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18782
1. TAAS 的用途是什么?
2. Skydive的用途是什么?3. DSCP是什么?如何在OpenStack中使用?
4. 如何实现对OpenStack网络Trouble shoot?
5. LBaaS是什么?
6. OVS是什么?
7. DNS如何设设置?
8. DVR 场景下 SNAT Router 的高可用功能如何实现?
9. 没有 DVR 时TWC 公司是怎么设计 OpenStack 架构的?
大数据对统计思维的影响
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18787
1.统计思维本文认为发生了哪些变化?
2.数据分析思维的变化本文强调了哪三点?
3.面对大数据,需要考虑哪些内容?
R与Hadoop结合实现的三种方式介绍
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18788
1.如何实现R与Hadoop联合作业?
2.你认为有几种方法实现R与Hadoop结合?
3.本文介绍了哪三种方式?
资源:
IDEA 及其插件
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18783
问答:
解决'Error contacting service. It is probably not running.'问题
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18791
启动hadoop后,fs.defaultFS中配置的9000端口没有出现在监听中?
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18792
linux sftp修改配置文件
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18773
apache hadoop2.7.1源码编译报错
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18779
从一个简单例子分析stage划分
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18776
spark on yarn 客户端WEB UI界面打不开
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18790
求救:如何离线安装hue啊
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18781
mapreduce 分区输出多个文件
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18784
spark on yarn 配置和运行方法
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18785
spark on yarn 提交到集群运行报错
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18786
hdfs-site.xml中的dfs.namenode.rpc-address可以不配置吗?
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18789
hadoop集群安装:是不是安装配置好namenode后,把整个安装目录分发到各datanode上?
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18795
about云2016年06月09日每日一读
得到老板赏识的5条建议
http://www.aboutyun.com/thread-18765-1-1.html
1. 你主动性强吗?
2. 你是否考虑过产品这样做是否合理?
3. 你把产品当成自己的产品了吗?
4. 你把公司和你捆绑在一起了吗?
5. 你反省过自己吗?
从Storm到Heron,Twitter的实时计算框架有哪些重大进化?
http://www.aboutyun.com/thread-18770-1-1.html
1.Twitter 为什么选择 real time 模式?
2.Twitter Storm 是什么?
3.Why Heron?
4.Heron in practice 是什么样?
5.Heron Performance 怎么样?
6.关于Heron 有哪些常问Q&A对话?
资源:
spark参考书
http://www.aboutyun.com/thread-18760-1-1.html
Linux_Kernel核心中文手册(内核图解)
http://www.aboutyun.com/thread-18771-1-1.html
问答:
求助 hdfs查询目录下文件数量 包括子目录文件数量
http://www.aboutyun.com/thread-18759-1-1.html
spark集群Java生成libsvm模型的效率问题
http://www.aboutyun.com/thread-18761-1-1.html
有配置federation吗总说Unable to determine the nameservice
http://www.aboutyun.com/thread-18762-1-1.html
从mysql导入到hive后,看不到hive表数据
http://www.aboutyun.com/thread-18763-1-1.html
HBASE 组授权,无法使用
http://www.aboutyun.com/thread-18764-1-1.html
无法用sqoop把hive导到mysql
http://www.aboutyun.com/thread-18766-1-1.html
storm读取kafka中新消息SpoutConfig.forceFromStart 找不到
http://www.aboutyun.com/thread-18767-1-1.html
请教如何将其他虚拟机创建的映像加加入到openstack进行管理
http://www.aboutyun.com/thread-18769-1-1.html
about云2016年06月08日每日一读
Spark(1.6.1) Sql 编程指南+实战案例分析
http://www.aboutyun.com/thread-18753-1-1.html
1、Spark SQL操作流程有哪些?
2、如何加载/保存数据源?
3、保存模式有哪些?
基于HBase的冠字号查询系统2--实现部分
http://www.aboutyun.com/thread-18752-1-1.html
1、冠字号查询系统功能包括哪些内容?
2、取款流程和存款流程代码如何实现?
资源:
scala编程
http://www.aboutyun.com/thread-18745-1-1.html
Spark Streaming使用和概要图:时金魁
http://www.aboutyun.com/thread-18755-1-1.html
Spark2.0-陈超
http://www.aboutyun.com/thread-18756-1-1.html
问答:
openstack MQP server controller:5672 closed the connection. Check login crede...
http://www.aboutyun.com/thread-18748-1-1.html
PHP连接HIVE通过web页面图形化显示hive查询结果
http://www.aboutyun.com/thread-18744-1-1.html
scala程序报错bad symbolic reference to org.apache.hadoop.io encountered in cl...
http://www.aboutyun.com/thread-18743-1-1.html
谁在spark下调用过中科院的ICTCLAS50分词器
http://www.aboutyun.com/thread-18750-1-1.html
liberity的云主机控制台日志没有,创建后脚本执行不了
http://www.aboutyun.com/thread-18749-1-1.html
HDFS那个HA不错,但如果坏了一个,怎么重建?
http://www.aboutyun.com/thread-18754-1-1.html
spark运行中问题
http://www.aboutyun.com/thread-18757-1-1.html
about云2016年06月07日每日一读
高可用Hadoop平台-Oozie工作流
http://www.aboutyun.com/thread-18733-1-1.html
1.什么是Oozie? 2.Oozie Server的依赖有哪些?
3.如何配置Oozie?
什么是深度学习以及为什么你要了解它?
http://www.aboutyun.com/thread-18735-1-1.html
1.什么是深度学习?
2.与其它方法相比,有什么优点?
3.为什么要研究深度学习?
hadoop开发诚招大牛,坐标上海or北京,不能错过
http://www.aboutyun.com/thread-18740-1-1.html
资源:
Spark_Mllib_实践与优化_雷宗雄
http://www.aboutyun.com/thread-18739-1-1.html
并行发展的基础架构_Gator.pdf
http://www.aboutyun.com/thread-18741-1-1.html
问答:
求助,这个dataframe的scala代码怎么写
http://www.aboutyun.com/thread-18734-1-1.html
如果进行日志数据的字段分割
http://www.aboutyun.com/thread-18736-1-1.html
about云2016年06月06日每日一读
Spark Streaming优化介绍和应用
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18714
1.lambda架构原理是什么?
2.Hulu怎么进行数据收集?
3.怎么样监控数据?
基于Spark的风控系统架构实践和技术细节【京东】
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18715
1.京东天网系统是做什么的?
2.天网系统主要有哪些模块?
3.天网系统怎么样对电子商务中的交易进行风险管控?
Spark Streaming怎样保证数据零丢失
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18719
1.spark streaming怎样做到可靠的sources和可靠的receivers? 2.数据可能的丢失场景有哪些? 3.什么是WAL?
基于HBase的钞票识别查询系统1--理论部分
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18720
1.钞票识别查询系统的功能有哪些? 2.钞票识别查询系统的架构是怎样的? 3.怎样基于HBase进行钞票识别查询系统的数据库设计?
基于SSH的HDFS文件管理系统
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18726
1.怎样利用hdfs管理文件? 2.hdfs中怎样检索文件夹? 3.怎样读取序列文件?
六步让你从数据分析小白变成高手
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18727
1.数据分析的步骤是什么? 2.怎样进行数据治理? 3.怎样做指标分析?
资源:
张宁--移动大数据技术在互联网金融获客及经营中的应用
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18730
鲜活的数据:数据可视化指南[书籍]
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18729
问答:
neutron网络创建实例500错误
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18721
spark-shell报错Please check the values of 'yarn.scheduler.maximum-allocation-mb'
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18707
spark-submit运行程序报错
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18708
pip install Babel-2.1.1.tar.gz出现错误
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18709
hbase启动报错,求大神帮助
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18710
ubuntu mysql用dump命令导出的数据库放在哪了
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18711
hadoop HA双机可自动切换。但如果启动时只能启动一个咋办?
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18712
如何访问需要kerberos认证的web
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18713
CDH能集成storm吗?
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18716
nova --debug boot return http 500 error
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18717
【求助】CDH5.3中balancer报错
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18718
用过elasticsearch的来解答一下
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18722
spark-shell中读取压缩文件报错
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18724
oozie启动失败
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18725
about云2016年06月03日每日一读
Hadoop 3.0做了哪些改变
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18701
1.hadoop3.0是基于jdk1.7还是1.8?
2.Hadoop 3.0有哪些新特性?
3.Hadoop 3.0YARN有哪些变化?
Apache Spark 2.0概述
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18702
1.spark ML持久性的关键特性包括哪些?
2.Apache Spark 2.0为何说为机器学习模型注入持久性?
资源:
淘宝海量数据产品技术
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18703
openstack所有命令
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18705
问答:
sqoop1居然安装后不好使了
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18687
Hive无法执行语句
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18688
运行完spark-submit后,master进程自动结束了
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18689
sqoop1安装后不读lib下的jar
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18690
编译spark后运行spark-shell和spark sql报错
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18691
您的Cloudera Enterprise Data Hub Edition试用版已过期(有影响吗?)
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18692
Spark Streaming实时更新Mllib中的算法模型
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18694
关于hive thrift server的疑问
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18695
keystone-manage.py带来的问题,求解
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18696
hive-hbase整合后 查全部能查 条件差报错
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18697
碰到scala的一个奇怪的问题,请大家帮忙看看
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18698
hadoop-2.2 + nutch-1.7报错贴上,请大神点拨
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18699
nova问题求助
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18704
about云2016年06月02日每日一读
搜索引擎索引的数据结构和算法
http://www.aboutyun.com/thread-18677-1-1.html
1.索引技术的基础是什么?
2.如何建立索引?
3.如何进行查询处理?
4.如何进行短语查询?
HBase 40道测试题【附答案】
http://www.aboutyun.com/thread-18678-1-1.html
1.基础能力都是什么?
2.HBase核心知识点有哪些?
3.HBase 高级应用有哪些重点?
4.HBase 安装、部署、启动如何考察?
spark安装总结
http://www.aboutyun.com/thread-18673-1-1.html
资源:
云计算在智能电网调度技术支持系统中的应用研究
http://www.aboutyun.com/thread-18684-1-1.html
云计算在供应链管理中的应用
http://www.aboutyun.com/thread-18685-1-1.html
问答:
storm拓扑运行时无法启动nimbus
http://www.aboutyun.com/thread-18672-1-1.html
spark on yarn mysql找不到驱动的错误
http://www.aboutyun.com/thread-18674-1-1.html
hiveserver启动后就一直停留在等待界面
http://www.aboutyun.com/thread-18675-1-1.html
大神们,解决下ceph和openstack整合的问题
http://www.aboutyun.com/thread-18676-1-1.html
sqoop 导入 hive 报错
http://www.aboutyun.com/thread-18679-1-1.html
spark集群环境运行报错
http://www.aboutyun.com/thread-18680-1-1.html
Hive的meta store 拒绝链接
http://www.aboutyun.com/thread-18681-1-1.html
网络节点neutron配置问题
http://www.aboutyun.com/thread-18682-1-1.html
Spark运行报check your cluster UI to ensure that workers are registered and ha...
http://www.aboutyun.com/thread-18683-1-1.html
about云2016年06月01日每日一读
层次聚类算法的原理及实现Hierarchical Clustering
http://www.aboutyun.com/thread-18658-1-1.html
1、如何理解层次聚类?
2、如何理解数据点与组合数据点间的距离?
3、如何求得两个组合数据点间的距离?
Flume+Hadoop+Hive的离线分析系统基本架构(一)
http://www.aboutyun.com/thread-18660-1-1.html
1、如何设计离线分析系架构?
2、Flume如何收集日志信息?
3、如何使用Mapreduce清洗日志文件?
Flume+Hadoop+Hive的离线分析系统基本架构(二)
http://www.aboutyun.com/thread-18662-1-1.html
1、如何使用Mapreduce清洗日志文件?
2、如何使用HIVE建立数据仓库?
资源:
Hadoop在雅虎的应用
http://www.aboutyun.com/thread-18666-1-1.html
Hadoop云计算平台在视频转码上的应用
http://www.aboutyun.com/thread-18667-1-1.html
问答:
spark-shell 执行代码报错
http://www.aboutyun.com/thread-18656-1-1.html
Impala可以读取HDFS和HBASE,两者有什么不同
http://www.aboutyun.com/thread-18657-1-1.html
创建的实例安装软件很慢
http://www.aboutyun.com/thread-18659-1-1.html
关于租户隔离问题
http://www.aboutyun.com/thread-18663-1-1.html
sqoop 1.99.6 server启动不了
http://www.aboutyun.com/thread-18664-1-1.html
about云2016年05月31日每日一读
程序员的薪资是怎么得来的?
http://www.aboutyun.com/thread-18640-1-1.html
1.能力决定薪资? 2.业务与薪资关系? 3."功利心",你有吗?
商品搜索引擎—推荐系统设计
http://www.aboutyun.com/thread-18641-1-1.html
1.推荐系统有什么需要了解?
2.Mahout,你懂多少?
3.如何个性化推荐?
【国云大数据魔镜】免费云分析平台全新上线,欢迎使用!(一)
http://www.aboutyun.com/thread-18642-1-1.html
【国云大数据魔镜】免费云分析平台全新上线,欢迎使用!(二)
http://www.aboutyun.com/thread-18645-1-1.html
【国云大数据魔镜】免费云分析平台全新上线,欢迎使用!(三)
http://www.aboutyun.com/thread-18648-1-1.html
【国云大数据魔镜】免费云分析平台全新上线,欢迎使用!(三)
http://www.aboutyun.com/thread-18649-1-1.html
资源:
新浪:发现信息应用之美-数据可视化与SNS分析
http://www.aboutyun.com/thread-18652-1-1.html
腾讯云存储:专业的存储解决方案
http://www.aboutyun.com/thread-18653-1-1.html
问答:
求助服务器宕机之后启动发生如下错误
http://www.aboutyun.com/thread-18636-1-1.html
各位大神,请教一个sqoop2安装后使用时总是报错问题,求指导
http://www.aboutyun.com/thread-18638-1-1.html
sqoop2,将数据导入hive怎么设置
http://www.aboutyun.com/thread-18643-1-1.html
kafka GSSHeader did not find the right tag
http://www.aboutyun.com/thread-18644-1-1.html
mapreduce 处理JSON 数据
http://www.aboutyun.com/thread-18646-1-1.html
跪求哪个大神推荐python实战项目例如(爬虫、Django)或者openstack的nova和keysto...
http://www.aboutyun.com/thread-18650-1-1.html
[ 求助] storm读取kafka数据报错
http://www.aboutyun.com/thread-18651-1-1.html
[求助]storm 读取 kafka数据 有关zookeeper的相关设置
http://www.aboutyun.com/thread-18654-1-1.html
about云2016年05月30日每日一读
Spark多数据源计算实践及其在GrowingIO的实践
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18615
1.数据处理效率的问题,Spark定义了API的接口,主要有哪3个方式?
2.Spark DataSource实现代码有哪三大类?
3.GrowingIO的数据平台主要分为哪两部分应用?
分布式搜索引擎设计
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18616
1.为什么要分布式?
2.如何进行分布式设计?
3.服务功能分布式如何拆分的?
如何在面试中发现优秀程序员
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18624
1.怎样测试简历的真实性? 2.怎样发现实际的经验? 3.怎样验证经验?
NoSQ及相关大数据介绍
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18625
1.NoSQL领域中有哪些技术? 2.如何使用Couchbase? 3.Couchbase 和 ElasticSearch的区别区别是什么?
支撑微博万亿级访问的Redis优化历程
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18633
1.怎样实现机制高可用优化? 2.怎样做到业务极致定制? 3.怎样实现Redis服务化?
Spark在微博Feed算法中的应用实践
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18634
1.新浪微博的三层架构是怎样的? 2.新浪微博的Feed使用场景? 3.新浪微博的Feed是怎样排序的?
2016年about云05月第05周经典帖子总结
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18632
资源:
大数据时代:生活、工作与思维的大变革
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18630
大数据可视化与可视化分析的机遇与挑战
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18631
问答:
spark运行自带示例看不到效果
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18604
flume写文件到hdfs中,文件过小
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18606
请问一下如何在集合中插入数据
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18607
安装openstack遇到的奇怪问题
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18608
安装openstack遇到的奇怪问题
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18608
nova问题求助
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18609
nova指定硬盘大小问题?
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18611
run as scala application找不到
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18612
nova的zone列表怎么查询?
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18613
kafka Received -1 when reading from channel, socket has likely been closed.
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18614
求助:eclipse远程提交mapreduce任务报错
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18617
spark启动后没有work进程
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18618
hive 出现java.io.IOException: Bad file descriptor 帮忙分析
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18619
如何将数据放入cache层表中
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18620
dashboard提示认证发生错误。请稍候再试一次。
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18621
cinder问题求助
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18622
怎么测试spark是否成功
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18626
hadoop-2.2+hbase-0.96集群+nutch1.8 fetch报错
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18629
about云2016年05月27日每日一读
Spark 附带示例完整解释
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18591
1. 为什么需要scp命令?如何使用scp命令?
2. 从分析日志和分析网页计分的例子中学习如何编写简单Spark程序。
3. Spark作业如何调度?
程序员的面试技巧
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18599
资源:
openstack初步详细部署
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18600
Scala例子讲解英文版
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18601
问答:
求助:win7下免Cygwin配置hadoop伪分布模式
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18593
spark运行任务中报错
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18598
CDH页面下载HDFS文件解析地址出错
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18602
如何通过spark的RDD的转化 去做数据清洗?
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18586
求一spark详细实例
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18587
求助storm问题
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18588
进行nova数据库同步时,出错。请达人帮助;谢谢!
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18590
如何使用RDD的转换去分析复杂一点的数据类型
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18592
计算圆周率出现如下错误
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18594
spark的driver和work的问题
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18595
关于hadoop-2.2.0 + hbase-0.96.2集群中nutch版本选择问题
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18596
谁能帮我看看问题?
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18597
about云2016年05月26日每日一读
网易视频云:基于Hadoop山寨Amazon S3
http://www.aboutyun.com/thread-18577-1-1.html
1.什么是Amazon S3?
2.怎样构建我们自己的HOS(Humor Object Storage)?
3.如何实现我们的HOS?
HBase表管理系统
http://www.aboutyun.com/thread-18576-1-1.html
1. 软件是什么版本和如何部署?
2.系统功能介绍及核心如何实现?
3.如何对表进行增删改查?
怎么使用密码来登录openstack实例
http://www.aboutyun.com/thread-18574-1-1.html
资源:
面试题目-大数据量海量数据处理
http://www.aboutyun.com/thread-18581-1-1.html
使用MongoDB进行伸缩
http://www.aboutyun.com/thread-18580-1-1.html
问答:
squirrel-sql-3.7.1连接phoenix报错!
http://www.aboutyun.com/thread-18582-1-1.html
大神救我ERROR: org.apache.hadoop.hbase.PleaseHoldException: Master is initial...
http://www.aboutyun.com/thread-18579-1-1.html
求教,CDH版本zookeeper警告是怎么回事?如图
http://www.aboutyun.com/thread-18575-1-1.html
启动spark报错
http://www.aboutyun.com/thread-18572-1-1.html
about云2016年05月25日每日一读
逻辑回归算法的原理及实现(LR)
http://www.aboutyun.com/thread-18562-1-1.html
1、什么是逻辑回归算法?
2、如何理解一元、多元逻辑归回?
3、如何使用逻辑归回模型解决问题?
MapReduce 编程模型在日志分析方面的应用
http://www.aboutyun.com/thread-18564-1-1.html
1、如何理解MapReduce 编程模型?
2、如何对访问网页用户日志进行分析?
3、MapReduce模型如何对应实现?
资源:
scala-2.11.6.tgz+spark-1.5.2-bin-hadoop2.6.tgz
http://www.aboutyun.com/thread-18561-1-1.html
支付宝-海狗的技术原理与实现
http://www.aboutyun.com/thread-18569-1-1.html
丛磊-Nosql在SAE中的应用
http://www.aboutyun.com/thread-18570-1-1.html
问答:
求大神解决问题-hive-mapreduce问题
http://www.aboutyun.com/thread-18559-1-1.html
求助:
http://www.aboutyun.com/thread-18560-1-1.html
MapReduce 如何一次统计多个指标
http://www.aboutyun.com/thread-18563-1-1.html
有没有用mapreduce实现决策树的?
http://www.aboutyun.com/thread-18565-1-1.html
centos7 openstack swift stat 报错
http://www.aboutyun.com/thread-18566-1-1.html
CDH配置kerberos后无法重启
http://www.aboutyun.com/thread-18567-1-1.html
MR任务在reduce阶段超时!
http://www.aboutyun.com/thread-18568-1-1.html
about云2016年05月24日每日一读
Hive on Spark入门设置【编程】
http://www.aboutyun.com/thread-18547-1-1.html
1.从哪个版本开始,Hive on Spark已经成为Hive代码的一部分了?
2.在Hive中使用Spark执行引擎,需要做哪些配置准备?
3.hive有哪两种加载Spark相关包的方法?
Python爬虫和情感分析简介
http://www.aboutyun.com/thread-18548-1-1.html
1.什么是情感分析
2.Python爬虫如何编写?
3.如何特征转化?
程序员也要养生
http://www.aboutyun.com/thread-18546-1-1.html
1.程序员如何养生?
2.程序员需要注意什么?
3.程序员的健康问题有哪些方面引起?
资源:
Java基础资料
http://www.aboutyun.com/thread-18554-1-1.html
深入JVM内核—原理、诊断与优化
http://www.aboutyun.com/thread-18553-1-1.html
R语言进阶
http://www.aboutyun.com/thread-18552-1-1.html
问答:
如何配置hive,使hive能使用spark引擎
http://www.aboutyun.com/thread-18545-1-1.html
用swift做cinder的备份驱动,配置文件怎么写
http://www.aboutyun.com/thread-18544-1-1.html
hbase数据统计:spark VS 协处理器+过滤器 哪种更有优势
http://www.aboutyun.com/thread-18543-1-1.html
nova运维问题求助
http://www.aboutyun.com/thread-18540-1-1.html
如何修改yarn/cluster的时间格式
http://www.aboutyun.com/thread-18549-1-1.html
添加journalnode需要重新格式吗
http://www.aboutyun.com/thread-18551-1-1.html
求助帖:实例状态为ERROR
http://www.aboutyun.com/thread-18550-1-1.html
大数据问题求助
http://www.aboutyun.com/thread-18557-1-1.html
hive问题求助
http://www.aboutyun.com/thread-18555-1-1.html
HBase “Failed getting lock in batch put”错误的疑问
http://www.aboutyun.com/thread-18556-1-1.html
about云2016年05月23日每日一读
TaskScheduler内幕天机:Spark shell案例,TaskScheduler和SchedulerBackend、FIFO...
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18534
1.什么是TaskSchedulerBackend、SchedulerBackend? 2.FIFO与FAIR两种调度模式有什么区别? 3.Task数据本地性资源怎样分配的?
Lucene全文搜索原理与使用
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18535
1.什么是结构化数据与非结构化数据? 2.什么是全文检索? 3.Lucene实现全文搜索的流程是怎样的?
架构大数据分析应用
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18514
1.如何定义大数据表征?
2.架构数据分析应用本文用到了哪些技术?
3.本文是如何规划大数据架构的?
基于Redis实现简单的分布式锁
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18513
1.本文分布式锁说了哪些要点?
2.基于Redis单例如何实现?
3.基于Redlock算法如何实现的?
Redis网络架构及单线程模型
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18522
1.Redis网络层基础组件主要包括哪几部分? 2.什么是Redis的单线程模型?
3.Redis怎样接收网络连接?
优秀程序员的十个习惯
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18523
2016年about云05月第04周经典帖子总结
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18529
资源:
hbase在淘宝应用及改进
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18537
Linux在淘宝环境中的应用
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18538
问题:
Hadoop2.7实战v1.0之Linux参数调优
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18501
hive 实现并发执行多任务
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18503
求助!!Mapreduce 使用distributedCache 的问题
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18506
hbase节点断网后不能正常连入集群
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18507
hadoop中出现Java heap space
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18509
x point org.apache.nutch.net.URLNormalizer not found.
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18511
MapReduce查找相邻记录
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18512
hbase启动时报错
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18515
HA+Federation中datanode格式化出现异常...不能为多个namenode提供服务
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18516
hadoopHA运行mapreduce报错
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18517
spark输出log信息中怎么过滤INFO信息
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18519
storm nimbus 起不来
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18520
hbase分组统计问题
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18521
CDH5.7sqoop导入hbase报错HBase jars are not present in classpath
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18524
hive执行多表关联卡住不动问题解决
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18528
Kafka server启动问题
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18532
Mapreduce 的组合依赖关系的问题
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18533
about云2016年05月20日每日一读
Apache Flink:详细入门
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18491
1.Apache Flink是什么?
2.Flink在实现流处理和批处理时,与传统的一些方案有什么不同?
3.Apache Flink流处理有哪些特性?
Spark:Master High Availability(HA)高可用配置的2种实现
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18498
1. Spark的HA实现可以通过哪几种方式实现? 2. 基于文件系统的单点恢复实现HA如何配置? 3. 基于zookeeper的Standby Masters实现HA如何配置?
资源:
淘宝:分布式存储与TDDL2
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18492
LVS在淘宝环境中的应用(追风堂)
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18493
问答:
hive启动元数据库报错
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18486
spark提交application,Initial job has not accepted any resources
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18490
怎么确认hadoop HA环境的mapreduce是正常的
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18494
hive创建hbase外部表的问题
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18495
不知道从哪里开始看
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18497
about云2016年05月19日每日一读
为 Mahout 增加聚类评估功能
http://www.aboutyun.com/thread-18474-1-1.html
1.聚类(clustering)是无监督学习还是监督学习?
2.什么是聚类评估算法?
3.如何产生聚类需要的向量文件?
我是如何准备技术面试的
http://www.aboutyun.com/thread-18480-1-1.html
1.经历过哪些面试?
2.新美大面试如何?
3.腾讯的面试如何?
4.面试前需要的准备?
理解 OpenStack 高可用(2):虚拟路由冗余协议
http://www.aboutyun.com/thread-18482-1-1.html
1.虚拟路由冗余协议 - VRRP 是什么?
2.什么是Keepalived
关于HTML5和CSS替换使用
http://www.aboutyun.com/thread-18471-1-1.html
mahout什么是向量
http://www.aboutyun.com/thread-18473-1-1.html
资源:
基于MapReduce的加权Voronoi图并行算法设计及应用
http://www.aboutyun.com/thread-18477-1-1.html
KVM虚拟化实战视频
http://www.aboutyun.com/thread-18478-1-1.html
问答:
为啥mahout将SquenceFile转换成向量的时候没有产生cluster?
http://www.aboutyun.com/thread-18468-1-1.html
请问有人用过Oozie的JMS通知功能吗?
http://www.aboutyun.com/thread-18469-1-1.html
hdfs的副本数量是否hbase的查询性能有影响
http://www.aboutyun.com/thread-18470-1-1.html
hadoop指定文件输入参数问题
http://www.aboutyun.com/thread-18476-1-1.html
CM5.7+CDH5.5.3运行过程中zookeeper的连接数总是在增长
http://www.aboutyun.com/thread-18479-1-1.html
reduce阶段跑不通
http://www.aboutyun.com/thread-18481-1-1.html
HCatlog访问Hive的问题
http://www.aboutyun.com/thread-18483-1-1.html
hadoop jar包导入javaweb项目中tomcat起不来
http://www.aboutyun.com/thread-18484-1-1.html
about云2016年05月18日每日一读
zookeeper错误排除总结
http://www.aboutyun.com/thread-18448-1-1.html
Flume+Kafka收集Docker容器内分布式日志应用实践
http://www.aboutyun.com/thread-18452-1-1.html
1、如何设计Flume+Kafka收集架构?
2、如何修改Docker内配置文件?
3、如何进行Flume配置?
4、如何定制RollingByTypeAndDayFileSink?
程序员,我们都是夜归人
http://www.aboutyun.com/thread-18453-1-1.html
1、程序员为什么需要加班?
2、做好哪些方面可以避免加班?
hive 2.0.0遇到问题总结
http://www.aboutyun.com/thread-18456-1-1.html
资源:
搜索引擎构建与爬虫技术[全套视频]
http://www.aboutyun.com/thread-18464-1-1.html
搜搜-机器学习平台汇报
http://www.aboutyun.com/thread-18465-1-1.html
问答:
hbase启动问题
http://www.aboutyun.com/thread-18441-1-1.html
求解
http://www.aboutyun.com/thread-18442-1-1.html
启动hive时候报如下错误
http://www.aboutyun.com/thread-18443-1-1.html
救助!eclipse win7上远程无法提交job
http://www.aboutyun.com/thread-18445-1-1.html
Resourse里面的时间应该怎么转换时区?
http://www.aboutyun.com/thread-18446-1-1.html
map端数据倾斜
http://www.aboutyun.com/thread-18447-1-1.html
怎么提高hbase压缩数据的速度
http://www.aboutyun.com/thread-18450-1-1.html
求一hive2.0配置
http://www.aboutyun.com/thread-18454-1-1.html
spark配置ha(用zookeeper)
http://www.aboutyun.com/thread-18455-1-1.html
大神赐教cinder 备份方面的
http://www.aboutyun.com/thread-18457-1-1.html
安装配置计算节点的问题求解答
http://www.aboutyun.com/thread-18458-1-1.html
初学者求助
http://www.aboutyun.com/thread-18459-1-1.html
OpenStack一体机
http://www.aboutyun.com/thread-18460-1-1.html
有人了解org.apache.hadoop.hbase.client.Put这个包吗?
http://www.aboutyun.com/thread-18463-1-1.html
CDH5.7 启动namenode报错Connection Refused
http://www.aboutyun.com/thread-18466-1-1.html
about云2016年05月17日每日一读
程序员你为什么这么忙?
http://www.aboutyun.com/thread-18429-1-1.html
1.目标比结果重要? 2.做好一件事,胜于做过十件事? 3.如何减少犹豫?
http://www.aboutyun.com/thread-18428-1-1.html
资源:
云计算Docker虚拟化全套教程分享【限时】
http://www.aboutyun.com/thread-18438-1-1.html
华为FusionInsight HD 2.3基础技术-Spark
http://www.aboutyun.com/thread-18439-1-1.html
问答:
map如何处理分块数据,保证数据的完整性
http://www.aboutyun.com/thread-18425-1-1.html
使用open vswitch构建虚拟网络
http://www.aboutyun.com/thread-18426-1-1.html
HDFS主机上硬盘问题
http://www.aboutyun.com/thread-18431-1-1.html
Nova配置多个Hypervisor
http://www.aboutyun.com/thread-18432-1-1.html
新手刚接触openstack,望大神指导下
http://www.aboutyun.com/thread-18433-1-1.html
hdfs对历史文件压缩
http://www.aboutyun.com/thread-18434-1-1.html
关于cloudera异常bad-health告警如何解决
http://www.aboutyun.com/thread-18435-1-1.html
构建hadoop的ha,ResourceManager和DFSZKFailoverController会挂掉,报错如下
http://www.aboutyun.com/thread-18436-1-1.html
求大神解决mitaka horizon登不上去
http://www.aboutyun.com/thread-18437-1-1.html
about云2016年05月16日每日一读
将 Spark 中的文本转换为 Parquet 以提升性能
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18422
1.什么是Parquet? 2.Hbase怎样转换为Parquet?
使用 Spark Streaming 检测关键词
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18420
1.什么是Spark Streaming? 2.怎样用Spark Streaming做关键词检测? 3.怎样实现关键词检测程序?
e袋洗的微服务架构之路与Docker实践
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18407
1.为什么要拆成微服务的架构? 2.单体架构有什么问题? 3.拆分微服务可能会带来的问题?
用实例讲解Spark Sreaming
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18409
1.什么是Spark Streaming? 2.Spark Streaming如何工作? 3.怎样实现Spark Streaming?
基于MapReduce的计算几何--CG_Hadoop
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18393
1.什么是CG_Hadoop?
2.CG_Hadoop有哪几个基础操作?
3.CG_Hadoop具有哪两个版本?
2016年about云05月第03周经典帖子总结
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18417
乐视+金山+360面试经历与感受--积累很重要
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18394
hadoop常见错误汇总【2016】
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18421
资源:
为什么Docker是云计算必然的现在和未来1【视频】
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18418
深入Docker的镜像、容器和仓库以及测试下的Docker2【视频】
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18419
hadoop集群环境所需资源汇总 之安装文档
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18403
问答:
yarn-clientm模式下无法找到第三方jar包的问题
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18395
namenode和resourcemanager启动不了
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18405
keystone问题求助
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18387
CDH 纯离线方式安装之后没有hadoop和spark等命令?
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18391
mapreduce求图中点组成的多边形个数···
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18390
求助! 服务器突然断电后再启动CDH时cloudera-scm-server无法启动
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18389
namenode的元数据问题
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18388
nova 取不到token问题求助
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18392
咨询一个HBase集群问题
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18396
hive2.0多表操作问题
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18397
hive查询时出错,求大神帮助啊!
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18399
neutron gre网络模式下,实例获取不到ip地址
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18404
想知道NBA是如何收集比赛,球员数据的
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18406
【已解决】CDH5.7Hue使用sqoop导出mysql数据报错
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18411
关于hadoop的classpath问题
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18412
同学面试的hadoop一些题,求大牛一起解答
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18413
hive不能删除表,建表也出现问题
http://www.aboutyun.com/forum.php?mod=viewthread&tid=18415
|