分享

2016年about云08月第02周经典帖子总结

pig2 发表于 2016-8-14 17:44:21 [显示全部楼层] 回帖奖励 阅读模式 关闭右栏 0 4256


数据挖掘快速入门
http://www.aboutyun.com/thread-19434-1-1.html
1.什么是数据挖掘?
2.机器学习 与 数据挖掘在什么地方?
3.数据挖掘能解决什么问题?




从0到N建立高性价比的大数据平台
http://www.aboutyun.com/thread-19441-1-1.html
1、如何从无到有建立一个大数据平台?
2、对于传统数据仓库、日志分析工具适合多大数据量?
3、主流OLAP的利器有哪些?




Spark Streaming 快速入门
http://www.aboutyun.com/thread-19469-1-1.html
1.Spark Streaming 的作用是什么?
2.Spark Streaming工作原理是什么?
3.spark streaming 中的离散流是什么?


翻译:Hadoop权威指南之Spark-5
http://www.aboutyun.com/thread-19448-1-1.html
1.Spark是如何工作的?
2.Spark工作是如何提交的?
3.如何构建DAG?
4.如何对任务进行调度?
5.任务如何执行?
6.什么是spark的执行器和集群管理器?
7.Spark on YARN 的关系?
8.什么是YARN client模式?
9.什么是YARN cluster模式?





数据仓库中如何使用索引
http://www.aboutyun.com/thread-19483-1-1.html
1.数据库中索引的作用是什么?
2.什么是维度索引?
3.在事实表上建立索引需要考虑哪些问题?




用机器学习来计算工作技能的匹配度
http://www.aboutyun.com/thread-19484-1-1.html
1.本文的思路是什么?
2.分层聚类是什么?
3.什么是LDA?



Spark Task未序列化(Task not serializable)问题分析
http://www.aboutyun.com/thread-19464-1-1.html
1.  org.apache.spark.SparkException: Task not serializable 的原因是什么?
2. 如何在序列化类中标注不需要序列化的成员?
3. 什么时候类必须序列化(extends   Serializable)?
4. 如何解决Task not serializable错误?




Nutch 2.3.1 Hbase Hadoop Solr 整合(一)
http://www.aboutyun.com/thread-19437-1-1.html
1.你认为Nutch 2.3.1 Hbase Hadoop Solr整合需要哪些准备工作?
2.本文作者做了哪些准备?
3.整合的过程中,你认为哪些问题是比较重要的?


Nutch 2.3.1 Hbase Hadoop Solr 整合(二)
http://www.aboutyun.com/thread-19445-1-1.html






资源:
01 lucene基础入门视频【限时】
http://www.aboutyun.com/thread-19438-1-1.html



02 孔浩老师lucene视频教程及代码
http://www.aboutyun.com/thread-19439-1-1.html



lucene实战
http://www.aboutyun.com/thread-19443-1-1.html



全文检索【视频教程】
http://www.aboutyun.com/thread-19444-1-1.html



商业银行大数据应用的理论-实践与影响
http://www.aboutyun.com/thread-19470-1-1.html


Neutron Mitaka Update
http://www.aboutyun.com/thread-19471-1-1.html


luncene入门一套小视频
http://www.aboutyun.com/thread-19454-1-1.html


luncene(汤阳光)1
http://www.aboutyun.com/thread-19453-1-1.html






问答:
java或者scala如何生成parquet文件
http://www.aboutyun.com/thread-19482-1-1.html


根据几万个字段,rowkey过滤查询问题
http://www.aboutyun.com/thread-19476-1-1.html



hive启动报错 nullappender
http://www.aboutyun.com/thread-19491-1-1.html


cinder 云硬盘问题
http://www.aboutyun.com/thread-19486-1-1.html


collect完的数据如何以txt文本保存到hdfs指定路径上?
http://www.aboutyun.com/thread-19474-1-1.html



关于spark中map、reduce的一点疑问
http://www.aboutyun.com/thread-19447-1-1.html


没找到任何评论,期待你打破沉寂

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

推荐上一条 /2 下一条