分享

2016年about云11月第02周经典帖子总结

小桥流水 发表于 2016-11-12 18:36:48 [显示全部楼层] 回帖奖励 阅读模式 关闭右栏 0 5270
本帖最后由 小桥流水 于 2016-11-12 18:56 编辑

数据挖掘就业解答及相关说明
http://www.aboutyun.com/forum.php?mod=viewthread&tid=20199&extra=
1.数据挖掘主要是做算法还是做应用?分别都要求什么?
2.北上广以外的普通公司用的多吗?待遇如何?
3.和前端后端程序员比有什么区别?有什么优缺点?
4.目前在学习机器学习,如果想找数据挖掘方面的工作应该学习哪些内容?
5.hadoop,hive之类的需要学习吗?




HBase RegionServer宕机恢复三部曲
http://www.aboutyun.com/forum.php?mod=viewthread&tid=20207&extra=
1.HBase的故障恢复有哪三种不同模式?
2.HBase日志切分方法?
3.Distributed Log Replay解决了哪些问题?



如何使用Spark Streaming+ES构建App异常监控平台(以美团为例)
1. 为什么要选择Spark Streaming和Elasticsearch?
2. 如何解决异常重启和升级重导等问题带来的稳定性问题?
3. 为解决低延迟问题,需要在输入端和输出端做什么处理?
4. Elasticsearch在实时分析平台的优势是什么?
5. 如何提高整个平台的可扩展性?


无监督式机器学习之聚类分析及Autoencoder应用方向介绍
1、什么是无监督式机器学习?
2、聚类分析的流程有哪些?
3、什么是Autoencoder算法?


spark开发基础之从关键字、函数入门Scala
1.apply的作用是什么?
2.yield什么情况下使用?
3.partition如何使用?


Spark 日志解析示例包括运行、输出结果、源代码
1.本文分析的日志格式什么样的?
2.如何通过代码实现的?
3.分析网页计分例子如何实现的?


将 Spark Streaming + Kafka direct 的 offset 存入Zookeeper并重用
1. 使用Direct API时为什么需要见offset保存到Zookeeper中?
2. 如何将offset存入到Zookeeper中?
3. 如何解决Zookeeper中offset过期问题?


资源:

谁说菜鸟不会数据分析-(完整)

Python 之 django-1-8入门

中国智慧城市大数据应用市场研究白皮书

spark开发基础之Scala资源汇总

移劢大数据平台架构实践

算法之道

大数据岗位的面试总结【六个公司】

问答:

intellij idea开发的spark应用spark-submit提交正常运行,直接在idea提交有问题

没找到任何评论,期待你打破沉寂

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

推荐上一条 /2 下一条