2016年about云11月第02周经典帖子总结
本帖最后由 小桥流水 于 2016-11-12 18:56 编辑数据挖掘就业解答及相关说明
http://www.aboutyun.com/forum.php?mod=viewthread&tid=20199&extra=
1.数据挖掘主要是做算法还是做应用?分别都要求什么?
2.北上广以外的普通公司用的多吗?待遇如何?
3.和前端后端程序员比有什么区别?有什么优缺点?
4.目前在学习机器学习,如果想找数据挖掘方面的工作应该学习哪些内容?
5.hadoop,hive之类的需要学习吗?
HBase RegionServer宕机恢复三部曲
http://www.aboutyun.com/forum.php?mod=viewthread&tid=20207&extra=
1.HBase的故障恢复有哪三种不同模式?
2.HBase日志切分方法?3.Distributed Log Replay解决了哪些问题?
如何使用Spark Streaming+ES构建App异常监控平台(以美团为例)http://www.aboutyun.com/forum.php?mod=viewthread&tid=20209&extra=1. 为什么要选择Spark Streaming和Elasticsearch?2. 如何解决异常重启和升级重导等问题带来的稳定性问题?3. 为解决低延迟问题,需要在输入端和输出端做什么处理?4. Elasticsearch在实时分析平台的优势是什么?5. 如何提高整个平台的可扩展性?
无监督式机器学习之聚类分析及Autoencoder应用方向介绍http://www.aboutyun.com/forum.php?mod=viewthread&tid=20222&extra=1、什么是无监督式机器学习?
2、聚类分析的流程有哪些?
3、什么是Autoencoder算法?
spark开发基础之从关键字、函数入门Scalahttp://www.aboutyun.com/forum.php?mod=viewthread&tid=20223&extra=1.apply的作用是什么?
2.yield什么情况下使用?
3.partition如何使用?
Spark 日志解析示例包括运行、输出结果、源代码http://www.aboutyun.com/forum.php?mod=viewthread&tid=20238&extra=1.本文分析的日志格式什么样的?
2.如何通过代码实现的?
3.分析网页计分例子如何实现的?
将 Spark Streaming + Kafka direct 的 offset 存入Zookeeper并重用http://www.aboutyun.com/forum.php?mod=viewthread&tid=20244&extra=1. 使用Direct API时为什么需要见offset保存到Zookeeper中?
2. 如何将offset存入到Zookeeper中?
3. 如何解决Zookeeper中offset过期问题?
资源:
谁说菜鸟不会数据分析-(完整)http://www.aboutyun.com/forum.php?mod=viewthread&tid=20206&extra=
Python 之 django-1-8入门http://www.aboutyun.com/forum.php?mod=viewthread&tid=20211&extra=
中国智慧城市大数据应用市场研究白皮书http://www.aboutyun.com/forum.php?mod=viewthread&tid=20225&extra=
spark开发基础之Scala资源汇总http://www.aboutyun.com/forum.php?mod=viewthread&tid=20233&extra=
移劢大数据平台架构实践http://www.aboutyun.com/forum.php?mod=viewthread&tid=20239&extra=
算法之道http://www.aboutyun.com/forum.php?mod=viewthread&tid=20250&extra=
大数据岗位的面试总结【六个公司】http://www.aboutyun.com/forum.php?mod=viewthread&tid=20249&extra=
问答:
intellij idea开发的spark应用spark-submit提交正常运行,直接在idea提交有问题http://www.aboutyun.com/forum.php?mod=viewthread&tid=20251&extra=
页:
[1]