分享

2017年about云10月第04周经典帖子总结

pig2 发表于 2017-10-22 17:53:40 [显示全部楼层] 回帖奖励 阅读模式 关闭右栏 0 4279


日志分析实战之清洗日志小实例6:获取uri点击量排序并得到最高的url
http://www.aboutyun.com/forum.php?mod=viewthread&tid=22928
1.读取日志的过程中,发生异常本文是如何解决的?
2.读取后,如何过滤异常的记录?
3.如何实现统计点击最高的记录?




日志分析实战之清洗日志小实例7:查看样本数据,保存统计数据到文件
http://www.aboutyun.com/forum.php?mod=viewthread&tid=22953
1.如何从所有数据中,抽取样本查看?
2.如何保存结果到hdfs?
3.saveAsTextFile的作用是什么?




机器学习入门常犯错误总结
http://www.aboutyun.com/forum.php?mod=viewthread&tid=22955
1. 为什么不能一直使用默认损失函数?
2. 为什么不能所有问题使用一种算法?
3. 如何正确处理异常值?
4. 如何正确处理周期特征?
5. 为什么需要特征归一化后使用正则化?
6. 为什么线性回归或 logistic 回归的系数绝对值无法当做判断特征的重要性?



Scala的map实现key和value排序及各种排序比较等知识讨论
http://www.aboutyun.com/forum.php?mod=viewthread&tid=22942
1.map能否直接排序?
2.如何转换,才能排序?
3.排序结果可以存储在哪两个集合中?
4._*如何使用?
5.排序函数中,哪个可以进行升序和降序排列?
6.他们的排序性能如何?


深入理解Hadoop HA机制
http://www.aboutyun.com/forum.php?mod=viewthread&tid=22935
1、Hadoop1.x和Hadoop2.x架构有哪些区别?
2、什么是QJM?
3、如何理解QJM框架?
4、如何理解主备切换机制?




资源:
CDH5.11.0安装文档
http://www.aboutyun.com/forum.php?mod=viewthread&tid=22932



数据仓库与数据挖掘(廖开际)第六章:数据预处理
http://www.aboutyun.com/forum.php?mod=viewthread&tid=22943


about云日志分析实战之清洗、网站统计小教程
http://www.aboutyun.com/forum.php?mod=viewthread&tid=22936


问答:
spark连接mongodb 耗时特别长 是什么原因啊
http://www.aboutyun.com/forum.php?mod=viewthread&tid=22937


[oozie] Error: HTTP error code: 500 : Internal Server Error
http://www.aboutyun.com/forum.php?mod=viewthread&tid=22929


你们的大数据团队有多少成员
http://www.aboutyun.com/forum.php?mod=viewthread&tid=22923




没找到任何评论,期待你打破沉寂

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

推荐上一条 /2 下一条