机器学习入门常犯错误总结
http://www.aboutyun.com/forum.php?mod=viewthread&tid=22955
1. 为什么不能一直使用默认损失函数? 2. 为什么不能所有问题使用一种算法? 3. 如何正确处理异常值? 4. 如何正确处理周期特征? 5. 为什么需要特征归一化后使用正则化? 6. 为什么线性回归或 logistic 回归的系数绝对值无法当做判断特征的重要性?
日志分析实战之清洗日志小实例7:查看样本数据,保存统计数据到文件
http://www.aboutyun.com/forum.php?mod=viewthread&tid=22953
1.如何从所有数据中,抽取样本查看?
2.如何保存结果到hdfs?
3.saveAsTextFile的作用是什么?
学习scala的那五天__第一天
http://www.aboutyun.com/forum.php?mod=viewthread&tid=22957
资源:
数据仓库与数据挖掘(廖开际)第七章:数据挖掘中的常用算法
http://www.aboutyun.com/forum.php?mod=viewthread&tid=22956
问答:
nova-compute启动不正常?
http://www.aboutyun.com/forum.php?mod=viewthread&tid=22952
hive on spark(yarn mode)配置遇到的问题
http://www.aboutyun.com/forum.php?mod=viewthread&tid=22954
|