分享

about云2017年04月28月每日一读

Tank_2000 发表于 2017-4-27 22:13:03 [显示全部楼层] 回帖奖励 阅读模式 关闭右栏 0 5197
本帖最后由 Tank_2000 于 2017-4-27 22:14 编辑
机器学习项目中数据预处理与数据整理方法比较
http://www.aboutyun.com/forum.php?mod=viewthread&tid=21635
1. 如何看待数据清洗和特征工程在整个机器学习项目里的位置?
2. Kaggle的Titanic数据集可以有哪些数据清洗和特征工程的例子?
3. 如何使用R或Python进行数据预处理?
4. 如何使用Hadoop或Spark进行数据预处理?
5. 如何使用KNIME和RapidMiner等可视化工具进行数据预处理?
6. 如何使用DataWrangler和Trifacta Wrangler等可视化工具进行数据整理?
7. 如何使用ETL和DQ工具?
8. 如何流式分析数据?


资源:
人工智能入门
http://www.aboutyun.com/forum.php?mod=viewthread&tid=21634

问答:
hadoop mkdir 时 Name node is in safe mode
http://www.aboutyun.com/forum.php?mod=viewthread&tid=21633

spark的work进程停不掉的问题?
http://www.aboutyun.com/forum.php?mod=viewthread&tid=21632

hive 客户端连接服务端
http://www.aboutyun.com/forum.php?mod=viewthread&tid=21630

provider网关不通,请大家帮忙
http://www.aboutyun.com/forum.php?mod=viewthread&tid=21629






没找到任何评论,期待你打破沉寂

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

推荐上一条 /2 下一条