图文精华

hadoop-2.6.0+zookeeper-3.4.6+hbase-1.0.0+hive-1.1.0完全分布 ...

About云»专题 › 资源区 › 每日一读 › 每日一读汇总 › about云2017年04月28月每日一读

0
0
0

分享

about云2017年04月28月每日一读

Tank_2000 发表于 2017-4-27 22:13:03 [显示全部楼层] 回帖奖励

回帖奖励

阅读模式关闭右栏 0 5197

本帖最后由 Tank_2000 于 2017-4-27 22:14 编辑
机器学习项目中数据预处理与数据整理方法比较
http://www.aboutyun.com/forum.php?mod=viewthread&tid=21635

1. 如何看待数据清洗和特征工程在整个机器学习项目里的位置？
2. Kaggle的Titanic数据集可以有哪些数据清洗和特征工程的例子？
3. 如何使用R或Python进行数据预处理？
4. 如何使用Hadoop或Spark进行数据预处理？
5. 如何使用KNIME和RapidMiner等可视化工具进行数据预处理？
6. 如何使用DataWrangler和Trifacta Wrangler等可视化工具进行数据整理？
7. 如何使用ETL和DQ工具？
8. 如何流式分析数据？

资源：
人工智能入门
http://www.aboutyun.com/forum.php?mod=viewthread&tid=21634

问答：
hadoop mkdir 时 Name node is in safe mode
http://www.aboutyun.com/forum.php?mod=viewthread&tid=21633

spark的work进程停不掉的问题？
http://www.aboutyun.com/forum.php?mod=viewthread&tid=21632

hive 客户端连接服务端
http://www.aboutyun.com/forum.php?mod=viewthread&tid=21630

provider网关不通，请大家帮忙
http://www.aboutyun.com/forum.php?mod=viewthread&tid=21629

回复

使用道具举报

自定义广告语

没找到任何评论，期待你打破沉寂

发表新帖

Tank_2000

新手上路

关注

151

主题
156

帖子
8

粉丝

TA的主题

24小时热文

推荐 /2

关于我们· 联系我们· 加入我们· 小黑屋· 合作伙伴

Copyright © 2001-2025 About云 Powered by Discuz! X3.4 Licensed Discuz Team.

简书 / 京ICP备2020039040号简书网举报电话：021-34700000

意见
反馈