搜索
搜 索
本版
文章
帖子
用户
图文精华
hadoop-2.6.0+zookeeper-3.4.6+hbase-1.0.0+hive-1.1.0完全分布 ...
首页
Portal
专题
BBS
面试
更多
登录
注册
用户组:游客
主题
帖子
云币
我的帖子
我的收藏
我的好友
我的勋章
设置
退出
导读
淘贴
博客
群组
社区VIP
APP下载
今日排行
本周排行
本周热帖
本月排行
本月热帖
会员排行
About云-梭伦科技
»
专题
›
交流区
›
技术交流
›
Hadoop|YARN
›
TeraSort的取样算法
0
1
0
分享
TeraSort的取样算法
macWang
发表于 2017-7-11 09:56:48
[显示全部楼层]
阅读模式
关闭右栏
1
5229
TeraInputFormat类中的writePartition方法中,对于取样的实现能不能来个大神讲解下,我啃过之后觉得有的难懂。谢谢!
回复
使用道具
举报
提升卡
置顶卡
沉默卡
喧嚣卡
变色卡
千斤顶
显身卡
已有(1)人评论
电梯直达
正序浏览
yuwenge
发表于 2017-7-11 14:30:04
不能只是简单的去阅读代码,时间长了,自己的代码,可能忘记。最好的阅读的方式是边调试边阅读,这样理解的准确性才够高。而且代码也都是有注释的。
另外对于取样,这个应该属于数据分析或则统计,最好具备这方面的专业知识,在理解方面,才会更准确。
对于提出的问题也比较笼统,相信别人讲解的话,也是一知半解。最好提出具体的问题。哪里不明白
回复
使用道具
举报
显身卡
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
本版积分规则
发表回复
回帖后跳转到最后一页
发表新帖
macWang
新手上路
关注
14
主题
38
帖子
4
粉丝
TA的主题
hbase数据设置成擦除码后,数据大小异常 (
2021-3-16
Datanode jmx参数疑惑,TotalWriteTime 小于 WriteBlockOpAvgTime
2020-3-18
Zookeeper 启动异常无法使用
2020-3-12
Hadoop系列的健康可用性监控
2020-3-5
TeraSort的取样算法
2017-7-11
24小时热文
Spark机器学习
Spark机器学习算法、源码及实战详解
《深度实践Spark机器学习(吴茂贵)》高清
《Spark机器学习第2版》高清中文PDF
像高手一样发言:七种常见工作场景的说话之
关闭
推荐
/2
中文版ChatGPT
1.无需魔法 2.提高编程效率 3.提高文档能力
查看 »
新手帮助
新手帮助:注册遇到问题,领取资源,加入铁粉群,不会使用搜索,如何获取积分等
查看 »
意见
反馈