TeraSort的取样算法

TeraInputFormat类中的writePartition方法中，对于取样的实现能不能来个大神讲解下，我啃过之后觉得有的难懂。谢谢！

yuwenge · 发表于 2017-7-11 14:30:04

不能只是简单的去阅读代码，时间长了，自己的代码，可能忘记。最好的阅读的方式是边调试边阅读，这样理解的准确性才够高。而且代码也都是有注释的。
另外对于取样，这个应该属于数据分析或则统计，最好具备这方面的专业知识，在理解方面，才会更准确。
对于提出的问题也比较笼统，相信别人讲解的话，也是一知半解。最好提出具体的问题。哪里不明白

图文精华

TeraSort的取样算法

已有(1)人评论

推荐 /2