类似单词统计,但是单词的长度可能比较长。输入数据比较大的话,排序是非常耗时的,所以能不能取消Shuffle自带的排序功能,因为单词统计用不到排序。
我尝试使用
job.setSortComparatorClass(SortComparator.class);[mw_shl_code=java,true] public static class SortComparator extends WritableComparator{
protected SortComparator(){
super(Text.class, true);
}
@Override
public int compare(WritableComparable a, WritableComparable b) {
return 0;
}
}[/mw_shl_code]
但是ruduce后的结果只有一个,为什么呢?
|