搜索
搜 索
本版
文章
帖子
用户
图文精华
hadoop-2.6.0+zookeeper-3.4.6+hbase-1.0.0+hive-1.1.0完全分布 ...
首页
Portal
专题
BBS
面试
更多
登录
注册
用户组:游客
主题
帖子
云币
我的帖子
我的收藏
我的好友
我的勋章
设置
退出
导读
淘贴
博客
群组
社区VIP
APP下载
今日排行
本周排行
本周热帖
本月排行
本月热帖
会员排行
About云-梭伦科技
»
专题
›
交流区
›
技术交流
›
MapReduce
›
MapReduce只需要一个输出文件时reduce个数难题。
0
1
0
分享
MapReduce只需要一个输出文件时reduce个数难题。
fylanyu
发表于 2013-10-26 15:11:03
[显示全部楼层]
阅读模式
关闭右栏
1
7066
我需要处理一个文件,文件中存放了一个浮点数矩阵,需要对文件中每一个浮点数进行计算,转换成另一个浮点数。输出结果是一个新的矩阵。
我用map将矩阵文件拆分,每个map任务处理一个矩阵的一部分。而输出的时候由于我只需要一个输出文件,所以这个时候我设置reduce个数为1. 但是,你知道,reduce个数为1的时候效率很低的,每个map任务都要把数据传送给这个reduce,体现不出分布式处理的优势了。咋办吗?
而如果把reduce个数设置为多个,那么最终我的输出还是需要一个文件,怎样合并reduce输出的多个文件为一个吗?
或者,这样的有没有其他方法解决?
回复
使用道具
举报
提升卡
置顶卡
沉默卡
喧嚣卡
变色卡
千斤顶
显身卡
已有(1)人评论
电梯直达
正序浏览
lovejunxia
发表于 2013-10-26 15:11:03
能尝试先用多个reduce做一下,然后对reduce的结果进行合并吗吗?
回复
使用道具
举报
显身卡
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
本版积分规则
发表回复
回帖后跳转到最后一页
发表新帖
fylanyu
中级会员
关注
51
主题
163
帖子
2
粉丝
TA的主题
云OS开发者平台重新上路
2013-12-15
MapReduce只需要一个输出文件时reduce个数难题。
2013-10-26
hadoop dfsadmin -report 命令详解
2013-10-25
写文件到HDFS中的测试流程及问题
2013-10-25
关于hadoop block问题
2013-10-25
24小时热文
矩阵分析引论罗家洪(第四版)
互联网大厂年终福利曝光:看看别人家老板怎
像高手一样发言:七种常见工作场景的说话之
携程允许员工春节回乡办公2个月
数据治理实施方案
关闭
推荐
/2
中文版ChatGPT
1.无需魔法 2.提高编程效率 3.提高文档能力
查看 »
新手帮助
新手帮助:注册遇到问题,领取资源,加入铁粉群,不会使用搜索,如何获取积分等
查看 »
意见
反馈