图文精华

hadoop-2.6.0+zookeeper-3.4.6+hbase-1.0.0+hive-1.1.0完全分布 ...

About云-梭伦科技»专题 › 交流区 › 技术交流 › hadoop中的wordcount能否提取目录中的子目录文件数据

0
3
0

分享

hadoop中的wordcount能否提取目录中的子目录文件数据

bioger_hit 发表于 2014-5-28 17:50:38 [显示全部楼层] 回帖奖励

回帖奖励

阅读模式关闭右栏 3 6543

弱弱的问个问题，hadoop中的wordcount示例,只能统计一个目录下的所有文件的内容，但是如果目录中还有目录，怎么办呢？
我实验了一下，不能计算目录中层级目录中的文件?

欢迎加入about云群425860289 、432264021 ，云计算爱好者群，关注about云腾讯认证空间

回复

使用道具举报

自定义广告语

已有(3)人评论

电梯直达

跳转到指定楼层

正序浏览

hyj 发表于 2014-5-28 17:53:04

子目录只能用FileInputFormat.addInputPath了

回复

使用道具举报

bioger_hit 发表于 2014-5-28 17:53:52

子目录只能用FileInputFormat.addInputPath了
目录里面有100多个子目录呢，怎么办

回复

使用道具举报

nettman 发表于 2014-5-28 17:55:54

FileStatus[] fileStatus = fs.listStatus(path);        
for(int i=0;i<fileStatus.length;i++){
            if(fileStatus[i].isDir()){
                Path p = new Path(fileStatus[i].getPath().toString());
                getFile(p,fs);
            }else{
                System.out.println(fileStatus[i].getPath().toString());
            }
复制代码

你可以便利目录，然后采用addinputpath。

回复

使用道具举报

发表新帖

bioger_hit

高级会员

关注

85

主题
618

帖子
36

粉丝

TA的主题

24小时热文

推荐 /2

关于我们· 联系我们· 加入我们· 小黑屋· 合作伙伴

Copyright © 2001-2024 About云-梭伦科技 Powered by Discuz! X3.4 Licensed Discuz Team.

简书 / 京ICP备2020039040号简书网举报电话：021-34700000

意见
反馈