java 怎么读取hdfs上csv文件的某一列

查看数: 31729 | 评论数: 12 | 收藏 0
关灯 | 提示:支持键盘翻页<-左 右->
    组图打开中,请稍候......
发布时间: 2016-3-14 14:46

正文摘要:

java 怎么读取hdfs上csv文件的某一列 我想对某一列数进行处理,例如求均值。急诊!

回复

xintuhai 发表于 2016-3-16 19:25:35
wscl1213 发表于 2016-3-16 11:16
 String csvFilePath = "C:\%users\\Administrator\\Desktop\\20140227135936.csv";
  String source ...

这个我看得出来是本地路径,但是我要读取HDFS上的文件,就是HDFS路径,但是运行的时候提示找不到源文件,到那时打包成jar包,在端口可以运行。怎么回事呢?
wscl1213 发表于 2016-3-16 11:16:53
xintuhai 发表于 2016-3-15 21:31
什么权限问题呢?不是很懂,能指点一下吗?

 String csvFilePath = "C:\\Users\\Administrator\\Desktop\\20140227135936.csv";
  String sourceFileString= "C:\\Users\\Administrator\\Desktop\\test.csv";
这里是本地路径

xintuhai 发表于 2016-3-15 21:31:35
xuanxufeng 发表于 2016-3-15 20:30
权限有问题,楼主给下面对比下,授下权

什么权限问题呢?不是很懂,能指点一下吗?
xuanxufeng 发表于 2016-3-15 20:30:56
xintuhai 发表于 2016-3-15 20:12
这个是HDFS文件吧,路径是好像这样表示的

权限有问题,楼主给下面对比下,授下权
s060403072 发表于 2016-3-15 20:03:28
xintuhai 发表于 2016-3-15 20:00
map上面没有自带的读取CSV的类吧(我没有找到)。我按照网上例子,自己继承InputFormat类,写了一个CSVIn ...

你这是本地路径,应该是hdfs路径
s060403072 发表于 2016-3-14 22:11:36
xintuhai 发表于 2016-3-14 21:33
应该是直接用MapReduce对csv数据处理。求某一列的均值,方差

楼主首先要懂mapreduce编程。
然后换成hdfs路径,其它都是一样的
xintuhai 发表于 2016-3-14 21:33:44
szcountryboy 发表于 2016-3-14 16:34
只能把文件取道本地,然后再读取把,或者使用mr将需要处理的那一列单独输出到一个文件
还有更好的解决方法?

应该是直接用MapReduce对csv数据处理。求某一列的均值,方差
关闭

推荐上一条 /2 下一条