HDFS的Java访问接口
得到filesystem的实例
有两个静态方法可以得到filesystem接口的实例
public static FileSystem get(Configuration conf) throws IOException
public static FileSystem get(URI uri, Configuration conf) throws IOException
第一个方法得到缺省的文件系统,具体由配置文件的fs.default.name属性决定。
第二个方法由URI的前缀决定是哪个文件系统(参考前一篇文章),如果URI没有前缀也是得到缺省的文件系统。
使用open方法得到文件的输入流
有了filesystem的实例,我们就可以调用open方法得到一个文件的输入流了
public FSDataInputStream open(Path f) throws IOException
public abstract FSDataInputStream open(Path f, int bufferSize) throws IOException
第一个方法用缺省的buffer大小4K
使用FSDataInputStream读数据
FSDataInputStream派生自java.io.DataInputStream,支持随机读取。
public class FSDataInputStream extends DataInputStream
implements Seekable, PositionedReadable {
void seek(long pos) throws IOException;
public int read(long position, byte[] buffer, int offset, int length) throws IOException;
}
使用FSDataOutputStream写数据
filesystem接口创建文件的接口
public FSDataOutputStream create(Path f) throws IOException
还可以append到一个已经存在的文件
public FSDataOutputStream append(Path f) throws IOException
public class FSDataOutputStream extends DataOutputStream implements Syncable {
public void write(int b) throws IOException;
public void write(byte b[], int off, int len) throws IOException;
}
filesystem的文件系统操作方法
public boolean mkdirs(Path f) throws IOException ;
public void copyToLocalFile(boolean delSrc, Path src, Path dst) throws IOException;
public abstract boolean delete(Path f, boolean recursive) throws IOException;
public abstract boolean rename(Path src, Path dst) throws IOException;
public abstract FileStatus[] listStatus(Path f) throws IOException;
本文来自CSDN博客,转载请标明出处:http://blog.csdn.net/fiberlijun/archive/2009/11/16/4814647.aspx path.getFileSystem也可以获取,这种方式应该是最直接的。 回复 2# alexanderdai
这个确实也可以,MapReduce中用得比较多。 Path的getFileSystem其实还是调用FileSystem 的get方法
public FileSystem getFileSystem(Configuration conf) throws IOException {
return FileSystem.get(this.toUri(), conf);
} 回复 4# fiberlijun
哈哈,明白了,原来同出一辙。 {:soso_e183:}
学习!!! {:soso_e179:} 非常感谢楼主分享 不知道在干嘛,但是感觉用hadoop-eclipse-plugin就可以直接管理hdfs集群文件了啊,新手感觉
页:
[1]