现在在用的命令是distcp命令是用来做跨集群传输的,现在我有两个集群A,B,数据流向都是A->B,如果我在A集群启动了distcp任务,那么能在A集群的8088端口查看到这个M/R任务,如果我在B集群启动了distcp任务,那么能在B集群的8088端口查看到这个M/R任务,这个不知道是什么原理。 还有一个问题,就是在windows端我用idea写了个调用distcp任务传输A->B数据的程序,任务运行成功,但是在A和B集群的8088上都查不到这个任务记录,不知道应该在哪个上面才能查看到该任务记录,疑惑是不是程序写的问题,代码段是这样的:
List<String> src = new ArrayList<String>();
src.add("hdfs://****:8020/user/test");
String dest = "hdfs://****:8020/user/test";
Configuration conf = new Configuration();
System.setProperty("HADOOP_USER_NAME","root");之后就是调用ToolRunner.run()方法进行调用了distcp方法,与集群相关的只有设置了一个源路径和目的路径,不知道这样写连接集群运行任务是不是有问题?是否是运行了集群进行分布式运算,如果不对的话可不可以帮忙提供一下windows正确连接集群的方法,感激不尽,希望能在web看到任务的原因是想要做队列调度,但是看不到任务详情没办法知道是否调度到了设置的队列,希望有知道的同学可以提供帮助,谢谢
|
|