yuwenge 发表于 2015-7-10 17:37 这个我也不清楚呢,谢谢热心帮助 |
Alkaloid0515 发表于 2015-7-10 17:38 嗯,这点很头疼呢。windows下我尝试设置hadoop-lzo-0.20-SNAPSHOT.jar的本地库地址,试了把linux下的本地库拷贝过来,也试了在windows下重新编译得到dll文件,但是运行时都警告该platform无法加载native library,然后会有NativeIO.access0错误。 |
cwl12315 发表于 2015-7-10 17:31 运行是不是引用的本地的文件,注意本地版本和远程版本一致。本地库当然也是。最好在Linux下。window下有很多的问题 |
cwl12315 发表于 2015-7-10 17:33 不清楚了,按理来说应该是源码。难道远程执行也暂用本地资源了,节省了远程资源? |
yuwenge 发表于 2015-7-10 17:31 亲,您好像看错了,我是源码执行时间更短。 我是用Stopwatch统计job.waitForCompletion(true)的执行时间 |
yuwenge 发表于 2015-7-10 17:16 要不这个问题先搁置。 我请教一下另一个关于lzo压缩的问题。 按照网上的一些博客文章,做了Lzo本地库和hadoop-Lzo的配置。 jar包可以在linux上执行,结果正确。 但是在windows上用eclipse执行,会报无法加载hadoop-lzo本地库的错误。 是不是因为windows上运行,java程序获取的java.library.path是windows的环境变量所致? 谢谢 |
cwl12315 发表于 2015-7-10 17:25 源码是需要编译才能执行,而且是远程执行 jar不需要,并且jar是直接在集群上运行。 这个时间是合理的 |
yuwenge 发表于 2015-7-10 17:16 您好。我上传了一张SecureCrt执行的截图,是map的处理进度。虽然如您所说,资源不同使得每次执行所需时间不同,但这个时间应当是一种小波动状态才对。 我是运行了好多次的,基本上在eclipse上执行,时间35±5s左右 jar包运行,时间65±5s左右。 |
cwl12315 发表于 2015-7-10 17:13 hadoop-eclipse-plugin连接的是hdfs,跟yarn没有太大关系。 楼主可以运行jar几次,肯定每次运行也不同。 这个跟当前的资源有关系 |