第一个里面一直有段代码贴不进去,虽然它不是需要调用的代码,但这里还是贴上,以免以后疑惑。这段代码是对字符串式的xml进行解析,是我测试用的,可以不用管。然后整个环境是基于Hadoop2.x的,有些API有改变,请注意
|
问津少年 发表于 2016-11-17 08:47 谢谢,找到了个相关的帖子。 |
Kevin517 发表于 2016-11-12 15:23 可以使用Apache Tika |
楼主你好, 如果我要使用 在 HDFS上 .doc/ .pdf 的文件该如何操作呢??? |
学习了,很不错 |