例如,现在有一个项目,要将服务器上的某个文件夹下的所有文件使用Hadoop程序在某个时段自动上传到Hadoop集群中。笔者的做法如下:1.该项目的文件夹是网站的日志文件,要定时进行日志到集群的备份。将服务器和Hadoop集群通过路由器连接起来
2.在eclipse中使用插件,编写java程序,远程连接集群,实现上传一个小文件的功能,进行测试
3.右击该项目,选择run on hadoop。此时便可以成功上传了。
---------------------------------------------------
那么问题来了。。。。。
----------------------------------------
1.如何在网站编写一个类似于servlet的程序,使得能够定时上传该文件夹下的文件?
2.Hadoop程序是否支持servlet类似的执行方式,响应web请求?
3.如何设置才能够默认是“Run on Hadoop”,而不需要人为右击项目等等,实现自动化上传。还望各位不吝赐教。
|
|