本帖最后由 pig2 于 2014-8-15 23:01 编辑
问题导读:
Apache Slider的目的是什么?
HBase运行在YARN会带来什么好处?
最近,Apache Slider成为了Apache二级孵化项目(官方首页为:http://slider.incubator.apache.org/),该项目是YARN之外的孵化项目,目的是将用户的已有服务或者应用直接部署到YANR上。
随着YARN的完善,目前已经能够直接部署服务,比如HBase,Storm等,而Apache Slider直接源自于Hoya,一个尝试将HBase部署到YARN上的项目。将HBase运行在YARN上将带来众多好处,包括: (1)在一个物理集群中可同时部署多个HBase集群实例 (2)为HBase集群提供资源隔离(这一点HBase本身做不到) (3)将多个版本的HBase集群部署到一个物理集群中
当然,以上几个好处也是将其他服务部署到 YARN上的好处。
随着Slider项目的发布,用户可以在不对已存在服务进行任何修改的前提下将之部署到YARN集群中。 Slider的基本组成模块如下图所示:
在Apache Slide中部署服务,就跟运行一个普通分布式应用程序一样,这个应用程序部署起来了,便意味着服务部署成功。下图表示了一个服务在YARN中的部署流程:
使用Slider部署服务时,用户需要编写一系列配置和脚本,并需要自己尝试编写ApplicationMaster和Client实现,仍有一定难度,但是,一旦开发完成后,以后就可以重复使用了,而Slider自带了HBase On YARN,Storm On YARN 和Accumulo On YARN三个实现,大家可仿照这三个实现将自己的服务部署到YARN上。
尽管Slider项目的动机是将已存在的应用程序或者服务部署到YARN上,但就YARN本身而言,还不能够很好地驾驭“服务”这种特殊的应用程序,这主要还是由于YARN的以下几个Feature尚未发布,包括:
以上只是列举了几个重要的feature,还有其他很多feature待开发。总之,让服务能够灵活的运行在YARN上,让YARN成为一个数据中心的资源管理系统,还有很长一段路要走。
#######################################################################
|