问题导读
1、ceph如何与OpenStack整合?
2、如果企业规模大点,基本需要用到哪些存储?
3、Ceph与Swift有何不同?
一、Ceph在OpenStack中的地位
对于一个IaaS系统,涉及到存储的部分主要是块存储服务模块、对象存储服务模块、镜像管理模块和计算服务模块。具体针对OpenStack而言,则分别对应为其中的Cinder、Swift、Glance和Nova四个项目。
在块存储服务部分,Ceph目前是Cinder项目的默认存储后端。前已述及,Red Hat也已经利用自己在KVM/QEMU社区中的影响力,将RBD驱动直接集成在QEMU中。这样,虚拟机访问基于RBD实现的块设备的性能将得到优化。
在对象存储部分,Swift是OpenStack自带的对象存储实现方案。但Ceph也已经成为了Swift最强有力的竞争对手。目前Swift也在考虑采用Ceph作为自己的存储后端。关于Ceph和Swift的故事将在6.2节详细展开。
在镜像管理部分,目前Glance已经支持将Ceph作为自己的本地镜像文件缓存。
在计算服务部分,United Stack目前正在推动将Ceph FS作为Nova计算节点的本地文件系统。
整体而言,Ceph事实上是目前OpenStack生态系统中呼声最高的开源存储解决方案。这一点从笔者在OpenStack 2013 HongKong Summit上的亲身体验可以得到印证。目前,以HP、Dell、Intel等为代表的企业IT领导厂商,和以Mirantis、eNovance、United Stack为代表的若干OpenStack社区新兴厂商,都将Ceph作为重要的乃至于首选的开源存储解决方案。
笔者认为,Ceph之所以在诞生多年不温不火的情况下,迅速在OpenStack社区中受到关注,除了其他一些明显优点之外,应该还是和其支持统一存储的能力有关。这一特性恰恰是OpenStack社区所需要的。
OpenStack项目设计的准则之一就是灵活可扩展。同时,其各个成员项目的背景也不尽相同。这也就导致各个项目在涉及存储系统时所采取的选择各有差异。但是,这一现状势必导致OpenStack的部署和运维面临一定的挑战。特别是对于一些规模不大的OpenStack部署实例,如果让块存储、对象存储、镜像缓存、计算节点本地存储等模块分别采用三四种不同的后端解决方案,则一方面其部署十分麻烦,另一方面运维人员的后续工作也很繁琐。在这种情况下,如果能够采用Ceph作为一种统一存储后端,则确实可以有效缓解这一问题。当然,这只是笔者的一家直言。任何技术选择必然都有其复杂的背后原因,这里的信息仅供参考。
总结:1.各大厂商支持;2.四合一,便于运维开发;
二、Ceph与Swift:不能不说的故事,不能不作的比较
首先对Swift项目的来龙去脉进行简单介绍,以便大家更好地了解这个项目的特性,及其背后隐藏的原因。此处关于Swift的信息主要引自[2]。
Swift最早起源于2008年,本来是Rackspace公司内部开发的用于支撑其公有云对象存储业务的后端系统。当时,Amazon的S3服务已经颇受欢迎,因此,Rackspace决定开发Swift以提供对应业务作为回应。也正是因为这个原因,Swift的设计目标十分纯粹,就是一个优秀的、可以和S3相媲美的对象存储系统。其他要求纯属多余,因此完全不在Swift开发者的考虑之列。
Swift的开发大致历时一年,并在Rackspace成功上线运营。此后,OpenStack项目于2010年正式发布。Rackspace贡献了Swift,而NASA贡献了Nova,二者成为了OpenStack最早的两个项目。其后,若干Swift开发团队的核心成员独立创业,成立了SwiftStack公司,依然活跃在相关社区。
由此可见,Swift正是一个典型的起源于公司内部的、作为正式产品开发的开源项目。从这一点而言,Swift和“学院范儿”的Ceph可谓截然不同。也正是因为这个原因,Swift获得了一个得天独厚的优势:不缺启动用户,一开始就有生产环境下的大规模部署应用案例。事实上,相对成熟、web场景下应用案例多,是Swift社区目前依然反复强调的一个优势。
从技术上讲,Swift的特点主要体现在设计目标明确,就是要做一个纯粹的对象存储系统,因此不会考虑Ceph所强调的统一存储特性。同时,为了便于和其他项目、应用集成,Swift选择了Python语言进行开发。
与之相比,Ceph同时考虑了对象存储、块存储和文件系统存储能力,且目前在OpenStack中应用最多的场景事实上是块存储。同时,Ceph在选择开发语言时,很可能主要考虑的是性能因素,因而选择了C++语言。而能够被用于块存储场景这一点,也部分印证了其性能确实比较优秀。
由此可见,Ceph和Swift的区别,本质上是由其产生背景和应用目标所导致的。对这二者进行对比,并进行技术上的评判,并不非常公平。
事实上,作为开源分布式存储系统中的两个优秀代表,Ceph和Swift的设计和特性之中,也有着不少的相通之处:
首先,二者都强调良好的可扩展性,因此都采用了无中心点结构。只不过Swift的架构中有元数据服务器,只是通过多节点扩展的方式尽可能解决了其可靠性和性能顾虑。
第二,二者都能提供可配置的高可靠性。在两者的集群中,数据的备份数都可以选择,在常见生产环境中,也都使用三备份的方式。
第三,二者都强调自动化的集群管理。Swift同样引入了自动化的集群维护能力。
由此可见,简单地强调这两者之中的某一个更为优秀,是不合理的,也是没有实际意义的。
当然,在实际使用中,毕竟还是需要进行方案选择。结合[3]文中的观点,笔者认为,合适的选择或许如下:
*如果需要一个纯粹的对象存储系统,则选择Swift;
*如果需要一个纯粹的块存储系统,则只能选择Ceph;
*如果是一个小规模的、希望控制系统复杂度的OpenStack部署方案,则选择Ceph;
*如果是一个规模较大的系统,块存储和对象存储分别有较大的业务需求,则可以考虑将二者分离,分别采用Ceph和Swift。
cinder 是块存储,你可以简单的理解成一个移动硬盘,当创建虚拟机需要用到硬盘的时候,会通过cinder技术给虚拟机增加一块存储设备,就是刚才说移动硬盘。
swift是对象存储,是一个存储系统,它不像块存储,你可以随意的对块设备格式化,添加文件系统等,它现在已经是一个系统,当你需要存文件的时候,把文件传给swift,怎么存,存到哪里,这个不是你关心的事情。反过来,取文件的时候,你发一条命令给swift ,会自动的给你取出来,同样怎么取(文件存储的路径)你也不需要知道。它的用途是存储创建虚拟机的镜像文件,当创建虚拟机的时候,发命令到swift,获取镜像。
统一存储:Ceph
一般来说,企业如果规模大点,你基本都需要用到3种存储
对象存储
文件存储
块设备存储
这3种存储,有自己特有的应用场景,无法互相取代。到底是3种存储采用3个软件来实现,还是用一个软件来实现3个功能,这个是一直都有争议的。
3种存储,用3个软件,比较符合linux的哲学.不过企业内部维护3套存储软件,有点痛苦.
CEPH,野心是最大的,同时提供3种存储,比gluster还牛,gluster只提供文件存储和对象存储。
简单点说,就是能提供S3,EBS,还能把一个目录mount到本地使用。
一个开源软件,能正在商用,尤其是作为公有云对外提供服务,真的需要很大的勇气。
这样swift就有压力了,用户对象存储里,又多了一个选择。
|