分享

Windows Azure 存储的冗余存储选项和只读访问跨地域冗余存储(1)

pig2 发表于 2014-4-15 02:52:36 [显示全部楼层] 回帖奖励 阅读模式 关闭右栏 1 9609
问题导读:
本地冗余存储(LRS)是什么?
本地冗余存储(LRS) 的作用是什么?
什么是跨地域冗余存储(GRS)?







我们很高兴地宣布,现在我们使客户可以获得对数据更高的读取可用性。该预览功能称为“只读访问- 跨地域冗余存储(RA-GRS)”,使客户可以在存储帐户主要区域无法读取数据时,通过跨地域冗余的辅助区域读取相关数据, 并保证这两个副本一致。

在介绍这一新功能的具体情况之前,我们先简要概括一下Windows Azure 存储提供的冗余存储选项。然后我们将详细介绍包括新的只读访问跨地域冗余存储(RA-GRS) 在内的各个可用选项,并详细说明如何注册获取RA-GRS 的有限预览版。我们还将探讨存储客户端库的一些变动,客户可利用这些变动通过使用RA-GRS 获得更高的读取可用性。

Windows Azure 存储的冗余存储选项
Windows Azure 存储提供以下针对Blob、表和队列的冗余存储选项:
1. 本地冗余存储(LRS):通过将事务同步复制到同一区域内的三个不同存储节点上,将存储帐户中的所有数据持久化。以下章节会介绍有关LRS 的更多详情,包括如何选择LRS。

2. 跨地域冗余存储(GRS):这是创建存储帐户时的默认冗余存储选项。与LRS 一样,也是将事务同步存储到三个存储节点上,这三个节点均位于创建存储帐户时所选择的主要区域内。不同的是,GRS 还会将事务异步复制到另一个辅助区域(距离主要区域数百英里外),然后再复制到辅助区域的另外三个存储节点,实现数据持久性。以下章节将深入介绍异步复制过程、区域配对信息以及故障转移过程。

3. 只读访问跨地域冗余存储(RA-GRS):对于GRS 存储帐户,我们现已在有限预览版中推出一项新功能,使客户可以获取对辅助区域内存储帐户数据的只读访问权。因为复制到辅助区域为异步完成,因此可提供读取数据的最终一致性版本。以下章节将介绍有关RA-GRS 的更多详情,说明如何在预览模式中启用该功能,并讲解存储分析的细节。

本地冗余存储(LRS)
LRS 是什么?
本地冗余存储将数据的多个副本同步存储在一个区域内,以获得数据持久性。为确保持久性,我们将事务同步复制到跨不同故障域和升级域的三个不同存储节点上。故障域(FD) 是代表物理故障单元的一组节点,可视为归属于同一物理机架的节点。升级域(UD) 是将在服务升级(推出)过程中一起升级的一组节点。三个副本跨不同UD 和FD,确保了数据的可用性,即便出现硬件故障影响到某一机架或在推出期间升级节点时也不受影响。
除仅当三个副本全部留存才能返回成功消息外,我们还存储了数据的CRC 以确保正确性,并定期阅读和验证CRC 以检测位衰减(一段时间内发生在磁盘媒体上的随机错误)。此外,WindowsAzure存储擦除可对数据进行编码,这进一步提升了数据的持久性。有关如何使数据持久的更多信息,请参阅我们的SOSP 文档。

使用LRS的场景
LRS 成本低于GRS。根据当前的价格结构,LRS的价格要比GRS 低23% 到34% 左右,具体取决于存储的数据量。以下是选择使用LRS 而非GRS 的一些原因:
1. 可轻松重建的数据存储应用程序不会选择跨地域冗余复制数据,这不仅仅是出于成本考虑,也是因为它们的存储帐户的吞吐量更高。LRS帐户的输入和输出限额分别为10 GB 和15 GB,GRS 帐户则分别为5 GB 和10 GB。
2. 按照应用程序的数据管理要求,一些客户希望仅在某一区域内复制他们的数据。
3. 一些应用程序可能已经制定自己的跨地域冗余战略,不需要通过Windows Azure 存储服务管理跨地域冗余。

如何配置LRS
GRS 是创建存储帐户时的默认冗余存储选项,包含在Azure 存储的当前定价中。要通过Windows Azure 门户配置LRS,需要在所选存储帐户的“配置”页面选择“本地冗余”,此时折扣定价才会适用。选择LRS 后,辅助位置中的数据将被删除。需要注意的是,选择LRS 之后,再回到GRS(即跨地域冗余)模式将会产生额外费用,主要是涉及将现有数据从主要位置复制到辅助位置的输出成本。而对于GRS 而言,初始数据复制完之后,从主要位置到辅助位置跨地域复制数据无需更多额外输出费用。您可以在这里找到有关带宽费用的详细信息。

跨地域冗余存储(GRS):
GRS 是什么?
跨地域冗余存储帐户将其Blob、表和队列数据复制到距离主要区域数百英里远的辅助区域。因此,即便发生整个区域停电或区域性灾难导致主要位置无法恢复,数据仍能保持持久性。在上述LRS 部分中已经介绍过,存储帐户的更新将同步复制到主要区域中的三个存储节点,只有三个副本都留存成功时才会返回成功消息。对于GRS 而言,更新数据在主要区域完成存储后,还会异步复制到辅助区域。在辅助区域中,更新数据又将复制到三个复制集,之后才会向主要区域返回成功信息。

我们的目标是保持数据在主要位置和辅助位置的完全持久性。这意味着我们同时在两个位置保持三个副本(即,总共6 个副本),确保每个位置都可以从常见的故障(例如,磁盘、节点、机架、TOR 故障)自行恢复,而无需与其他位置进行通信。这两个位置仅在将最近的更新跨地域冗余复制到存储帐户时才需要相互通话。这一点很重要,因为它意味着,如果我们需要将存储帐户从主要位置故障转移到辅助位置,则所有已通过跨地域冗余提交到辅助位置的数据将变得持久。由于对事务执行了异步复制,因此需要注意的是,选择GRS 不会对主要位置的事务延迟产生影响。但是,由于跨地域冗余存在延迟,因此在发生区域性灾难的情况下,如果数据无法从主要区域中恢复,则尚未复制到辅助区域的增量更改可能会丢失。

辅助位置是什么?
创建存储帐户时,客户需要为存储帐户选择主要位置。存储帐户的辅助位置则是固定的,客户无法更改。下表显示了当前的主要位置和辅助位置配对:
主要位置
辅助位置
美国中北部
美国中南部
美国中南部
美国中北部
美国东部
美国西部
美国西部
美国东部
北欧
西欧
西欧
北欧
东南亚
东亚
东亚
东南亚
中国东部
中国北部
中国北部
中国东部





已有(1)人评论

跳转到指定楼层
anmeany 发表于 2014-4-16 11:16:35
支持,涨姿势了.
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

推荐上一条 /2 下一条