了解归档检索选项 - Amazon Simple Storage Service

了解归档检索选项

Amazon S3 具有三个归档存储类别:S3 Glacier Instant Retrieval、S3 Glacier Flexible Retrieval 和 S3 Glacier Deep Archive。虽然可以使用 GET 立即获得存储在 S3 Glacier Instant Retrieval 存储类别中的对象,但要访问存储在 S3 Glacier Flexible Retrieval 或 S3 Glacier Deep Archive 存储类别中的数据,您首先需要使用 RestoreObject REST API 检索数据。还原由数千万个对象或数百 TB 数据组成的数据集,所花的时间可能比典型的还原时间更长,需要特别注意。有关更多信息,请参阅 还原大型数据集

您可以从三个检索访问选项中进行选择,以根据所需的检索速度还原归档的对象:加速、标准和批量。

  • 加速检索:快速访问存储在 S3 Glacier Flexible Retrieval 存储类别或 S3 Intelligent-Tiering 归档访问层中的数据。您可以将此选项用于偶尔紧急请求多达数百个对象。大小小于 250 MB 的对象通常在 1-5 分钟内变为可用,而大小为 250 MB 或更大的对象通常以每秒多达 300 MB 的检索吞吐量进行检索。此外,还可以选择购买预置容量来进行加速检索。预置容量有助于确保在您需要时,可以使用加速检索容量。有关更多信息,请参阅 预调配容量

    注意

    加速检索是一项高级特征,按加急请求和检索费率收费。有关 Amazon S3 定价的信息,请参阅 Amazon S3 定价

  • 标准检索:在数小时内访问您的数据。“标准”是未指定检索选项的请求的默认选项。对于 S3 Glacier Flexible Retrieval 存储类别或 S3 Intelligent-Tiering 归档访问层,标准检索通常在 3-5 小时内完成。对于 S3 Glacier Deep Archive 存储类别或 S3 Intelligent-Tiering 深度归档访问层,标准检索通常会在 12 小时内完成。对于存储在 S3 Intelligent-Tiering 存储类别中的对象,标准检索是免费的。

    注意
    • 对于存储在 S3 Glacier Flexible Retrieval 存储类别或 S3 Intelligent-Tiering 归档访问层中的对象,使用 S3 批量操作还原操作启动的标准检索通常在几分钟内开始,并以每天高达 1-2 PB 的吞吐量在 3-5 小时内完成。

    • 对于 S3 Glacier Deep Archive 存储类别或 S3 Intelligent-Tiering 深度归档访问层中的对象,使用批量操作启动的标准检索开始后,通常以每天高达 1-2 PB 的吞吐量在 9 小时内完成。

  • 批量检索:使用 S3 Glacier 存储类别中成本最低的检索选项访问您的数据。通过批量检索,您能够以低廉的成本检索大量的数据。对于存储在 S3 Glacier Flexible Retrieval 存储类别或 S3 Intelligent-Tiering 归档访问层中的对象,批量检索通常在 5-12 小时内完成。对于存储在 S3 Glacier Deep Archive 存储类或 S3 Intelligent-Tiering 深度存档访问层中的对象,这些检索通常会在 48 小时内完成。对于存储在 S3 Glacier Flexible Retrieval 或 S3 Intelligent-Tiering 存储类中的对象,批量检索是免费的。

下表总结了归档检索选项。有关定价的信息,请参阅 Amazon S3 定价

存储类或层 加速 标准(带批量操作) 标准(不带批量操作) 批量

S3 Glacier Flexible Retrieval 或 S3 Intelligent-Tiering 归档访问

1–5 分钟

分钟 – 5 小时

3–5 小时

5–12 小时

S3 Glacier Deep Archive 或 S3 Intelligent-Tiering 深度归档访问

不可用

9 - 12 小时

12 小时内

48 小时内

要进行 ExpeditedStandardBulk 检索,请将 RestoreObject REST API 操作请求中的 Tier 请求元素设置为您需要的选项,或 AWS Command Line Interface(AWS CLI)或 AWS SDK 中的等效选项。如果您购买了预配置容量,则所有加速检索都会通过您的预配置容量自动获得处理。

还原大型数据集

还原由数千万个对象或数百 TB 数据组成的数据集时,由于检索限制,任何检索层的还原时间都可能比典型的还原时间更长。

当您为存储在 S3 Glacier Flexible Retrieval、S3 Glacier Deep Archive 或 S3 Intelligent-Tiering 存储类别中的对象启动还原请求时,将为您的 AWS 账户应用检索请求配额。S3 Glacier 支持以每秒 1000 个事务的速率发出还原请求。如果超过此速率,则有效请求将受限制或被拒绝,而 Amazon S3 会返回 ThrottlingException 错误。您可以使用 S3 批量操作通过单个请求检索许多对象,这可充分利用您的账户中可用的还原请求率。有关更多信息,请参阅 使用批量操作批量执行对象操作

在您启动还原请求后,S3 Glacier 支持还原大型数据集,对于每个客户账户,每天的吞吐量可高达 1-2 PB。对于任何检索选项,大于 5 TB 的对象将需要更长的时间才能还原,检索吞吐量高达每秒 300 MB。例如,一个 50 TB 的 S3 Glacier Flexible Retrieval 对象最多可能需要 48 小时才能完成。如果您需要提高还原限制,可以联系 AWS Support。

预调配容量

预调配容量的作用在于:当您从 S3 Glacier Flexible Retrieval 中进行加速检索时,它可帮助确保您在需要时获得检索容量。每个容量单位可提供每 5 分钟至少可以执行三次加速检索,并提供高达每秒 300 MB 的检索吞吐量。

如果没有预配置容量,在高需求期间可能不会接受加速检索。为了以可预测、快速的方式访问您的更多数据,请考虑使用 S3 Glacier Instant Retrieval 存储类别。

预调配容量单位分配给 AWS 账户。因此,加速数据检索的请求者(而不是桶拥有者)应购买预调配容量单位。

您可以使用 Amazon S3 控制台、Amazon Glacier 控制台、Purchase Provisioned Capacity REST API 操作、AWS SDK 或 AWS CLI 购买预调配容量。有关预调配容量的定价信息,请参阅 Amazon S3 定价