了解归档检索选项
Amazon S3 具有三个归档存储类别:S3 Glacier Instant Retrieval、S3 Glacier Flexible Retrieval 和 S3 Glacier Deep Archive。虽然可以使用 GET 立即获得存储在 S3 Glacier Instant Retrieval 存储类别中的对象,但要访问存储在 S3 Glacier Flexible Retrieval 或 S3 Glacier Deep Archive 存储类别中的数据,您首先需要使用 RestoreObject REST API 检索数据。还原由数千万个对象或数百 TB 数据组成的数据集,所花的时间可能比典型的还原时间更长,需要特别注意。有关更多信息,请参阅 还原大型数据集。
您可以从三个检索访问选项中进行选择,以根据所需的检索速度还原归档的对象:加速、标准和批量。
-
加速检索:快速访问存储在 S3 Glacier Flexible Retrieval 存储类别或 S3 Intelligent-Tiering 归档访问层中的数据。您可以将此选项用于偶尔紧急请求多达数百个对象。大小小于 250 MB 的对象通常在 1-5 分钟内变为可用,而大小为 250 MB 或更大的对象通常以每秒多达 300 MB 的检索吞吐量进行检索。此外,还可以选择购买预置容量来进行加速检索。预置容量有助于确保在您需要时,可以使用加速检索容量。有关更多信息,请参阅 预调配容量。
注意
加速检索是一项高级特征,按加急请求和检索费率收费。有关 Amazon S3 定价的信息,请参阅 Amazon S3 定价
。 -
标准检索:在数小时内访问您的数据。“标准”是未指定检索选项的请求的默认选项。对于 S3 Glacier Flexible Retrieval 存储类别或 S3 Intelligent-Tiering 归档访问层,标准检索通常在 3-5 小时内完成。对于 S3 Glacier Deep Archive 存储类别或 S3 Intelligent-Tiering 深度归档访问层,标准检索通常会在 12 小时内完成。对于存储在 S3 Intelligent-Tiering 存储类别中的对象,标准检索是免费的。
注意
-
对于存储在 S3 Glacier Flexible Retrieval 存储类别或 S3 Intelligent-Tiering 归档访问层中的对象,使用 S3 批量操作还原操作启动的标准检索通常在几分钟内开始,并以每天高达 1-2 PB 的吞吐量在 3-5 小时内完成。
-
对于 S3 Glacier Deep Archive 存储类别或 S3 Intelligent-Tiering 深度归档访问层中的对象,使用批量操作启动的标准检索开始后,通常以每天高达 1-2 PB 的吞吐量在 9 小时内完成。
-
-
批量检索:使用 S3 Glacier 存储类别中成本最低的检索选项访问您的数据。通过批量检索,您能够以低廉的成本检索大量的数据。对于存储在 S3 Glacier Flexible Retrieval 存储类别或 S3 Intelligent-Tiering 归档访问层中的对象,批量检索通常在 5-12 小时内完成。对于存储在 S3 Glacier Deep Archive 存储类或 S3 Intelligent-Tiering 深度存档访问层中的对象,这些检索通常会在 48 小时内完成。对于存储在 S3 Glacier Flexible Retrieval 或 S3 Intelligent-Tiering 存储类中的对象,批量检索是免费的。
下表总结了归档检索选项。有关定价的信息,请参阅 Amazon S3 定价
| 存储类或层 | 加速 | 标准(带批量操作) | 标准(不带批量操作) | 批量 |
|---|---|---|---|---|
|
S3 Glacier Flexible Retrieval 或 S3 Intelligent-Tiering 归档访问 |
1–5 分钟 |
分钟 – 5 小时 |
3–5 小时 |
5–12 小时 |
|
S3 Glacier Deep Archive 或 S3 Intelligent-Tiering 深度归档访问 |
不可用 |
9 - 12 小时 |
12 小时内 |
48 小时内 |
要进行 Expedited、Standard 或 Bulk 检索,请将 RestoreObject REST API 操作请求中的 Tier 请求元素设置为您需要的选项,或 AWS Command Line Interface(AWS CLI)或 AWS SDK 中的等效选项。如果您购买了预配置容量,则所有加速检索都会通过您的预配置容量自动获得处理。
还原大型数据集
还原由数千万个对象或数百 TB 数据组成的数据集时,由于检索限制,任何检索层的还原时间都可能比典型的还原时间更长。
当您为存储在 S3 Glacier Flexible Retrieval、S3 Glacier Deep Archive 或 S3 Intelligent-Tiering 存储类别中的对象启动还原请求时,将为您的 AWS 账户应用检索请求配额。S3 Glacier 支持以每秒 1000 个事务的速率发出还原请求。如果超过此速率,则有效请求将受限制或被拒绝,而 Amazon S3 会返回 ThrottlingException 错误。您可以使用 S3 批量操作通过单个请求检索许多对象,这可充分利用您的账户中可用的还原请求率。有关更多信息,请参阅 使用批量操作批量执行对象操作。
在您启动还原请求后,S3 Glacier 支持还原大型数据集,对于每个客户账户,每天的吞吐量可高达 1-2 PB。对于任何检索选项,大于 5 TB 的对象将需要更长的时间才能还原,检索吞吐量高达每秒 300 MB。例如,一个 50 TB 的 S3 Glacier Flexible Retrieval 对象最多可能需要 48 小时才能完成。如果您需要提高还原限制,可以联系 AWS Support。
预调配容量
预调配容量的作用在于:当您从 S3 Glacier Flexible Retrieval 中进行加速检索时,它可帮助确保您在需要时获得检索容量。每个容量单位可提供每 5 分钟至少可以执行三次加速检索,并提供高达每秒 300 MB 的检索吞吐量。
如果没有预配置容量,在高需求期间可能不会接受加速检索。为了以可预测、快速的方式访问您的更多数据,请考虑使用 S3 Glacier Instant Retrieval
预调配容量单位分配给 AWS 账户。因此,加速数据检索的请求者(而不是桶拥有者)应购买预调配容量单位。
您可以使用 Amazon S3 控制台、Amazon Glacier 控制台、Purchase Provisioned Capacity REST API 操作、AWS SDK 或 AWS CLI 购买预调配容量。有关预调配容量的定价信息,请参阅 Amazon S3 定价