正在检索 Amazon Glacier 档案 - Amazon Glacier

此页面仅适用于使用 Vaults 和 2012 年原始 REST API 的 Amazon Glacier 服务的现有客户。

如果您正在寻找档案存储解决方案,我们建议您在亚马逊 S3、S3 Glacier 即时检索、S3 Glacier 灵活检索和 S3 Glacier Deep Archive Deep Archive 中使用 Amazon Glacier 存储类。要了解有关这些存储选项的更多信息,请参阅 Amazon Glacier 存储类别

从 2025 年 12 月 15 日起,Amazon Glacier(最初基于保管库的独立服务)将不再接受新客户,对现有客户不产生任何影响。Amazon Glacier 是一项独立的服务 APIs ,拥有自己的服务,可将数据存储在文件库中,不同于亚马逊 S3 和 Amazon S3 Glacier 存储类别。在 Amazon Glacier 中,您的现有数据将保持安全且可以无限期地访问。无需迁移。对于低成本、长期的存档存储, AWS 建议使用 Amazon S3 Glacier 存储类别,这些存储类别基于S3存储桶 APIs、完全 AWS 区域 可用性、更低的成本和 AWS 服务集成,可提供卓越的客户体验。如果您想要增强功能,可以考虑使用我们的AWS 解决方案指南迁移到 Amazon S3 Glacier 存储类别,将数据从 Amazon Glacier 文件库传输到 Amazon S3 Glacier 存储类

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

正在检索 Amazon Glacier 档案

从 Amazon Glacier 检索档案是一种异步操作,在此操作中,您首先启动任务,然后在任务完成后下载输出。要启动档案取回任务,您可以使用 启动作业(POST 作业) REST API 操作或中的等效操作 AWS CLI、或 AWS SDKs。

从 Amazon Glacier 检索档案的过程分为两步。以下是此过程的概述。

检索档案
  1. 启动档案检索任务。

    1. 获得您要检索的档案的 ID。您可以从文件库清单获取档案 ID。您可以通过 REST API 获取档案 ID AWS CLI、或 AWS SDKs。有关更多信息,请参阅 在 Amazon Glacier 中下载文件库清单

    2. 使用启动作业(POST 作业)操作启动一项任务,请求 Amazon Glacier 准备整个档案或部分档案以供后续下载。

    当您启动任务时,Amazon Glacier 会在响应中返回一个任务 ID,并以异步方式运行该任务。(如步骤 2 所述,在任务完成之前,您不能下载任务输出。)

    重要

    数据检索策略可能导致您的 Initiate Job 请求失败,并发生 PolicyEnforcedException 异常,但这仅限于标准检索。有关数据检索策略的更多信息,请参阅亚马逊 Glacier 数据检索政策。有关 PolicyEnforcedException 异常的更多信息,请参阅错误响应

    必要时,您可以恢复存储在 Amazon Glacier 中的大部分数据。有关从 Amazon Glacier 存储类恢复数据的更多信息,请参阅《亚马逊简单存储服务用户指南》中的存档对象的存储类别

  2. 在任务完成后,使用获取任务输出(获取输出) 操作下载字节。

    您可以下载所有字节,或者指定字节范围,只下载任务输出的一部分。对于较大的输出,以区块下载输出的方式在下载失败(例如,由于网络发生故障而失败)时对您有所帮助。如果您在单一请求中获取任务输出,并且网络发生故障,则您不得不从头重新开始下载输出。但是,如果您以区块下载输出,万一发生任何故障,则您只需重新开始下载较小的部分,而不是整个输出。

Amazon Glacier 必须先完成一项任务,然后才能获得其输出。任务在完成后的至少 24 小时内都不会过期,这意味着,您可以在任务完成后的 24 小时期限内下载输出。恢复可以在任务完成 24 小时后随时过期。要确定您的任务是否已完成,请使用以下选项之一检查其状态:

  • 等待任务完成通知 — 您可以指定一个亚马逊简单通知服务 (Amazon SNS) Simple Notification Service 主题,任务完成后,Amazon Glacier 可以向该主题发布通知。Amazon Glacier 只有在完成任务后才会发送通知。

    启动任务时,您可以为该任务指定 Amazon SNS 主题。除了在任务请求中指定 Amazon SNS 主题外,如果您的文件库设置了档案取回事件的通知,那么 Amazon Glacier 还会向该 SNS 主题发布通知。有关更多信息,请参阅 在 Amazon Glacier 中配置文件库通知

  • 明确请求任务信息-您也可以使用 Amazon Glacier Describe Job API 操作 (描述任务(获取任务 ID)) 定期轮询任务信息。但是,建议使用 Amazon SNS 通知。

注意

使用 Amazon SNS 通知获取的信息与调用 Describe Job API 操作所获取的信息相同。

档案检索选项

在启动检索档案的任务时,您可以根据访问时间和成本需求指定以下检索选项之一。有关取回定价的信息,请参阅 Amazon Glacier 定价

  • 加速 - 加速检索允许您在偶尔需要紧急请求还原档案时快速访问存储在 S3 Glacier Flexible Retrieval 存储类或 S3 Intelligent-Tiering 归档访问层中的数据。对于除了最大型档案(250 MB 以上)之外的所有其他档案,使用加速检索访问的数据通常在 1 到 5 分钟内可用。预配置容量确保在您需要时,可以使用针对加速检索的检索容量。有关更多信息,请参阅 预配置容量

  • 标准 –标准检索允许您在数小时内访问您的任意档案。标准检索通常在 3 到 5 小时内完成。“标准”是未指定检索选项的检索请求的原定设置选项。

  • 批量 — 批量检索是成本最低的 Amazon Glacier 检索选项,您可以用它在一天之内以低廉的价格检索大量甚至数 PB 的数据。批量检索通常在 5 到 12 小时内完成。

下表总结了归档检索选项。有关定价的信息,请参阅 Amazon Glacier 定价

服务 加速 标准 批量

Amazon Glacier

1–5 分钟

3–5 小时

5–12 小时

要进行ExpeditedStandard、或Bulk检索,Tier请将 RestoreObjectREST API 操作请求中的请求元素设置为所需的选项,或 AWS Command Line Interface (AWS CLI) 或中的等效选项 AWS SDKs。如果您购买了预配置容量,则所有加速检索都会通过您的预配置容量自动获得处理。

预配置容量

预配置容量帮助确保在您需要时,可以使用针对加速检索的检索容量。每个容量单位允许每 5 分钟至少执行三次加急检索,并提供高达每秒 150 兆字节的检索吞吐量 () MBps。

如果您的工作负载需要极高的稳定性和对数据子集可预测的访问性能(以分钟为单位),建议您购买预调配检索容量。没有预配置容量的加速检索通常也可以接受,但是在极少情况下会出现不寻常的高需求。不过,如果您需要随时可以访问加速检索,您必须购买预配置检索容量。

购买预配置容量

您可以使用 Amazon Glacier 控制台、购买预配置容量 (POST provisioned-capacity) REST API 操作或购买预配置容量单位。 AWS SDKs AWS CLI有关预配置容量的定价信息,请参阅 Amazon Glacier 定价

预配置容量单位将持续一个月,从购买日期和时间开始计算。

如果开始日期为一个月的第 31 天,过期日期为下个月的最后一天。例如,如果开始日期为 8 月 31 日,则过期日期为 9 月 30 日。如果开始日期为 1 月 31 日,则过期日期为 2 月 28 日。

使用 Amazon Glacier 控制台购买预配置容量
  1. 登录 AWS Management Console 并在家中打开 Amazon Glacier https://console.aws.amazon.com/glacier/主机。

  2. 在左侧的导航窗格中,选择数据检索设置

  3. 预配置容量单位 (PCUs) 下,选择购买 PC U。此时将显示购买 PCU 对话框。

  4. 如果要购买预配置容量,请在确认购买框中输入 confirm

  5. 选择购买 PCU

关于限范围的档案检索

当您从 Amazon Glacier 检索档案时,您可以选择指定要检索的档案范围或一部分。默认为检索整个档案。如果您要执行以下操作,指定字节范围会很有用:

  • 管理您的数据下载 — Amazon Glacier 允许在检索请求完成后的 24 小时内下载检索到的数据。因此,您可能只想要检索档案的某些部分,以便在给定的下载时间窗内管理下载时间表。

  • 检索大型档案的目标段 – 例如,假设您之前聚合了许多文件并以单一档案的形式上传了这些文件,您现在想检索这些文件中的一些文件。在这种情况下,您可以通过使用一个检索请求指定档案的范围,该范围包含您感兴趣的文件。或者,您可以启动多个检索请求,每个请求均具有一个针对一个或多个文件的范围。

当使用范围检索启动检索任务时,您必须提供以兆字节对齐的范围。也就是说,字节范围可以从零(档案的开头)开始,或者从其后的任何 1-MB 间隔(1MB、2MB、3MB,依此类推)处开始。

该范围的结尾可以是您档案的结尾或大于范围开头的任何 1MB 间隔处。此外,如果您要在(检索任务完成后)下载数据时获取校验和值,则您在任务启动中请求的范围还必须以树形哈希对齐。可以使用校验和来确保数据在传输过程中没有损坏。有关兆字节对齐和树形哈希对齐的更多信息,请参阅“下载数据时接收校验和”。