Leitura de objetos arquivados do S3 com as classes de armazenamento do S3 Glacier - Recomendações da AWS

Leitura de objetos arquivados do S3 com as classes de armazenamento do S3 Glacier

As classes do Amazon S3 Glacier são classes especiais de armazenamento com preços reduzidos, mas com alto tempo de recuperação. Diferentemente dos objetos do S3 Standard, os objetos do S3 Glacier não podem ser lidos como tabelas do AWS Glue. Para disponibilizar os dados para consultas analíticas ou relatórios, primeiro você deve restaurar os objetos do S3 Glacier. A restauração é um processo assíncrono que ocorre ao longo do tempo e tem um período de retenção. Depois que os objetos forem restaurados, eles poderão ser copiados para um local diferente como objetos do S3 Standard. Além do período de retenção, os objetos restaurados voltam para o Amazon S3 Glacier.

Usar o Operações em Lote do S

As Operações em Lote do S3 permitem executar operações em lote em grande escala no Amazon S3 em bilhões de objetos com exabytes de dados. O Amazon S3 monitora o progresso, envia notificações e armazena um relatório de conclusão detalhado de todas as ações, fornecendo uma experiência totalmente gerenciada, auditável e sem servidor.

As Operações em Lote do S3 são compatíveis com a operação Restore, que inicia a restauração de objetos do S3 para as seguintes camadas de armazenamento:

  • Objetos arquivados nas classes de armazenamento S3 Glacier Flexible Retrieval ou S3 Glacier Deep Archive

  • Objetos arquivados por meio da classe de armazenamento do S3 Intelligent-Tiering nos níveis Acesso de arquivamento ou Acesso de arquivamento profundo

A operação em lote pode ser invocada de forma programática e no console do Amazon S3. Para entrada, é necessário um arquivo de manifesto .csv que contém os objetos da lista a serem restaurados.

Você pode usar um relatório do Inventário Amazon S3 como entrada para o trabalho em lote. O relatório de inventário é configurado para um bucket e pode ser limitado a objetos com prefixos específicos. É um relatório automatizado e é gerado semanal ou diariamente no formato CSV, ORC ou Parquet.

Para obter mais informações sobre como configurar um relatório de inventário, consulte a documentação do Amazon S3. Para obter informações sobre como usar o Boto3 para criar um trabalho de Operações em Lote do S3, consulte a documentação do Boto3.