Eseguire query su oggetti Amazon Glacier ripristinati - Amazon Athena

Eseguire query su oggetti Amazon Glacier ripristinati

È possibile usare Athena per eseguire query su oggetti ripristinati dalle classi di archiviazione Amazon S3, Amazon Glacier Flexible Retrieval (precedentemente Glacier) e Amazon Glacier Deep Archive. È necessario abilitare questa funzionalità per ogni tabella. Se non abiliti la funzionalità su una tabella prima di eseguire una query, Athena salta tutti gli oggetti Amazon Glacier Flexible Retrieval e Amazon Glacier Deep Archive della tabella.

Considerazioni e limitazioni

  • L'esecuzione di query di oggetti Amazon Glacier ripristinati è supportata solo sulla versione 3 del motore Athena.

  • La funzionalità è supportata solo per le tabelle Apache Hive.

  • È necessario ripristinare gli oggetti prima di eseguire query sui dati; Athena non ripristina gli oggetti per conto dell'utente.

Configurare una tabella per utilizzare oggetti ripristinati

Per configurare la tabella Athena in modo che includa gli oggetti ripristinati nelle query, è necessario impostare la relativa proprietà di tabella read_restored_glacier_objects su true. A tale scopo, puoi utilizzare l'editor di query di Athena o la console AWS Glue. Inoltre, puoi utilizzare la CLI di AWS Glue, le API di AWS Glue o l'SDK di AWS Glue.

Utilizzare l'editor di query Athena

In Athena puoi utilizzare il comando ALTER TABLE SET TBLPROPERTIES per impostare la proprietà di tabella, come nell'esempio seguente.

ALTER TABLE table_name SET TBLPROPERTIES ('read_restored_glacier_objects' = 'true')

Utilizzo della console AWS Glue

Nella console AWS Glue attieniti alla seguente procedura per aggiungere le proprietà della tabella read_restored_glacier_objects.

Come configurare le proprietà della tabella nella console AWS Glue
  1. Accedere alla Console di gestione AWS, quindi aprire la console AWS Glue all'indirizzo https://console.aws.amazon.com/glue/.

  2. Esegui una di queste operazioni:

    • Seleziona Vai al catalogo dati.

    • Nel pannello di navigazione, seleziona Tabelle catalogo dati.

  3. Nella pagine delle Tabelle, nell'elenco delle tabelle, seleziona il link della tabella che intendi modificare.

  4. Scegli Actions (Operazioni), Edit (Modifica).

  5. Nella pagina Modifica tabella, nella sezione Proprietà tabella, aggiungi la seguente coppia chiave-valore:

    • Per Chiave, aggiungere read_restored_glacier_objects.

    • In Valore, specifica true.

  6. Selezionare Salva.

Utilizza il AWS CLI

In AWS CLI è possibile usare il comando AWS Glue update-table e il relativo argomento --table-input per ridefinire una tabella e, nel farlo, aggiungervi la proprietà read_restored_glacier_objects. Nell'argomento --table-input utilizza la struttura Parameters per specificare la proprietà read_restored_glacier_objects e il valore di true. Tieni presente che l'argomento per --table-input non deve avere spazi e deve utilizzare barre rovesciate per evitare le doppie virgolette. Nell'esempio seguente, sostituite my_database e my_tablecon il nome del database e della tabella.

aws glue update-table \ --database-name my_database \ --table-input={\"Name\":\"my_table\",\"Parameters\":{\"read_restored_glacier_objects\":\"true\"}}
Importante

Il comando AWS Glue update-table funziona in modalità sovrascrittura, il che significa che sostituisce la definizione della tabella esistente con una nuova definizione specificata dal parametro table-input. Per questo motivo, assicurarsi di specificare nel parametro table-input anche tutti i campi che si desidera inserire nella tabella quando si aggiunge la proprietà read_restored_glacier_objects.