Eseguire query su oggetti Amazon Glacier ripristinati
È possibile usare Athena per eseguire query su oggetti ripristinati dalle classi di archiviazione Amazon S3, Amazon Glacier Flexible Retrieval (precedentemente Glacier) e Amazon Glacier Deep Archive. È necessario abilitare questa funzionalità per ogni tabella. Se non abiliti la funzionalità su una tabella prima di eseguire una query, Athena salta tutti gli oggetti Amazon Glacier Flexible Retrieval e Amazon Glacier Deep Archive della tabella.
Considerazioni e limitazioni
-
L'esecuzione di query di oggetti Amazon Glacier ripristinati è supportata solo sulla versione 3 del motore Athena.
-
La funzionalità è supportata solo per le tabelle Apache Hive.
-
È necessario ripristinare gli oggetti prima di eseguire query sui dati; Athena non ripristina gli oggetti per conto dell'utente.
Configurare una tabella per utilizzare oggetti ripristinati
Per configurare la tabella Athena in modo che includa gli oggetti ripristinati nelle query, è necessario impostare la relativa proprietà di tabella read_restored_glacier_objects su true. A tale scopo, puoi utilizzare l'editor di query di Athena o la console AWS Glue. Inoltre, puoi utilizzare la CLI di AWS Glue
Utilizzare l'editor di query Athena
In Athena puoi utilizzare il comando ALTER TABLE SET TBLPROPERTIES per impostare la proprietà di tabella, come nell'esempio seguente.
ALTER TABLE table_name SET TBLPROPERTIES ('read_restored_glacier_objects' = 'true')
Utilizzo della console AWS Glue
Nella console AWS Glue attieniti alla seguente procedura per aggiungere le proprietà della tabella read_restored_glacier_objects.
Come configurare le proprietà della tabella nella console AWS Glue
Accedere alla Console di gestione AWS, quindi aprire la console AWS Glue all'indirizzo https://console.aws.amazon.com/glue/
. -
Esegui una di queste operazioni:
-
Seleziona Vai al catalogo dati.
-
Nel pannello di navigazione, seleziona Tabelle catalogo dati.
-
-
Nella pagine delle Tabelle, nell'elenco delle tabelle, seleziona il link della tabella che intendi modificare.
-
Scegli Actions (Operazioni), Edit (Modifica).
-
Nella pagina Modifica tabella, nella sezione Proprietà tabella, aggiungi la seguente coppia chiave-valore:
-
Per Chiave, aggiungere
read_restored_glacier_objects. -
In Valore, specifica
true.
-
-
Selezionare Salva.
Utilizza il AWS CLI
In AWS CLI è possibile usare il comando AWS Glue update-table--table-input per ridefinire una tabella e, nel farlo, aggiungervi la proprietà read_restored_glacier_objects. Nell'argomento --table-input utilizza la struttura Parameters per specificare la proprietà read_restored_glacier_objects e il valore di true. Tieni presente che l'argomento per --table-input non deve avere spazi e deve utilizzare barre rovesciate per evitare le doppie virgolette. Nell'esempio seguente, sostituite my_database e my_tablecon il nome del database e della tabella.
aws glue update-table \ --database-namemy_database\ --table-input={\"Name\":\"my_table\",\"Parameters\":{\"read_restored_glacier_objects\":\"true\"}}
Importante
Il comando AWS Glue update-table funziona in modalità sovrascrittura, il che significa che sostituisce la definizione della tabella esistente con una nuova definizione specificata dal parametro table-input. Per questo motivo, assicurarsi di specificare nel parametro table-input anche tutti i campi che si desidera inserire nella tabella quando si aggiunge la proprietà read_restored_glacier_objects.