Query di tabelle di metadati - Amazon Simple Storage Service

Query di tabelle di metadati

Le tabelle dei metadati di Amazon S3 sono archiviate in un bucket di tabelle S3 gestito da AWS, che fornisce un’archiviazione ottimizzata per i dati tabulari. Per eseguire query sui metadati, è possibile integrare il bucket di tabelle con Amazon SageMaker Lakehouse. Questa integrazione, che utilizza AWS Glue Data Catalog e AWS Lake Formation, consente ai servizi di analisi AWS di individuare e accedere automaticamente ai dati delle tabelle.

Dopo aver integrato il bucket di tabelle con AWS Glue Data Catalog, è possibile eseguire query direttamente sulle tabelle dei metadati con i servizi di analisi AWS come Amazon Athena, Amazon EMR e Amazon Redshift. È anche possibile creare dashboard interattive con i dati della query utilizzando Amazon Quick Suite.

Per ulteriori informazioni sull’integrazione del bucket di tabelle S3 gestito da AWS con Amazon SageMaker Lakehouse, consulta Integrazione di Tabelle Amazon S3 con i servizi di analisi AWS.

È anche possibile eseguire query sulle tabelle dei metadati con Apache Spark, Apache Trino e qualsiasi altra applicazione che supporti il formato Apache Iceberg, utilizzando l’endpoint REST AWS Glue Iceberg, l’endpoint REST Iceberg di Tabelle Amazon S3 o il catalogo di Tabelle Amazon S3 per il catalogo client Apache Iceberg. Per ulteriori informazioni sull’accesso alle tabelle dei metadati, consulta Accesso ai dati delle tabelle.

È possibile analizzare le tabelle dei metadati con qualsiasi motore di query che supporti il ​​formato Apache Iceberg. Ad esempio, puoi eseguire query sulle tabelle dei metadati per effettuare quanto segue:

  • Scopri i modelli e le tendenze di utilizzo dello storage

  • Audit AWS Key Management Service (AWS KMS) sull'utilizzo delle chiavi di crittografia negli oggetti

  • Ricerca di oggetti in base ai metadati e ai tag dell'oggetto definiti dall'utente

  • Comprensione delle modifiche dei metadati degli oggetti nel tempo

  • Scopri quando gli oggetti vengono aggiornati o eliminati, compreso l'ID Account AWS o l'indirizzo IP che ha effettuato la richiesta

Puoi anche unire le tabelle dei metadati gestite da S3 con tabelle dei metadati personalizzate, in modo da eseguire query su più set di dati.

Considerazioni sul prezzo delle query

Per l'esecuzione di query sulle tabelle di metadati si applica un prezzo aggiuntivo. Per ulteriori informazioni, consulta le informazioni sui prezzi del motore di query in uso.

Per informazioni su come rendere le query più efficienti dal punto di vista dei costi, consulta Ottimizzazione delle prestazioni delle query sulle tabelle di metadati.