Eseguire query su dati di S3 Express One Zone - Amazon Athena

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Eseguire query su dati di S3 Express One Zone

La classe di archiviazione Amazon S3 Express One Zone è una classe di archiviazione di Amazon S3 ad alte prestazioni che fornisce tempi di risposta nell'ordine dei millisecondi. Pertanto, è utile per le applicazioni che accedono frequentemente ai dati con centinaia di migliaia di richieste al secondo.

S3 Express One Zone replica e archivia i dati all'interno della stessa zona di disponibilità per ottimizzare velocità e costi. Ciò si differenzia dalle classi di archiviazione regionali di Amazon S3, che replicano automaticamente i dati su almeno tre zone di disponibilità AWS all'interno di una Regione AWS.

Per ulteriori informazioni, consulta la pagina What is S3 Express One Zone? nella Guida per l'utente di Amazon S3.

Prerequisiti

Prima di iniziare, verifica che siano soddisfatte le seguenti condizioni:

  • Versione 3 del motore Athena: per utilizzare S3 Express One Zone con Athena SQL, il gruppo di lavoro deve essere configurato per l'utilizzo della versione 3 del motore Athena.

  • Autorizzazioni S3 Express One Zone: quando S3 Express One Zone richiama un'operazione come GET, LIST o PUT su un oggetto Amazon S3, la classe di archiviazione chiama CreateSession per tuo conto. Per questo motivo, la tua policy IAM deve consentire l'operazione s3express:CreateSession, che consente ad Athena di richiamare l'operazione dell'API corrispondente.

Considerazioni e limitazioni

Durante l'interrogazione di S3 Express One Zone con Athena, considera i seguenti punti.

  • I bucket S3 Express One Zone supportano la crittografia SSE_S3 e SSE-KMS. I risultati delle query Athena vengono scritti utilizzando la crittografia SSE_S3 indipendentemente dall'opzione di crittografia dei risultati delle query selezionata nelle impostazioni del gruppo di lavoro. Questa limitazione include tutti gli scenari in cui Athena scrive dati su bucket S3 Express One Zone, incluse le istruzioni CREATE TABLE AS (CTAS) e INSERT INTO.

  • Il crawler AWS Glue non è supportato per la creazione di tabelle sui dati di S3 Express One Zone.

  • L'istruzione MSCK REPAIR TABLE non è supportata. Come soluzione alternativa, utilizza ALTER TABLE ADD PARTITION.

  • In S3 Express One Zone, non è supportata alcuna istruzione DDL che modifichi tabelle per Apache Iceberg (ovvero nessuna istruzione ALTER TABLE).

  • Lake Formation non è supportato dai bucket di S3 Express One Zone.

  • I seguenti formati di file e tabelle non sono supportati o hanno un supporto limitato. Se i formati, pur non essendo elencati, sono supportati per Athena (come Parquet, ORC e JSON), sono supportati anche per l'uso con l'archiviazione S3 Express One Zone.

    Formato di file o tabella Limitazione
    Apache Avro Non supportato
    Log di CloudTrail Non supportato
    Apache Hudi Non supportato
    Amazon Ion Non supportato
    Log di Logstash Non supportato
    Log del server Web Apache Non supportato
    Delta Lake DDL non supportato. Per informazioni sulla creazione di una tabella Delta Lake utilizzando uno schema fittizio, consulta la pagina Sincronizzazione dei metadati Delta Lake. Le query SELECT sulla tabella sono supportate.

Inizia a usare

L'interrogazione dei dati di S3 Express One Zone con Athena è semplice. Per iniziare, attieniti alla procedura seguente.

Utilizzo di Athena SQL per interrogare i dati di S3 Express One Zone
  1. Trasferisci i tuoi dati all'archiviazione S3 Express One Zone. Per ulteriori informazioni, consulta la pagina Setting the storage class of an object nella Guida per l'utente di Amazon S3.

  2. Utilizza un'istruzione CREATE TABLE in Athena per catalogare i tuoi dati in AWS Glue Data Catalog. Per ulteriori informazioni sulla creazione delle tabelle in Athena, consulta la pagina Creazione di tabelle in Athena e l'istruzione CREATE TABLE.

  3. (Facoltativo) Configura la posizione dei risultati della query del tuo gruppo di lavoro Athena per utilizzare un bucket di directory Amazon S3. I bucket di directory Amazon S3 sono più performanti dei bucket generici e sono progettati per carichi di lavoro o applicazioni critiche per le prestazioni che richiedono una latenza costante nell'ordine dei millisecondi. Per ulteriori informazioni, consulta la pagina Directory buckets overview nella Guida per l'utente di Amazon S3.