View a markdown version of this page

Apache Iceberg tavoli in AWS Clean Rooms - AWS Clean Rooms

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Apache Iceberg tavoli in AWS Clean Rooms

Apache Icebergè un formato di tabella open source per data lake. AWS Clean Rooms può utilizzare le statistiche memorizzate nei Apache Iceberg metadati per ottimizzare i piani di interrogazione e ridurre le scansioni dei file durante l'elaborazione delle query in camera bianca. Per ulteriori informazioni, consulta la documentazione di Apache Iceberg.

Considerate quanto segue quando utilizzate AWS Clean Rooms con le tabelle Iceberg:

  • Tabelle Apache Iceberg per S3: Apache Iceberg le tabelle devono essere definite in AWS Glue Data Catalog base all'implementazione open source del catalogo Glue.

  • Tabelle Apache Iceberg per Athena — Per ulteriori informazioni, vedere https://docs.aws.amazon.com/athena/latest/ug/querying-iceberg.html

  • Tabelle Apache Iceberg per Snowflake — Per ulteriori informazioni, vedere https://docs.snowflake.com/en/user-guide/tables-iceberg

  • Formato di file Parquet: supporta AWS Clean Rooms solo le tabelle Iceberg nel formato di file di dati Parquet.

  • Le compressioni GZIP, Snappy e Zstd: AWS Clean Rooms supporta Parquet con compressione GZIP e (Zstd). Snappy Zstandard

  • Versioni Iceberg: AWS Clean Rooms supporta l'esecuzione di query sulle tabelle Iceberg versione 1 e versione 2.

  • Partizioni: non è necessario aggiungere manualmente le partizioni per le tabelle. Apache Iceberg AWS Glue AWS Clean Rooms rileva automaticamente le nuove partizioni nelle Apache Iceberg tabelle e non è necessaria alcuna operazione manuale per aggiornare le partizioni nella definizione della tabella. Le partizioni Iceberg vengono visualizzate come colonne regolari nello schema della AWS Clean Rooms tabella e non separatamente come chiave di partizione nello schema della tabella configurato.

  • Limitazioni

    • Solo nuove tabelle Iceberg

      Apache Icebergle tabelle convertite da Apache Parquet tabelle non sono supportate.

    • Query temporali

      AWS Clean Rooms non supporta le interrogazioni sui viaggi nel tempo con le Apache Iceberg tabelle.

    • Motore Athena versione 2

      Icebergle tabelle create con la versione 2 del motore Athena non sono supportate.

    • Formati di file

      Avroe i formati di file Orc (Optimized Row Columnar) non sono supportati.

Tipi di dati supportati per le tabelle Iceberg

AWS Clean Rooms può interrogare Iceberg tabelle che contengono i seguenti tipi di dati:

  • BOOLEAN

  • DATE

  • DECIMAL

  • DOUBLE

  • FLOAT

  • INT

  • LIST

  • LONG

  • MAP

  • STRING

  • STRUCT

  • TIMESTAMP WITHOUT TIME ZONE

Per ulteriori informazioni sui tipi di tabella Iceberg, consulta Schemi per Iceberg nella documentazione di Apache.