Generazione delle statistiche delle colonne delle tabelle Iceberg - AWS Glue

Generazione delle statistiche delle colonne delle tabelle Iceberg

Segui questi passaggi per configurare una pianificazione per la generazione di statistiche nel Catalogo dati utilizzando la console AWS Glue o AWS CLI, oppure esegui l'operazione StartColumnStatisticsTaskRun.

Per generare statistiche sulle colonne
  1. Accedi alla console AWS Glue all'indirizzo https://console.aws.amazon.com/glue/

  2. Scegli Tabelle nel Catalogo dati.

  3. Scegli una tabella Iceberg dall'elenco.

  4. Scegli Statistiche colonna, Genera su richiesta, nel menu Azioni.

    Puoi anche scegliere il pulsante Genera statistiche nella scheda Statistiche di colonna nella sezione inferiore della pagina Tabelle.

  5. Nella pagina Genera statistiche, fornisci i dettagli sulla generazione delle statistiche. Segui i passaggi 6-11 della sezione Generazione di statistiche a colonne in base a una pianificazione per configurare una pianificazione per la generazione di statistiche per le tabelle Iceberg.

    Puoi anche scegliere di generare statistiche sulle colonne su richiesta seguendo le istruzioni contenute in Generazione di statistiche delle colonne on demand

    Nota

    L'opzione di campionamento non è disponibile per le tabelle Iceberg.

    AWS Glue calcola il numero di valori distinti per ogni colonna della tabella Iceberg in un nuovo file Puffin salvato nell'ID snapshot specificato nella tua posizione Amazon S3.