Visualizzazione delle impostazioni automatiche a livello di tabella - AWS Glue

Visualizzazione delle impostazioni automatiche a livello di tabella

Quando la raccolta delle statistiche a livello di catalogo è abilitata, ogni volta che una tabella Apache Hive o Apache Iceberg viene creata o aggiornata tramite le API CreateTable o UpdateTable con la AWS Management Console, l'SDK o Crawler di AWS Glue viene creata un'impostazione a livello di tabella equivalente per tale tabella.

Le tabelle con la generazione automatica delle statistiche abilitata devono seguire una delle seguenti proprietà:

  • Usa un comando InputSerdeLibrary che inizia con org.apache.hadoop e TableType è uguale a EXTERNAL_TABLE

  • Usa un comando InputSerdeLibrary che inizia con com.amazon.ion e TableType è uguale a EXTERNAL_TABLE

  • Contiene table_type: “ICEBERG” nella sua struttura dei parametri.

Dopo aver creato o aggiornato una tabella, puoi verificare i dettagli della tabella per confermare la generazione delle statistiche. Statistics generation summary mostra la proprietà Schedule impostata come AUTO e il valore di Statistics configuration è Inherited from catalog. Qualsiasi configurazione della tabella con la seguente impostazione verrebbe attivata automaticamente da Glue internamente.

È stata applicata un'immagine di una tabella Hive con una raccolta di statistiche a livello di catalogo e le statistiche sono state raccolte.