View a markdown version of this page

Gestione della pianificazione per la generazione delle statistiche delle colonne - AWS Glue

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Gestione della pianificazione per la generazione delle statistiche delle colonne

È possibile gestire le operazioni di pianificazione come l'aggiornamento, l'avvio, l'interruzione e l'eliminazione delle pianificazioni per la generazione delle statistiche delle colonne in AWS Glue. Puoi utilizzare le operazioni API di statistica AWS Glue della AWS Glue console o delle colonne per eseguire queste attività. AWS CLI

Aggiornamento del programma di generazione delle statistiche delle colonne

Dopo la creazione, è possibile aggiornare la pianificazione per attivare l'attività di generazione delle statistiche delle colonne È possibile utilizzare la AWS Glue console o eseguire l'UpdateColumnStatisticsTaskSettingsoperazione per aggiornare la pianificazione di una tabella. AWS CLIÈ possibile modificare i parametri di una pianificazione esistente, ad esempio il tipo di pianificazione (su richiesta o pianificata) e altri parametri opzionali.

Console di gestione AWS
Per aggiornare le impostazioni di un'attività di generazione delle statistiche delle colonne
  1. Accedi alla AWS Glue console all'indirizzo https://console.aws.amazon.com/glue/.

  2. Scegli la tabella da aggiornare dall'elenco delle tabelle.

  3. Nella sezione inferiore della pagina Tabelle, scegli Statistiche delle colonne.

  4. In Azioni, scegli Modifica per aggiornare la pianificazione.

  5. Apporta le modifiche desiderate alla pianificazione e scegli Salva.

AWS CLI

Se non utilizzi AWS Glue la funzionalità di generazione delle statistiche nella console, puoi aggiornare manualmente la pianificazione utilizzando il update-column-statistics-task-settings comando. L'esempio seguente mostra come aggiornare le statistiche delle colonne utilizzando AWS CLI.

aws glue update-column-statistics-task-settings \ --database-name 'database_name' \ --table-name 'table_name' \ --role arn:aws:iam::123456789012:role/stats_role \ --schedule 'cron(0 0-5 16 * * ?)' \ --column-name-list 'col-1' \ --sample-size '20.0' \ --catalog-id '123456789012'\ --security-configuration 'test-security'

Interruzione della pianificazione per la generazione delle statistiche delle colonne

Se non hai più bisogno delle statistiche incrementali, puoi interrompere la generazione pianificata per risparmiare risorse e costi. Mettere in pausa la pianificazione non influisce sulle statistiche generate in precedenza. Puoi riprendere la pianificazione quando preferisci.

Console di gestione AWS
Per interrompere la pianificazione di un'attività di generazione di statistiche delle colonne
  1. Sulla AWS Glue console, scegli Tabelle in Data Catalog.

  2. Seleziona una tabella con le statistiche delle colonne.

  3. Nella pagina dei Dettagli della tabella, scegli Statistiche delle colonne.

  4. In Azioni, scegli Generazione pianificata, Pausa.

  5. Scegli Pausa per confermare.

AWS CLI

Per interrompere la pianificazione dell'esecuzione di un'attività di statistica su colonne utilizzando il AWS CLI, puoi utilizzare il seguente comando:

aws glue stop-column-statistics-task-run-schedule \ --database-name ''database_name' \ --table-name 'table_name'

Sostituire database_name e table_name con i nomi effettivi del database e della tabella per i quali si desidera interrompere la pianificazione dell'esecuzione dell'attività di statistiche delle colonne.

Ripresa della pianificazione per la generazione delle statistiche delle colonne

Se hai messo in pausa la pianificazione della generazione delle statistiche, ti AWS Glue consente di riprenderla quando preferisci. Puoi riprendere la pianificazione utilizzando la AWS Glue console o AWS CLI l'operazione. StartColumnStatisticsTaskRunSchedule

Console di gestione AWS
Per riprendere la pianificazione per la generazione delle statistiche delle colonne
  1. Sulla AWS Glue console, scegli Tabelle in Data Catalog.

  2. Seleziona una tabella con le statistiche delle colonne.

  3. Nella pagina dei Dettagli della tabella, scegli Statistiche delle colonne.

  4. In Azioni, scegli Generazione pianificata, quindi scegli Riprendi.

  5. Scegli Riprendi per confermare.

AWS CLI

Sostituire database_name e table_name con i nomi effettivi del database e della tabella per i quali si desidera interrompere la pianificazione dell'esecuzione dell'attività di statistiche delle colonne.

aws glue start-column-statistics-task-run-schedule \ --database-name 'database_name' \ --table-name 'table_name'

Eliminazione del programma di generazione delle statistiche delle colonne

Sebbene la gestione delle up-to-date statistiche sia generalmente consigliata per prestazioni ottimali delle query, esistono casi d'uso specifici in cui la rimozione della pianificazione di generazione automatica potrebbe essere utile.

  • Se i dati rimangono relativamente statici, le statistiche delle colonne esistenti possono rimanere accurate per un periodo prolungato, riducendo la necessità di aggiornamenti frequenti. L'eliminazione della pianificazione può evitare il consumo inutile di risorse e il sovraccarico associato alla rigenerazione delle statistiche su dati immutati.

  • Quando è preferibile il controllo manuale sulla generazione delle statistiche. Eliminando la pianificazione automatica, gli amministratori possono aggiornare selettivamente le statistiche delle colonne a intervalli specifici o dopo modifiche significative dei dati, allineando il processo alle strategie di manutenzione e alle esigenze di allocazione delle risorse.

Console di gestione AWS
Per eliminare la pianificazione per la generazione delle statistiche delle colonne
  1. Sulla AWS Glue console, scegli Tabelle in Data Catalog.

  2. Seleziona una tabella con le statistiche delle colonne.

  3. Nella pagina dei Dettagli della tabella, scegli Statistiche delle colonne.

  4. In Azioni, scegli Generazione pianificata, Elimina.

  5. Seleziona Elimina per confermare.

AWS CLI

Sostituire database_name e table_name con i nomi effettivi del database e della tabella per i quali si desidera interrompere la pianificazione dell'esecuzione dell'attività di statistiche delle colonne.

Puoi eliminare la pianificazione delle statistiche delle colonne utilizzando l'operazione DeleteColumnStatisticsTaskSettingsAPI o AWS CLI. L'esempio seguente mostra come eliminare la pianificazione per la generazione di statistiche sulle colonne utilizzando AWS Command Line Interface (AWS CLI).

aws glue delete-column-statistics-task-settings \ --database-name 'database_name' \ --table-name 'table_name'