Generazione di indici di partizione - AWS Glue

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Generazione di indici di partizione

Il Catalogo dati supporta la creazione di indici di partizione per fornire una ricerca efficiente di partizioni specifiche. Per ulteriori informazioni, consulta la pagina relativa alla Creazione di indici di partizione. Il crawler AWS Glue crea indici di partizione per le destinazioni Amazon S3 e Delta Lake per impostazione predefinita.

Console di gestione AWS
  1. Accedi alla Console di gestione AWS, quindi apri la console AWS Glue all'indirizzo https://console.aws.amazon.com/glue/.

  2. Seleziona Crawler nel Catalogo dati.

  3. Quando si definisce un crawler, l'opzione Crea automaticamente indici di partizione è abilitata per impostazione predefinita in Opzioni avanzate nella pagina Imposta output e pianificazione.

    Per disabilitare questa opzione, puoi deselezionare la casella di controllo Crea automaticamente gli indici di partizione nella console.

  4. Completa la configurazione del crawler e seleziona Crea crawler.

AWS CLI

Puoi anche disabilitare questa opzione usando la AWS CLI, impostando CreatePartitionIndex nel parametro configuration. Il valore di default è true.

aws glue update-crawler \ --name myCrawler \ --configuration '{"Version": 1.0, "CreatePartitionIndex": false }'

Note di utilizzo sugli indici di partizione

  • Le tabelle create dal crawler non hanno la variabile partition_filtering.enabled per impostazione predefinita. Per ulteriori informazioni, consulta la pagina AWS Glue partition indexing and filtering.

  • La creazione di indici di partizione per partizioni crittografate non è supportata.