Crea ed esegui ricette di preparazione dei dati in un job ETL AWS Glue visivo - AWS Glue

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Crea ed esegui ricette di preparazione dei dati in un job ETL AWS Glue visivo

In questo scenario, puoi creare ricette di preparazione dei dati senza doverle prima creare. DataBrew Prima di iniziare a creare ricette, devi:

  • Avere in esecuzione una sessione di Anteprima dati attiva. Quando la sessione di anteprima dei dati è PRONTA, Author Recipe diventerà attiva e potrai iniziare a creare o modificare la tua ricetta.

    Lo screenshot mostra la sessione Anteprima dati come completa.
  • Assicurati che l'interruttore per l'importazione automatica delle librerie glue sia abilitato.

    Lo screenshot mostra l'opzione per l'importazione automatica delle librerie glue attivata.

    Puoi farlo scegliendo l'icona a forma di ingranaggio nel riquadro Anteprima dati.

    Lo screenshot mostra l'opzione per l'importazione automatica delle librerie glue attivata.
Per creare una ricetta di preparazione dei dati in AWS Glue Studio:
  1. Aggiungi il trasformatore Data Preparation Recipe al canvas del lavoro. Il trasformatore deve essere connesso a un nodo di origine dati padre. Quando aggiungi il nodo Data Preparation Recipe, questo si riavvierà con le librerie appropriate e vedrai il frame dei dati in preparazione.

    Lo screenshot mostra il caricamento del frame dei dati dopo l'aggiunta della ricetta per la preparazione dei dati.
  2. Una volta che la sessione di Anteprima dati è pronta, i dati con tutti i passaggi applicati in precedenza verranno visualizzati nella parte inferiore dello schermo.

  3. Scegli Author Recipe. Ciò ti consentirà di iniziare una nuova ricetta in AWS Glue Studio.

    La schermata mostra il pannello Trasforma con i campi Nome e Nodo padre, oltre all'opzione Author Recipe.
  4. Nel pannello Trasforma a destra del canvas di lavoro, inserisci un nome per la ricetta di preparazione dei dati.

  5. Sul lato sinistro, il canvas verrà sostituito da una visualizzazione a griglia dei dati. A destra, il pannello Trasforma cambierà per mostrare i passaggi della ricetta. Scegli Aggiungi passaggio per aggiungere il primo passaggio della ricetta.

    Lo screenshot mostra il pannello Trasforma dopo aver scelto Aggiungi passaggio. Quando scegli una colonna, le opzioni cambiano in modo dinamico. Puoi scegliere di ordinare, eseguire un'azione sulla colonna e filtrare i valori.
  6. Nel pannello Trasforma puoi scegliere di ordinare, eseguire un'azione sulla colonna e filtrare i valori. Ad esempio, scegli Rinomina colonna.

    Lo screenshot mostra il pannello Trasforma dopo aver scelto Aggiungi passaggio. Quando scegli una colonna, le opzioni cambiano in modo dinamico. Puoi scegliere di ordinare, eseguire un'azione sulla colonna e filtrare i valori.
  7. Nel pannello Trasforma sul lato destro, le opzioni per rinominare una colonna consentono di scegliere la colonna di origine da rinominare e di inserire il nuovo nome della colonna. Dopo averlo fatto, scegli Applica.

    Puoi visualizzare in anteprima ogni passaggio, annullarne uno, riordinarli e utilizzare qualsiasi icona di azione (Filtra, Ordina, Dividi, Unisci, ecc.) Quando esegui azioni nella griglia di dati, i passaggi vengono aggiunti alla ricetta nel pannello Trasforma.

    La schermata mostra la griglia Anteprima dei dati con la barra degli strumenti evidenziata. Puoi applicare un'azione utilizzando uno qualsiasi degli strumenti e questa verrà aggiunta alla ricetta nel pannello Trasforma a destra.

    Se devi apportare una modifica, puoi farlo nel riquadro Anteprima visualizzando in anteprima il risultato di ogni passaggio, annullandolo e riordinandoli. Esempio:

    • Undo/redo passaggio: annulla un passaggio scegliendo l'icona Annulla. Puoi ripetere un passaggio scegliendo l'icona Ripeti.

      Lo screenshot mostra l'icona Altro.
    • Fase di riordino: quando riordini una fase, AWS Glue Studio convaliderà ogni passaggio e ti comunicherà se non è valido.

  8. Dopo aver applicato un passaggio, il pannello Trasforma ti mostrerà tutti i passaggi della ricetta. Puoi cancellare tutti i passaggi per ricominciare da capo, aggiungerne altri scegliendo l'icona Aggiungi o scegliere Done Authoring Recipe.

    Lo screenshot mostra il pannello Trasformazione con i passaggi aggiunti alla ricetta. Al termine, scegli Done Authoring Recipe o l'icona Aggiungi per aggiungere altri passaggi alla ricetta.
  9. Scegli Salva nella parte in alto a destra dello schermo. I passaggi della ricetta non verranno salvati finché non salverai il lavoro.