Utilizzo di una ricetta di preparazione dei dati in AWS Glue Studio - AWS Glue

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Utilizzo di una ricetta di preparazione dei dati in AWS Glue Studio

La trasformazione della Ricetta di preparazione dei dati consente di creare una ricetta di preparazione dei dati da zero utilizzando un'interfaccia di creazione interattiva in stile griglia. Consente inoltre di importare una ricetta AWS Glue DataBrew esistente e quindi modificarla in AWS Glue Studio.

Il nodo Ricetta di preparazione dei dati è disponibile nel pannello Risorse. È possibile connettere il nodo Ricetta di preparazione dei dati a un altro nodo del flusso di processo visivo, che si tratti di un nodo Origine dati o di un altro nodo di trasformazione. Dopo aver scelto una ricetta AWS Glue DataBrew e una versione, i passaggi applicati nella ricetta sono visibili nella scheda delle proprietà del nodo.

Prerequisiti

Limitazioni

  • Le ricette AWS Glue DataBrew sono supportate solo nelle regioni commerciali di DataBrew.

  • Non tutte le ricette AWS Glue DataBrew sono supportate da AWS Glue. Alcune ricette non potranno essere eseguite in AWS Glue Studio.

    • Le ricette con trasformazioni UNION e JOIN non sono supportate, tuttavia AWS Glue Studio dispone già di nodi di trasformazione "Join" e "Union" che possono essere utilizzati prima o dopo un nodo Ricetta di preparazione dei dati.

  • I nodi Ricetta di preparazione dei dati sono supportati per i processi a partire da AWS Glue versione 4.0. Questa versione verrà selezionata automaticamente dopo l'aggiunta di un nodo Ricetta di preparazione dei dati al processo.

  • I nodi Ricetta di preparazione dei dati richiedono Python. Viene impostato automaticamente quando il nodo Ricetta di preparazione dei dati viene aggiunto al processo.

  • L'aggiunta di un nuovo nodo Ricetta di preparazione dei dati al grafico visivo riavvierà automaticamente la sessione di Anteprima dei dati con le librerie corrette per utilizzare il nodo Ricetta di preparazione dei dati.

  • Le seguenti trasformazioni non sono supportate per l'importazione o la modifica in un nodo Ricetta di preparazione dei dati: GROUP_BY, PIVOT, UNPIVOT, eTRANSPOSE.

Funzionalità aggiuntive

Dopo aver selezionato la trasformazione Ricetta di preparazione dei dati, hai la possibilità di intraprendere azioni aggiuntive dopo aver scelto Author recipe.

  • Aggiungi passaggio: puoi aggiungere ulteriori passaggi a una ricetta, se necessario, scegliendo l'icona Aggiungi passaggio oppure utilizzare la barra degli strumenti nel riquadro di anteprima scegliendo un'azione.

    Lo screenshot mostra l'icona Aggiungi ricetta.
    Lo screenshot mostra l'icona Aggiungi ricetta.
  • Importa ricetta: scegli Altro, quindi Importa ricetta da utilizzare nel tuo AWS Glue Studio processo.

    Lo screenshot mostra l'icona Altro.
    Lo screenshot mostra l'icona Altro.
  • Scarica come YAML: scegli Altro, quindi Scarica come YAML per scaricare la ricetta da salvare all'esterno di AWS Glue Studio.

  • Scarica come JSON: scegli Altro, quindi Scarica come JSON per scaricare la ricetta da salvare all'esterno di AWS Glue Studio.

  • Annulla e ripeti i passaggi della ricetta: puoi annullare e ripetere i passaggi della ricetta nel riquadro di anteprima quando lavori con i dati nella griglia.

    Lo screenshot mostra l'icona Altro.