Utilizzo della trasformazione Concatena colonne per aggiungere colonne - AWS Glue

Utilizzo della trasformazione Concatena colonne per aggiungere colonne

La trasformazione Concatena consente di creare una nuova colonna di stringhe utilizzando i valori di altre colonne con un distanziatore opzionale. Ad esempio, se definiamo una colonna concatenata "data" come concatenazione di "anno", "mese" e "giorno" (in quest'ordine) con "-" come spaziatore, otterremmo:

giorno mese anno data
01 01 2020 2020-01-01
02 01 2020 2020-01-02
03 01 2020 2020-01-03
04 01 2020 2020-01-04
Per aggiungere una trasformazione Concatena:
  1. Aprire il pannello Risorse. Quindi, scegliere Concatena colonne per aggiungere una nuova trasformazione al diagramma di processo. Il nodo selezionato al momento dell'aggiunta del nodo ne sarà il nodo padre.

  2. (Facoltativo) Nella scheda Proprietà del nodo, è possibile inserire un nome per il nodo nel diagramma del processo. Se non è già selezionato un nodo padre, scegliere un nodo dall'elenco Nodi padre da utilizzare come origine di input per la trasformazione.

  3. Nella scheda Trasforma, inserire il nome della colonna che conterrà la stringa concatenata e le colonne da concatenare. L'ordine in cui si selezionano le colonne nel menu a discesa sarà l'ordine utilizzato.

    La schermata mostra la scheda Trasforma per la trasformazione Concatena.
  4. Spaziatore - facoltativo: inserire una stringa da inserire tra i campi concatenati. Per impostazione predefinita, non sono previsti spaziatori.

  5. Valore nullo - facoltativo: inserire una stringa da utilizzare quando il valore di una colonna è nullo. Per impostazione predefinita, nei casi in cui le colonne hanno il valore “NULL” o “NA”, viene utilizzata una stringa vuota.