Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Utilisation d'une recette de préparation des données dans AWS Glue Studio
La transformation Recettes de préparation des données vous permet de créer une recette de préparation des données à partir de zéro à l’aide d’une interface de création interactive de type grille. Elle vous permet également d’importer une recette AWS Glue DataBrew existante, puis de la modifier dans AWS Glue Studio.
Le nœud Recette de préparation des données est disponible dans le panneau Ressources. Vous pouvez connecter le nœud Recette de préparation des données à un autre nœud du flux de travail visuel, qu'il s'agisse d'un nœud de source de données ou d'un autre nœud de transformation. Après avoir choisi une recette et une version AWS Glue DataBrew, les étapes appliquées dans la recette sont visibles dans l'onglet des propriétés du nœud.
Prérequis
-
Si vous importez une recette AWS Glue DataBrew, vous disposez des autorisations IAM requises, comme décrit dans Importer une AWS Glue DataBrew recette dans AWS Glue Studio.
-
Une session de prévisualisation des données doit être créée.
Limites
-
Les recettes AWS Glue DataBrew ne sont prises en charge que dans les régions DataBrew commerciales.
-
Toutes les recettes AWS Glue DataBrew ne sont pas prises en charge par AWS Glue. Certaines recettes ne pourront pas être exécutées dans AWS Glue Studio.
-
Les recettes avec des transformations de type
UNIONetJOINne sont pas prises en charge, mais AWS Glue Studio dispose déjà de nœuds de transformation « Join » et « Union » qui peuvent être utilisés avant ou après un nœud Data Preparation Recipe.
-
-
Les nœuds Recette de préparation des données sont pris en charge pour les tâches à partir de la version 4.0 de AWS Glue. Cette version sera sélectionnée automatiquement après l'ajout d'un nœud Recette de préparation des données à la tâche.
-
Les nœuds Recette de préparation des données nécessitent Python. Ceci est automatiquement défini lorsque le nœud Recette de préparation des données est ajouté à la tâche.
-
L’ajout d’un nouveau nœud Data Preparation Recipe au graphique visuel redémarrera automatiquement votre session de prévisualisation des données avec les bibliothèques appropriées pour utiliser le nœud Data Preparation Recipe.
-
Les transformations suivantes ne sont pas prises en charge pour l’importation ou la modification dans un nœud Data Preparation Recipe :
GROUP_BY,PIVOT,UNPIVOTetTRANSPOSE.
Fonctionnalités supplémentaires
Lorsque vous avez sélectionné la transformation de Recette de préparation des données, vous pouvez effectuer des actions supplémentaires après avoir sélectionné Créer une recette.
-
Ajouter une étape : vous pouvez ajouter des étapes supplémentaires à une recette selon vos besoins en cliquant sur l’icône d’ajout d’étape, ou utiliser la barre d’outils du volet de prévisualisation en choisissant une action.
-
Importer une recette : choisissez Plus, puis Importer une recette à utiliser dans le cadre de votre tâche AWS Glue Studio.
-
Télécharger au format YAML : choisissez Plus, puis Télécharger au format YAML pour télécharger votre recette et l’enregistrer en dehors d’AWS Glue Studio.
-
Télécharger au format JSON : choisissez Plus, puis Télécharger au format JSON pour télécharger votre recette à enregistrer en dehors d’AWS Glue Studio.
-
Annuler et rétablir les étapes de la recette : vous pouvez annuler et rétablir les étapes de la recette dans le volet de prévisualisation lorsque vous travaillez avec des données dans la grille.