Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Créez et exécutez des recettes de préparation de données dans une AWS Glue tâche ETL visuelle
Dans ce scénario, vous pouvez créer des recettes de préparation des données sans avoir à les créer au préalable DataBrew. Avant de commencer à créer des recettes, vous devez respecter les conditions suivantes :
-
Disposer d’une session de prévisualisation des données active et en cours d’exécution. Lorsque la session de prévisualisation des données est PRÊTE, l’option Créer une recette devient active et vous pouvez commencer à créer ou à modifier votre recette.
-
Assurez-vous que l’option Importer automatiquement les bibliothèques Glue est activée.
Vous pouvez procéder en choisissant l’icône d’engrenage dans le volet Prévisualisation des données.
Pour créer une recette de préparation des données dans AWS Glue Studio :
-
Ajoutez la transformation Recette de préparation des données à votre canevas de tâches. Votre transformation doit être connectée à un nœud de source de données parent. Lorsque vous ajoutez le nœud Data Preparation Recipe, celui-ci redémarrera avec les bibliothèques appropriées et vous verrez la trame de données en cours de préparation.
-
Une fois que la session de prévisualisation des données est prête, les données contenant les étapes précédemment appliquées apparaîtront en bas de l’écran.
-
Choisissez Créer une recette. Cela vous permettra de démarrer une nouvelle recette dans AWS Glue Studio.
-
Dans le panneau Transformation situé à droite du canevas de tâches, saisissez le nom de votre recette de préparation des données.
-
Sur le côté gauche, le canevas sera remplacé par une vue en grille de vos données. Sur la droite, le panneau Transformation changera pour vous montrer les étapes de votre recette. Choisissez Ajouter une étape pour ajouter la première étape à votre recette.
-
Dans le panneau Transformation, choisissez de trier, d’effectuer une action sur la colonne et de filtrer les valeurs. Par exemple, choisissez Renommer la colonne.
-
Dans le panneau Transformation sur le côté droit, les options visant à renommer une colonne vous permettent de choisir la colonne source à renommer et de saisir le nouveau nom de colonne. Une fois que vous l’avez fait, choisissez Appliquer.
Vous pouvez prévisualiser chaque étape, annuler une étape, réorganiser les étapes et utiliser n’importe laquelle des icônes d’action, telles que Filtrer, Trier, Diviser, Fusionner, etc. Lorsque vous effectuez des actions dans la grille de données, les étapes sont ajoutées à la recette dans le panneau Transformation.
Si vous devez apporter une modification, vous pouvez le faire dans le volet d’aperçu en prévisualisant le résultat de chaque étape, en annulant une étape et en réorganisant les étapes. Par exemple :
-
Undo/redo étape : annuler une étape en choisissant l'icône d'annulation. Vous pouvez répéter une étape en choisissant l’icône de rétablissement.
-
Étape de réorganisation : lorsque vous réorganisez une étape, AWS Glue Studio chaque étape est validée et vous indique si l'étape n'est pas valide.
-
-
Une fois que vous avez appliqué une étape, le panneau Transformation affiche toutes les étapes de votre recette. Vous pouvez effacer toutes les étapes pour recommencer, ajouter d’autres étapes en cliquant sur l’icône d’ajout ou choisir Terminer la création de la recette.
-
Choisissez Enregistrer en haut à droite de votre écran. Les étapes de votre recette ne sont pas enregistrées tant que vous n’avez pas enregistré votre tâche.