Créer des tâches AWS Glue à l'aide de sessions interactives - AWS Glue

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Créer des tâches AWS Glue à l'aide de sessions interactives

Les ingénieurs de données peuvent créer des tâches AWS Glue plus rapidement et plus facilement qu'avant en utilisant des séances interactives dans AWS Glue.

Présentation de séances interactives AWS Glue

Avec les séances interactives AWS Glue, vous pouvez rapidement créer, tester et exécuter des applications de préparation et d'analytique des données. Les séances interactives fournissent une interface programmatique et visuelle pour la création et le test de scripts d'extraction, transformation et chargement (ETL) pour la préparation de données. Les séances interactives exécutent les applications d'analytique Apache Spark et fournissent un accès à la demande à un environnement d'exécution Spark à distance. AWS Glue gère Spark sans serveur de manière transparente pour ces séances interactives.

Les sessions interactives sont flexibles, vous pouvez donc créer et tester des applications à partir de l'environnement de votre choix. Vous pouvez créer et travailler avec des séances interactives via le AWS Command Line Interface et l'API. Vous pouvez utiliser des blocs-notes compatibles avec Jupyter pour créer et tester visuellement vos scripts de bloc-notes. Les séances interactives fournissent un noyau Jupyter open source qui s'intègre presque partout où Jupyter s'intègre, y compris avec des IDE tels que PyCharm, IntelliJ et VS Code. Cela vous permet de coder dans votre environnement local et de l'exécuter de manière transparente sur le backend des séances interactives.

À l'aide de l'API des séances interactive, les clients peuvent exécuter par programmation des applications utilisant l'analyse Apache Spark sans avoir à gérer l'infrastructure Spark. Vous pouvez exécuter une ou plusieurs instructions Spark au cours d'une seule séance interactive.

Les séances interactives offrent donc un moyen plus rapide, moins coûteux et plus flexible de créer et d'exécuter des applications de préparation et d'analytique des données. Pour apprendre à utiliser les sessions interactives, consultez la documentation de cette section. Magics prises en charge par AWS Glue

Limites

  • Les signets de tâches ne sont pas pris en charge dans les séances interactives.

  • La création de blocs-notes à l’aide de l’AWS Command Line Interface n’est pas prise en charge.

  • Les blocs-notes AWS Glue Studio ne prennent pas Scala en charge.