Connexion à une application EMR sans serveur depuis Studio
Les scientifiques des données et les ingénieurs de données peuvent découvrir une application EMR sans serveur et s’y connecter directement depuis l’interface utilisateur de Studio. Avant de commencer, assurez-vous d’avoir créé une application EMR sans serveur en suivant les instructions fournies dans Création d’applications EMR sans serveur depuis Studio.
Vous pouvez connecter une application EMR sans serveur à un nouveau bloc-notes JupyterLab directement depuis l’interface utilisateur de Studio, ou choisir d’établir la connexion dans un bloc-notes d’une application JupyterLab en cours d’exécution.
Important
Lorsque vous utilisez Studio, vous pouvez uniquement découvrir les applications EMR sans serveur et vous y connecter pour les applications JupyterLab lancées depuis des espaces privés. Assurez-vous que les applications EMR sans serveur sont situées dans la même région AWS que votre environnement Studio. Votre espace JupyterLab doit utiliser une image de distribution SageMaker version 1.10 ou supérieure.
Pour connecter une application EMR sans serveur à un nouveau bloc-notes JupyterLab depuis l’interface utilisateur de Studio :
-
Dans l’interface utilisateur de Studio, accédez au panneau de gauche et sélectionnez le nœud Données dans le menu de navigation de gauche. Ensuite, faites défiler la page et choisissez l’option Applications et clusters Amazon EMR. Cela ouvre une page qui affiche les applications Amazon EMR auxquelles vous pouvez accéder depuis l’environnement Studio, sous l’onglet Applications sans serveur.
Note
Si vous ou votre administrateur avez configuré les autorisations pour autoriser l’accès intercompte aux applications EMR sans serveur, vous pouvez visualiser une liste consolidée des applications pour tous les comptes auxquels vous avez accordé l’accès à Studio.
-
Sélectionnez une application EMR sans serveur que vous souhaitez connecter à un nouveau bloc-notes, puis choisissez Attacher à un bloc-notes. Cela ouvre une fenêtre modale affichant la liste de vos espaces JupyterLab.
-
-
Sélectionnez l’espace privé à partir duquel vous souhaitez lancer une application JupyterLab, puis choisissez Ouvrir le bloc-notes. Cela lance une application JupyterLab depuis l’espace que vous avez choisi et ouvre un nouveau bloc-notes.
-
Vous pouvez également créer un nouvel espace privé en choisissant le bouton Créer un nouvel espace en haut de la fenêtre modale. Entrez un nom pour votre espace, puis choisissez Créer l’espace et ouvrir le bloc-notes. Cela crée un espace privé avec le type d’instance par défaut et la dernière image de distribution SageMaker disponible, lance une application JupyterLab et ouvre un nouveau bloc-notes.
-
-
Choisissez le nom du rôle d’exécution IAM à l’exécution que votre application EMR sans serveur peut assumer pour l’exécution de la tâche. Après cette sélection, une commande de connexion remplit la première cellule de votre bloc-notes et initie la connexion avec l’application EMR sans serveur.
Important
Pour connecter correctement un bloc-notes JupyterLab à une application EMR sans serveur, vous devez d’abord associer la liste des rôles d’exécution à votre domaine ou à votre profil utilisateur, comme indiqué dans Configurez les autorisations pour activer l’établissement d’une liste et le lancement des applications Amazon EMR à partir de SageMaker Studio. Si vous n’effectuez pas cette étape, vous ne pourrez pas établir la connexion.
Une fois la connexion établie, un message confirme la connexion, démarre votre application EMR sans serveur et lance votre session Spark.
Note
Lorsque vous vous connectez à une application EMR sans serveur, son statut passe de
StoppedouCreatedàStarted.
Vous pouvez également vous connecter à un cluster depuis un bloc-notes JupyterLab.
-
Choisissez le bouton Cluster en haut à droite de votre bloc-notes. Cela ouvre une fenêtre modale répertoriant les applications EMR sans serveur auxquelles vous pouvez accéder. Vous pouvez voir les applications dans l’onglet Applications sans serveur.
-
Sélectionnez l’application à laquelle vous souhaitez vous connecter, puis choisissez Connecter.
-
EMR sans serveur prend en charge les rôles IAM d’exécution qui ont été préchargés lors de la définition des autorisations requises, comme indiqué dans Configurez les autorisations pour activer l’établissement d’une liste et le lancement des applications Amazon EMR à partir de SageMaker Studio. Si vous n’effectuez pas cette étape, vous ne pourrez pas établir la connexion.
Vous pouvez sélectionner votre rôle dans le menu déroulant du rôle d’exécution Amazon EMR. Lorsque vous vous connectez à EMR sans serveur, Studio ajoute un bloc de code à une cellule active de votre bloc-notes pour établir la connexion.
-
Une cellule active se remplit et s’exécute. Cette cellule contient la commande magique de connexion permettant de connecter votre bloc-notes à votre application.
Une fois la connexion établie, un message confirme la connexion et le démarrage de l’application Spark. Vous pouvez commencer à soumettre vos tâches de traitement des données à votre application EMR sans serveur.