Connessione a un’applicazione EMR Serverless da Studio - Amazon SageMaker AI

Connessione a un’applicazione EMR Serverless da Studio

I Data Scientist e gli ingegneri dei dati possono rilevare e quindi connettersi a un’applicazione EMR Serverless direttamente dall’interfaccia utente di Studio. Prima di iniziare, verifica di aver creato un’applicazione EMR Serverless con le istruzioni in Creazione di applicazioni EMR Serverless da Studio.

Puoi collegare un’applicazione EMR Serverless a un nuovo notebook JupyterLab direttamente dall’interfaccia utente di Studio o scegliere di avviare la connessione in un notebook di un’applicazione JupyterLab in esecuzione.

Importante

Quando si utilizza Studio, è possibile rilevare e connettersi solo alle applicazioni EMR Serverless per le applicazioni JupyterLab che vengono avviate da spazi privati. Assicurati che le applicazioni EMR Serverless si trovino nella stessa Regione AWS del tuo ambiente Studio. Lo spazio JupyterLab deve utilizzare un’immagine di SageMaker Distribution versione 1.10 o superiore.

Per connettere un’applicazione EMR Serverless a un nuovo notebook JupyterLab dall’interfaccia utente di Studio:
  1. Nell’interfaccia utente di Studio, vai al pannello di sinistra e seleziona il nodo Dati nel menu di navigazione a sinistra. Quindi, scorri e scegli l’opzione Applicazioni e cluster Amazon EMR. Si apre una pagina che mostra le applicazioni Amazon EMR a cui puoi accedere dall’ambiente Studio, nella scheda Applicazioni serverless.

    Nota

    Se tu o il tuo amministratore avete configurato le autorizzazioni per consentire l’accesso multi-account alle applicazioni EMR Serverless, viene visualizzato un elenco consolidato di applicazioni per tutti gli account a cui hai concesso l’accesso a Studio.

  2. Seleziona un’applicazione EMR Serverless da connettere a un nuovo notebook, quindi scegli Collega al notebook. Si apre una finestra modale che mostra l’elenco degli spazi JupyterLab.

    • Seleziona lo spazio privato da cui avviare un’applicazione JupyterLab, quindi scegli Apri notebook. Questa opzione avvia un’applicazione JupyterLab dallo spazio prescelto e apre un nuovo notebook.

    • In alternativa, puoi creare un nuovo spazio privato scegliendo il pulsante Crea nuovo spazio nella parte superiore della finestra modale. Inserisci un nome per lo spazio, quindi scegli Crea spazio e apri notebook. Questo crea uno spazio privato con il tipo di istanza predefinito e l’immagine più recente disponibile di SageMaker Distribution, avvia un’applicazione JupyterLab e apre un nuovo notebook.

  3. Scegli il nome del ruolo di esecuzione di runtime IAM che la tua applicazione EMR Serverless può assumere per l’esecuzione del processo. Dopo averlo selezionato, un comando di connessione compila la prima cella del notebook e avvia la connessione con l’applicazione EMR Serverless.

    Importante

    Per connettere correttamente un notebook JupyterLab a un’applicazione EMR Serverless, devi prima associare l’elenco dei ruoli di runtime al tuo dominio o profilo utente, come indicato in Configurazione delle autorizzazioni per abilitare la visualizzazione e l’avvio di applicazioni Amazon EMR da SageMaker Studio. Se non completi questa fase, non verrà stabilita la connessione.

    Una volta stabilita la connessione, viene visualizzato un messaggio di conferma e vengono avviate l’applicazione EMR Serverless e la sessione Spark.

    Nota

    Quando ti connetti a un’applicazione EMR Serverless, il suo stato passa da Stopped o Created a Started.

In alternativa, puoi connetterti a un cluster da un notebook JupyterLab.
  1. Scegli il pulsante Cluster nella parte superiore a destra del notebook. Si apre una finestra modale che elenca le applicazioni EMR Serverless a cui puoi accedere. Puoi visualizzare le applicazioni nella scheda Applicazioni serverless.

  2. Seleziona l’applicazione a cui connetterti, quindi scegli Connetti.

  3. EMR Serverless supporta i ruoli IAM di runtime precaricati durante l’impostazione delle autorizzazioni richieste, come indicato in Configurazione delle autorizzazioni per abilitare la visualizzazione e l’avvio di applicazioni Amazon EMR da SageMaker Studio. Se non completi questa fase, non verrà stabilita la connessione.

    Puoi selezionare il tuo ruolo dal menu a discesa Ruolo di esecuzione di Amazon EMR. Quando ti connetti a EMR Serverless, Studio aggiunge un blocco di codice a una cella attiva del notebook per stabilire la connessione.

  4. Una cella attiva viene popolata ed eseguita. Questa cella contiene il comando magic della connessione per collegare il notebook all’applicazione.

    Una volta completata la connessione, un messaggio conferma la connessione e l'avvio dell'applicazione Spark. È possibile iniziare a inviare i processi di elaborazione dati all’applicazione EMR Serverless.