Conexión desde Studio a una aplicación de EMR sin servidor - Amazon SageMaker AI

Conexión desde Studio a una aplicación de EMR sin servidor

Los científicos e ingenieros de datos pueden detectar una aplicación de EMR sin servidor y, a continuación, conectarse a ella directamente desde la IU de Studio. Antes de comenzar, asegúrese de haber creado una aplicación de EMR sin servidor siguiendo las instrucciones que se indican en Creación de aplicaciones de EMR sin servidor desde Studio.

Puede conectar una aplicación de EMR sin servidor a un nuevo cuaderno de JupyterLab directamente desde la IU de Studio, o bien iniciar la conexión en un cuaderno de una aplicación de JupyterLab en ejecución.

importante

Al usar Studio, solo puede detectar aplicaciones de EMR sin servidor y conectarse a ellas para aplicaciones de JupyterLab que se inicializan desde espacios privados. Asegúrese de que las aplicaciones de EMR sin servidor estén ubicadas en la misma región de AWS que su entorno de Studio. Su espacio de JupyterLab debe utilizar la versión 1.10 o una posterior de la imagen de Distribución de SageMaker.

Para conectar una aplicación de EMR sin servidor a un nuevo cuaderno de JupyterLab desde la IU de Studio:
  1. En la interfaz de usuario de Studio, vaya hasta el panel izquierdo y seleccione el nodo Datos en el menú de navegación de la izquierda. A continuación, desplácese y elija la opción Aplicaciones y clústeres de Amazon EMR. Se abre una página que muestra las aplicaciones de Amazon EMR a las que puede acceder desde el entorno de Studio, en la pestaña Aplicaciones sin servidor.

    nota

    Si usted o su administrador han configurado los permisos para permitir el acceso entre cuentas a las aplicaciones de EMR sin servidor, puede ver una lista consolidada de las aplicaciones de todas las cuentas a las que ha concedido acceso a Studio.

  2. Seleccione una aplicación de EMR sin servidor que desee conectar a un nuevo cuaderno y, a continuación, elija Asociar a cuaderno. Se abrirá una ventana modal en la que se muestra la lista de los espacios de JupyterLab.

    • Seleccione el espacio privado desde el que desea inicializar una aplicación de JupyterLab y, a continuación, elija Abrir cuaderno. Se inicializará una aplicación de JupyterLab desde el espacio elegido y se abrirá un nuevo cuaderno.

    • Como alternativa, puede crear un nuevo espacio privado pulsando el botón Crear nuevo espacio en la parte superior de la ventana modal. Introduzca un nombre para su espacio y, a continuación, seleccione Crear espacio y abrir el cuaderno. De esta manera, se crea un espacio privado con el tipo de instancia predeterminado y la imagen de Distribución de SageMaker más reciente disponible, se inicializa una aplicación de JupyterLab y se abre un nuevo cuaderno.

  3. Elija el nombre del rol de ejecución en tiempo de ejecución de IAM que la aplicación de EMR sin servidor puede asumir para la ejecución del trabajo. Tras la selección, un comando de conexión rellena la primera celda de su cuaderno e inicia la conexión con la aplicación sin servidor de EMR.

    importante

    Para conectar correctamente un cuaderno de JupyterLab a una aplicación de EMR sin servidor, primero debe asociar la lista de roles de ejecución a su dominio o perfil de usuario, tal y como se describe en Configuración de los permisos para habilitar la publicación y la inicialización de aplicaciones de Amazon EMR desde SageMaker Studio. Si no realiza este paso, no podrá establecer la conexión.

    Cuando la conexión se realice correctamente, un mensaje lo confirmará, se iniciará la aplicación de EMR sin servidor y se iniciará la sesión de Spark.

    nota

    Cuando se conecta a una aplicación de EMR sin servidor, su estado pasa de Stopped o Created a Started.

Como alternativa, puede conectarse a un clúster desde un cuaderno de JupyterLab.
  1. Seleccione el botón Clúster en la parte superior del cuaderno. Al hacerlo, se abre una ventana modal con una lista de las aplicaciones de EMR sin servidor a las que puede acceder. Puede ver las aplicaciones en la pestaña Aplicaciones sin servidor.

  2. Seleccione la aplicación a la que desea conectarse y, a continuación, elija Conectar.

  3. EMR sin servidor admite los roles de IAM en tiempo de ejecución que estaban precargados al configurar los permisos necesarios, tal como se describe en Configuración de los permisos para habilitar la publicación y la inicialización de aplicaciones de Amazon EMR desde SageMaker Studio. Si no realiza este paso, no podrá establecer la conexión.

    Puede seleccionar su rol en el menú desplegable Rol de ejecución de Amazon EMR. Cuando se conecta a una aplicación de EMR sin servidor, Studio añade un bloque de código a una celda activa para establecer la conexión.

  4. Se llena y se ejecuta una celda activa. Esta celda contiene el comando mágico de conexión para conectar el cuaderno a la aplicación.

    Cuando la conexión se realice correctamente, un mensaje confirmará la conexión y el inicio de la aplicación Spark. Puede empezar a enviar sus trabajos de procesamiento de datos a su aplicación de EMR sin servidor.