Sesiones de usuario en segundo plano para AWS Glue ETL - AWS Glue

Sesiones de usuario en segundo plano para AWS Glue ETL

Las sesiones de usuario en segundo plano permiten que las cargas de trabajo de análisis y machine learning de larga duración continúen incluso después de que el usuario haya cerrado sesión en la interfaz de su cuaderno. Esta capacidad se implementa a través de la característica de propagación de identidad de confianza de AWS Glue. En la siguiente página se explican las opciones de configuración y los comportamientos de las sesiones de usuario en segundo plano.

nota

Las sesiones de usuario en segundo plano se aplican a las sesiones interactivas de AWS Glue iniciadas a través de interfaces de cuadernos como Sagemaker Unified Studio. La habilitación o deshabilitación de esta característica solo afecta a las sesiones interactivas nuevas; las sesiones activas existentes no se ven afectadas.

Configuración de sesiones de usuario en segundo plano

Las sesiones de usuario en segundo plano deben estar habilitadas en dos niveles para que funcionen correctamente:

  1. Nivel de instancia de IAM Identity Center (configurado por los administradores de IdC)

  2. Nivel de configuración del centro de identidades de AWS Glue (configurado por los administradores de AWS Glue)

Habilitación de sesiones de usuario en segundo plano para AWS Glue

Para habilitar las sesiones de usuario en segundo plano para AWS Glue, debe establecer el parámetro userBackgroundSessionsEnabled en true en la configuración del centro de identidades al crear o actualizar la configuración.

Requisitos previos

  • El rol de IAM que se utiliza para crear o actualizar la configuración del centro de identidades de AWS Glue debe tener el permiso sso:PutApplicationSessionConfiguration. Este permiso permite a AWS Glue habilitar las sesiones en segundo plano de los usuarios en el nivel de la aplicación de IdC administrada por AWS Glue.

  • Sus sesiones interactivas de AWS Glue deben usar AWS Glue versión 5.0 o posteriores y deben tener habilitada la función Propagación de identidad de confianza.

Para habilitar las sesiones en segundo plano de los usuarios mediante AWS CLI:

aws glue create-glue-identity-center-configuration \ --instance-arn "arn:aws:sso:::instance/ssoins-1234567890abcdef" \ --user-background-sessions-enabled

Para actualizar una configuración existente:

aws glue update-glue-identity-center-configuration \ --user-background-sessions-enabled

Matriz de configuración

La configuración efectiva de la sesión en segundo plano de los usuarios depende tanto del ajuste de configuración AWS Glue como de los ajustes a nivel de instancia de IAM Identity Center:

¿userBackgroundSession de IAM Identity Center habilitado? userBackgroundSessionsEnabled de AWS Glue Comportamiento
TRUE Sesiones de usuario en segundo plano habilitadas
FALSO La sesión caduca al cerrar sesión del usuario
No TRUE La creación de la sesión falla con una excepción
No FALSO La sesión caduca al cerrar sesión del usuario

Duración predeterminada de la sesión de usuario en segundo plano

De forma predeterminada, todas las sesiones de usuario en segundo plano tienen un límite de duración de 7 días en IAM Identity Center. Los administradores pueden modificar esta duración en la consola de IAM Identity Center. Esta configuración se aplica a la instancia de IAM Identity Center y afecta a todas las aplicaciones de IAM Identity Center dentro de dicha instancia.

  • La duración se puede establecer en cualquier valor, desde 15 minutos hasta 90 días

  • Este ajuste se configura en la consola de IAM Identity Center, en Configuración → Autenticación → Configurar (sección Trabajos no interactivos)

nota

De forma predeterminada, las sesiones interactivas de AWS Glue tienen un límite de tiempo de espera de inactividad independiente de 48 horas. Las sesiones finalizarán cuando se agote el tiempo de inactividad de la sesión de AWS Glue o se alcance la duración de la sesión en segundo plano del usuario, lo que ocurra primero.

Impacto de la deshabilitación de las sesiones en segundo plano de los usuarios

Cuando las sesiones en segundo plano de los usuarios están deshabilitadas en el nivel de configuración de AWS Glue:

  • Sesiones interactivas existentes: continúan ejecutándose sin interrupciones si se iniciaron con las sesiones en segundo plano de usuarios habilitadas. Estas sesiones seguirán utilizando sus identificadores de sesión en segundo plano hasta que finalicen de forma natural o se detengan explícitamente.

  • Nuevas sesiones interactivas: utilizarán el flujo de propagación de identidad de confianza estándar y finalizarán cuando el usuario cierre la sesión o caduque su sesión interactiva (por ejemplo, al cerrar un cuaderno de JupyterLab de Sagemaker Unified Studio).

Cambio de la duración de las sesiones en segundo plano de los usuarios

Cuando se modifica la configuración de duración de las sesiones en segundo plano de los usuarios en IAM Identity Center:

  • Sesiones interactivas existentes: continúan ejecutándose con la misma duración de sesión en segundo plano con la que se iniciaron

  • Nuevas sesiones interactivas: usarán la nueva duración de la sesión para las sesiones en segundo plano

Consideraciones sobre el tiempo de ejecución

Condiciones de finalización de la sesión

Cuando se utilizan sesiones de usuario en segundo plano, una sesión interactiva de AWS Glue seguirá ejecutándose hasta que se produzca una de las siguientes situaciones:

  • La sesión en segundo plano de los usuarios caduque (según la configuración de IdC, hasta 90 días)

  • Un administrador revoque manualmente la sesión en segundo plano de los usuarios

  • La sesión interactiva de AWS Glue alcanza su tiempo de espera de inactividad (predeterminado: 48 horas después de la última instrucción ejecutada)

  • El usuario detiene o reinicia el núcleo del cuaderno de forma explícita

Persistencia de datos

Cuando se utilizan sesiones de usuario en segundo plano:

  • Los usuarios no pueden volver a conectarse a la interfaz de su cuaderno para ver los resultados una vez que han cerrado sesión

  • Configure sus instrucciones de Spark para escribir los resultados en un almacenamiento persistente (como Amazon S3) antes de que se complete la ejecución

Consecuencias de los costos

  • Los trabajos seguirán ejecutándose hasta completarse incluso después de que los usuarios finalicen su sesión de Sagemaker Unified Studio y JupyterLab y se les cobrará por la duración de toda la ejecución.

  • Supervise sus sesiones en segundo plano activas para evitar costos innecesarios derivados de sesiones olvidadas o abandonadas

Disponibilidad de características

Las sesiones en segundo plano de los usuarios de AWS Glue están disponibles para:

  • Solo sesiones interactivas de AWS Glue (no se admiten trabajos de AWS Glue ni trabajos de transmisión)

  • AWS Glue versión 5.0 y posteriores

  • Solo configuraciones con la propagación de identidad de confianza habilitada