Sesiones de usuario en segundo plano para AWS Glue ETL
Las sesiones de usuario en segundo plano permiten que las cargas de trabajo de análisis y machine learning de larga duración continúen incluso después de que el usuario haya cerrado sesión en la interfaz de su cuaderno. Esta capacidad se implementa a través de la característica de propagación de identidad de confianza de AWS Glue. En la siguiente página se explican las opciones de configuración y los comportamientos de las sesiones de usuario en segundo plano.
nota
Las sesiones de usuario en segundo plano se aplican a las sesiones interactivas de AWS Glue iniciadas a través de interfaces de cuadernos como Sagemaker Unified Studio. La habilitación o deshabilitación de esta característica solo afecta a las sesiones interactivas nuevas; las sesiones activas existentes no se ven afectadas.
Configuración de sesiones de usuario en segundo plano
Las sesiones de usuario en segundo plano deben estar habilitadas en dos niveles para que funcionen correctamente:
Nivel de instancia de IAM Identity Center (configurado por los administradores de IdC)
Nivel de configuración del centro de identidades de AWS Glue (configurado por los administradores de AWS Glue)
Habilitación de sesiones de usuario en segundo plano para AWS Glue
Para habilitar las sesiones de usuario en segundo plano para AWS Glue, debe establecer el parámetro userBackgroundSessionsEnabled en true en la configuración del centro de identidades al crear o actualizar la configuración.
Requisitos previos
El rol de IAM que se utiliza para crear o actualizar la configuración del centro de identidades de AWS Glue debe tener el permiso
sso:PutApplicationSessionConfiguration. Este permiso permite a AWS Glue habilitar las sesiones en segundo plano de los usuarios en el nivel de la aplicación de IdC administrada por AWS Glue.Sus sesiones interactivas de AWS Glue deben usar AWS Glue versión 5.0 o posteriores y deben tener habilitada la función Propagación de identidad de confianza.
Para habilitar las sesiones en segundo plano de los usuarios mediante AWS CLI:
aws glue create-glue-identity-center-configuration \ --instance-arn "arn:aws:sso:::instance/ssoins-1234567890abcdef" \ --user-background-sessions-enabled
Para actualizar una configuración existente:
aws glue update-glue-identity-center-configuration \ --user-background-sessions-enabled
Matriz de configuración
La configuración efectiva de la sesión en segundo plano de los usuarios depende tanto del ajuste de configuración AWS Glue como de los ajustes a nivel de instancia de IAM Identity Center:
| ¿userBackgroundSession de IAM Identity Center habilitado? | userBackgroundSessionsEnabled de AWS Glue | Comportamiento |
|---|---|---|
| Sí | TRUE | Sesiones de usuario en segundo plano habilitadas |
| Sí | FALSO | La sesión caduca al cerrar sesión del usuario |
| No | TRUE | La creación de la sesión falla con una excepción |
| No | FALSO | La sesión caduca al cerrar sesión del usuario |
Duración predeterminada de la sesión de usuario en segundo plano
De forma predeterminada, todas las sesiones de usuario en segundo plano tienen un límite de duración de 7 días en IAM Identity Center. Los administradores pueden modificar esta duración en la consola de IAM Identity Center. Esta configuración se aplica a la instancia de IAM Identity Center y afecta a todas las aplicaciones de IAM Identity Center dentro de dicha instancia.
La duración se puede establecer en cualquier valor, desde 15 minutos hasta 90 días
Este ajuste se configura en la consola de IAM Identity Center, en Configuración → Autenticación → Configurar (sección Trabajos no interactivos)
nota
De forma predeterminada, las sesiones interactivas de AWS Glue tienen un límite de tiempo de espera de inactividad independiente de 48 horas. Las sesiones finalizarán cuando se agote el tiempo de inactividad de la sesión de AWS Glue o se alcance la duración de la sesión en segundo plano del usuario, lo que ocurra primero.
Impacto de la deshabilitación de las sesiones en segundo plano de los usuarios
Cuando las sesiones en segundo plano de los usuarios están deshabilitadas en el nivel de configuración de AWS Glue:
Sesiones interactivas existentes: continúan ejecutándose sin interrupciones si se iniciaron con las sesiones en segundo plano de usuarios habilitadas. Estas sesiones seguirán utilizando sus identificadores de sesión en segundo plano hasta que finalicen de forma natural o se detengan explícitamente.
Nuevas sesiones interactivas: utilizarán el flujo de propagación de identidad de confianza estándar y finalizarán cuando el usuario cierre la sesión o caduque su sesión interactiva (por ejemplo, al cerrar un cuaderno de JupyterLab de Sagemaker Unified Studio).
Cambio de la duración de las sesiones en segundo plano de los usuarios
Cuando se modifica la configuración de duración de las sesiones en segundo plano de los usuarios en IAM Identity Center:
Sesiones interactivas existentes: continúan ejecutándose con la misma duración de sesión en segundo plano con la que se iniciaron
Nuevas sesiones interactivas: usarán la nueva duración de la sesión para las sesiones en segundo plano
Consideraciones sobre el tiempo de ejecución
Condiciones de finalización de la sesión
Cuando se utilizan sesiones de usuario en segundo plano, una sesión interactiva de AWS Glue seguirá ejecutándose hasta que se produzca una de las siguientes situaciones:
La sesión en segundo plano de los usuarios caduque (según la configuración de IdC, hasta 90 días)
Un administrador revoque manualmente la sesión en segundo plano de los usuarios
La sesión interactiva de AWS Glue alcanza su tiempo de espera de inactividad (predeterminado: 48 horas después de la última instrucción ejecutada)
El usuario detiene o reinicia el núcleo del cuaderno de forma explícita
Persistencia de datos
Cuando se utilizan sesiones de usuario en segundo plano:
Los usuarios no pueden volver a conectarse a la interfaz de su cuaderno para ver los resultados una vez que han cerrado sesión
Configure sus instrucciones de Spark para escribir los resultados en un almacenamiento persistente (como Amazon S3) antes de que se complete la ejecución
Consecuencias de los costos
Los trabajos seguirán ejecutándose hasta completarse incluso después de que los usuarios finalicen su sesión de Sagemaker Unified Studio y JupyterLab y se les cobrará por la duración de toda la ejecución.
Supervise sus sesiones en segundo plano activas para evitar costos innecesarios derivados de sesiones olvidadas o abandonadas
Disponibilidad de características
Las sesiones en segundo plano de los usuarios de AWS Glue están disponibles para:
Solo sesiones interactivas de AWS Glue (no se admiten trabajos de AWS Glue ni trabajos de transmisión)
AWS Glue versión 5.0 y posteriores
Solo configuraciones con la propagación de identidad de confianza habilitada