Sessões em segundo plano do usuário para AWS Glue ETL - AWS Glue

Sessões em segundo plano do usuário para AWS Glue ETL

As sessões em segundo plano do usuário permitem que os workloads de analytics e machine learning de longa duração continuem mesmo depois que o usuário se desconecta da interface do notebook. Esse recurso é implementado por meio do atributo confiável de propagação de identidade do AWS Glue. A página a seguir explica as opções de configuração e os comportamentos das sessões de usuários em segundo plano.

nota

As sessões do usuário em segundo plano se aplicam às sessões interativas AWS Glue iniciadas por meio de interfaces de notebook, como o SageMaker Unified Studio. A ativação ou desativação desse atributo afeta somente as novas sessões interativas; as sessões ativas existentes não são afetadas.

Configurar sessões de usuário em segundo plano

As sessões de usuário em segundo plano devem ser habilitadas em dois níveis para que funcionem adequadamente:

  1. Nível de instância do IAM Identity Center (configurado pelos administradores do iDC)

  2. Nível de configuração do AWS Glue Identity Center (configurado pelos administradores AWS Glue)

Ativar sessões de usuário em segundo plano para AWS Glue

Para ativar sessões de usuário em segundo plano para AWS Glue, você deve definir o parâmetro userBackgroundSessionsEnabled como true na configuração do Identity Center ao criar ou atualizar a configuração.

Pré-requisitos

  • Seu perfil do IAM usado para criar/atualizar a configuração do AWS Glue Identity Center deve ter a permissão sso:PutApplicationSessionConfiguration. Essa permissão permite ao AWS Glue ativar sessões de usuário em segundo plano no nível do aplicativo iDC gerenciado por AWS Glue.

  • Suas sessões interativas AWS Glue devem usar a AWS Glue versão 5.0 ou posterior e devem estar habilitadas para a Propagação de Identidade Confiável.

Para habilitar sessões de usuário em segundo plano usando o AWS CLI:

aws glue create-glue-identity-center-configuration \ --instance-arn "arn:aws:sso:::instance/ssoins-1234567890abcdef" \ --user-background-sessions-enabled

Para atualizar a configuração existente:

aws glue update-glue-identity-center-configuration \ --user-background-sessions-enabled

Matriz de configuração

A configuração efetiva da sessão em segundo plano do usuário depende da definição de configuração AWS Glue e das configurações em nível de instância do Centro de Identidade do IAM:

IAM Identity Center userBackgroundSession Enabled? AWS Glue userBackgroundSessionsEnabled Comportamento
Sim VERDADEIRO Sessões de usuário em segundo plano ativadas
Sim FALSE A sessão expira com o logout do usuário
Não VERDADEIRO A criação da sessão falha com exceção
Não FALSE A sessão expira com o logout do usuário

Duração padrão das sessões de usuários em segundo plano

Por padrão, todas as sessões de usuário em segundo plano têm um limite de duração de 7 dias no Centro de Identidade do IAM. Os administradores podem modificar essa duração no console do Centro de Identidade do IAM. Essa configuração se aplica no nível da instância do Centro de Identidade do IAM, afetando todos os aplicativos do Centro de Identidade do IAM compatíveis nessa instância.

  • A duração pode ser definida para qualquer valor, de 15 minutos a 90 dias.

  • Essa configuração é definida no console do Centro de Identidade do IAM em Configurações → Autenticação → Configurar (seção Trabalhos não interativos)

nota

As sessões interativas AWS Glue têm um limite de tempo limite de inatividade separado de 48 horas por padrão. As sessões serão encerradas quando o tempo limite de inatividade da sessão AWS Glue ou a duração da sessão em segundo plano do usuário forem atingidos, o que ocorrer primeiro.

Impacto de desativar as sessões de usuário em segundo plano

Quando as sessões de usuário em segundo plano são desativadas no nível de configuração AWS Glue:

  • Sessões interativas existentes: continuam a ser executadas sem interrupção se elas tiverem sido iniciadas com as sessões de usuário em segundo plano ativadas. Essas sessões continuarão usando seus tokens de sessão em segundo plano existentes até que terminem naturalmente ou sejam explicitamente interrompidas.

  • Novas sessões interativas: usarão o fluxo padrão de propagação de identidade confiável e serão encerradas quando o usuário se desconectar ou a sessão interativa expirar (como ao fechar um notebook JupyterLab do SageMaker Unified Studio).

Alterando a duração das sessões de usuário em segundo plano

Quando a configuração de duração das sessões de usuário em segundo plano é modificada no Centro de Identidade do IAM:

  • Sessões interativas existentes: continuam a ser executadas com a mesma duração da sessão em segundo plano com a qual foram iniciadas

  • Novas sessões interativas: usarão a nova duração da sessão para sessões em segundo plano

Considerações sobre runtime

Condições de encerramento da sessão

Ao usar sessões de usuário em segundo plano, uma sessão interativa AWS Glue continuará em execução até que uma das seguintes situações ocorra:

  • A sessão em segundo plano do usuário expira (com base na configuração do iDC, em até 90 dias)

  • A sessão de usuário em segundo plano for revogada manualmente por um administrador.

  • A sessão interativa AWS Glue atinge seu tempo limite de inatividade (padrão: 48 horas após a última instrução executada)

  • O usuário interrompe ou reinicia explicitamente o kernel do notebook

Persistência de dados

Ao usar sessões de usuário em segundo plano:

  • Os usuários não podem se reconectar à interface do notebook para visualizar os resultados depois de se desconectarem

  • Configure suas instruções do Spark para gravar os resultados no armazenamento persistente (como o Amazon S3) antes que a execução seja concluída

Implicações de custo

  • Os trabalhos continuarão sendo executados até serem concluídos mesmo depois que os usuários encerrarem a sessão JupyterLab do SageMaker Unified Studio e incorrerão em cobranças por toda a duração da execução concluída.

  • Monitore suas sessões ativas em segundo plano para evitar custos desnecessários de sessões esquecidas ou abandonadas

Disponibilidade de recursos

As sessões de usuário em segundo plano AWS Glue estão disponíveis para:

  • Somente sessões interativas AWS Glue (não compatível com trabalhos AWS Glue e trabalhos de streaming)

  • AWS Glue versão 5.0 e posterior

  • Somente configurações habilitadas para o Trusted Identity Propagation