Sessioni utente in background per AWS Glue ETL - AWS Glue

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Sessioni utente in background per AWS Glue ETL

Le sessioni utente in background consentono ai carichi di lavoro di analisi e machine learning di lunga durata di continuare anche dopo che l'utente si è disconnesso dall'interfaccia del notebook. Questa funzionalità è implementata tramite la funzionalità affidabile AWS Glue di propagazione delle identità. La pagina seguente spiega le opzioni e i comportamenti di configurazione per le sessioni in background degli utenti.

Nota

Le sessioni utente in background si applicano alle sessioni AWS Glue interattive avviate tramite interfacce di notebook come SageMaker Unified Studio. L'attivazione o la disabilitazione di questa funzionalità ha effetto solo sulle nuove sessioni interattive; le sessioni attive esistenti non ne risentono.

Configura le sessioni utente in background

Le sessioni utente in background devono essere abilitate a due livelli per una corretta funzionalità:

  1. Livello di istanza IAM Identity Center (configurato dagli amministratori iDC)

  2. AWS Glue Livello di configurazione di Identity Center (configurato dagli amministratori AWS Glue )

Abilita le sessioni utente in background per AWS Glue

Per abilitare le sessioni utente in background per AWS Glue, è necessario impostare il userBackgroundSessionsEnabled parametro su true nella configurazione di Identity Center durante la creazione o l'aggiornamento della configurazione.

Prerequisiti

  • Il ruolo IAM utilizzato per create/update la configurazione di AWS Glue Identity Center deve disporre dell'sso:PutApplicationSessionConfigurationautorizzazione. Questa autorizzazione consente di AWS Glue abilitare le sessioni utente in background a livello AWS Glue di applicazione iDC gestita.

  • Le sessioni AWS Glue interattive devono utilizzare la AWS Glue versione 5.0 o successiva e devono essere abilitate la Trusted Identity Propagation.

Per abilitare le sessioni utente in background utilizzando: AWS CLI

aws glue create-glue-identity-center-configuration \ --instance-arn "arn:aws:sso:::instance/ssoins-1234567890abcdef" \ --user-background-sessions-enabled

Per aggiornare una configurazione esistente:

aws glue update-glue-identity-center-configuration \ --user-background-sessions-enabled

Matrice di configurazione

L'effettiva configurazione della sessione utente in background dipende sia dall'impostazione di AWS Glue configurazione che dalle impostazioni a livello di istanza di IAM Identity Center:

IAM Identity Center è abilitato? userBackgroundSession AWS Glue userBackgroundSessionsAbilitato Comportamento
TRUE Sessioni utente in background abilitate
FALSE La sessione scade con il logout dell'utente
No TRUE La creazione della sessione fallisce con Exception
No FALSE La sessione scade con il logout dell'utente

Durata predefinita della sessione in background dell’utente

Per impostazione predefinita, tutte le sessioni utente in background hanno un limite di durata di 7 giorni in IAM Identity Center. Gli amministratori possono modificare questa durata nella console del Centro identità IAM. Questa impostazione si applica a livello di istanza IAM Identity Center e interessa tutte le applicazioni IAM Identity Center supportate all'interno di quell'istanza.

  • La durata può essere impostata su qualsiasi valore, da 15 minuti a 90 giorni

  • Questa impostazione è configurata nella console IAM Identity Center in Impostazioni → Autenticazione → Configura (sezione Lavori non interattivi)

Nota

AWS Glue per impostazione predefinita, le sessioni interattive hanno un limite di timeout di inattività separato di 48 ore. Le sessioni termineranno quando viene raggiunto il timeout di inattività della AWS Glue sessione o la durata della sessione in background dell'utente, a seconda dell'evento che si verifica per primo.

Impatto della disabilitazione delle sessioni utente in background

Quando le sessioni utente in background sono disabilitate a livello di AWS Glue configurazione:

  • Sessioni interattive esistenti: continuano a funzionare senza interruzioni se sono state avviate con le sessioni utente in background abilitate. Queste sessioni continueranno a utilizzare i token di sessione in background esistenti fino a quando non termineranno naturalmente o non verranno interrotte esplicitamente.

  • Nuove sessioni interattive: utilizzeranno il flusso standard di propagazione delle identità affidabili e termineranno quando l'utente si disconnette o scade la sessione interattiva (ad esempio quando chiude un notebook Unified Studio). SageMaker JupyterLab

Modifica della durata delle sessioni utente in background

Quando l'impostazione della durata per le sessioni utente in background viene modificata in IAM Identity Center:

  • Sessioni interattive esistenti: continua a funzionare con la stessa durata della sessione in background con cui sono state avviate

  • Nuove sessioni interattive: utilizzerà la nuova durata della sessione per le sessioni in background

Considerazioni sul runtime

Condizioni di terminazione della sessione

Quando si utilizzano sessioni utente in background, una sessione AWS Glue interattiva continuerà a funzionare fino a quando non si verifica una delle seguenti condizioni:

  • La sessione utente in background scade (in base alla configurazione iDC, fino a 90 giorni)

  • La sessione in background dell’utente viene revocata manualmente da un amministratore.

  • La sessione AWS Glue interattiva raggiunge il timeout di inattività (impostazione predefinita: 48 ore dopo l'ultima istruzione eseguita)

  • L'utente arresta o riavvia in modo esplicito il kernel del notebook

Persistenza dei dati

Quando si utilizzano sessioni utente in background:

  • Gli utenti non possono riconnettersi all'interfaccia del notebook per visualizzare i risultati dopo essersi disconnessi

  • Configura le istruzioni Spark per scrivere i risultati sullo storage persistente (come Amazon S3) prima del completamento dell'esecuzione

Implicazioni sui costi

  • I lavori continueranno a essere eseguiti fino al completamento anche dopo che gli utenti avranno terminato la JupyterLab sessione di SageMaker Unified Studio e verranno addebitati costi per l'intera durata dell'esecuzione completata

  • Monitora le sessioni attive in background per evitare costi inutili derivanti da sessioni dimenticate o abbandonate

Disponibilità delle funzionalità

Le sessioni utente in background AWS Glue sono disponibili per:

  • AWS Glue solo sessioni interattive (i AWS Glue lavori e i lavori di streaming non sono supportati)

  • AWS Glue versione 5.0 e successive

  • Solo configurazioni abilitate per Trusted Identity Propagation