Opzioni disponibili

La tabella seguente mostra tutte le opzioni disponibili che è possibile utilizzare per personalizzare il lavoro del notebook, indipendentemente dal fatto che si esegua Notebook Job in Studio, in un ambiente Jupyter locale o utilizzando l'SDK Python SageMaker . La tabella include il tipo di opzione personalizzata, una descrizione, linee guida aggiuntive su come utilizzare l'opzione, un nome di campo per l'opzione in Studio (se disponibile) e il nome del parametro per la fase di lavoro del notebook in SageMaker Python SDK (se disponibile).

Per alcune opzioni, puoi anche preimpostare valori predefiniti personalizzati in modo da non doverli specificare ogni volta che configuri un processo del notebook. Per Studio, queste opzioni sono Ruolo, Cartella di input, Cartella di output e ID chiave KMS e sono specificate nella tabella seguente. Se preimposti valori predefiniti personalizzati per queste opzioni, questi campi vengono precompilati nel modulo Crea processo quando crei il processo del notebook. Per informazioni dettagliate su come creare impostazioni predefinite personalizzate in ambienti Studio e Jupyter locali, consulta Configurazione delle opzioni predefinite per i notebook locali.

L' SageMaker SDK offre anche la possibilità di impostare impostazioni predefinite intelligenti in modo da non dover specificare questi parametri quando si crea un. NotebookJobStep Questi parametri sono role, s3_root_uri, s3_kms_key, volume_kms_key, subnets e security_group_ids e sono specificati nella tabella seguente. Per informazioni su come configurare impostazioni predefinite intelligenti, consulta Configurazione delle opzioni predefinite.

Opzione personalizzata	Description	Linee guida specifiche per Studio	Linee guida per l'ambiente Jupyter locale	SageMaker Linee guida Python SDK
Nome del lavoro	La visualizzazione prevista del nome del processo nella dashboard Processi del notebook.	Campo Nome processo.	Come per Studio.	Parametro `notebook_job_name`. L’impostazione predefinita è `None`.
Immagine	L'immagine del container utilizzata per eseguire il notebook in modo non interattivo sul tipo di elaborazione scelto.	Campo Immagine. L'impostazione predefinita di questo campo è l'immagine corrente del notebook. Se necessario, modifica questo campo dal valore predefinito a un valore personalizzato. Se Studio non è in grado di dedurre questo valore, nel modulo viene visualizzato un errore di convalida che richiede di specificarlo. Questa immagine può essere un'bring-your-own immagine personalizzata o un' SageMaker immagine Amazon disponibile. Per un elenco delle SageMaker immagini disponibili supportate dal notebook scheduler, consultaSageMaker Immagini Amazon disponibili per l'uso con i notebook Studio Classic.	Campo Immagine. Questo campo richiede un URI ECR di un'immagine Docker in grado di eseguire il notebook fornito sul tipo di elaborazione selezionato. Per impostazione predefinita, l'estensione scheduler utilizza un'immagine SageMaker AI Docker basata su Python 2.0 predefinita. Questa è l'immagine ufficiale di Python 3.8 DockerHub con boto3 AWS CLI e il kernel Python 3. Puoi anche fornire qualsiasi URI ECR che soddisfi le specifiche dell'immagine personalizzata del notebook. Per informazioni dettagliate, vedi Specifiche di SageMaker immagine personalizzate per Amazon SageMaker Studio Classic. Questa immagine dovrebbe contenere tutti i kernel e le librerie necessari per l'esecuzione del notebook.	Campo obbligatorio. Parametro `image_uri`. Posizione URI di un’immagine Docker su ECR. È possibile utilizzare immagini di SageMaker distribuzione specifiche o immagini personalizzate basate su tali immagini, oppure un'immagine personalizzata preinstallata con le dipendenze dei job del notebook che soddisfino requisiti aggiuntivi. Per informazioni dettagliate, vedi Vincoli di immagine per i lavori su notebook AI SageMaker Python SDK.
Tipo di istanza	Il tipo di istanza EC2 da utilizzare per eseguire il processo del notebook. Il job notebook utilizza un SageMaker Training Job come livello di elaborazione, quindi il tipo di istanza specificato deve essere un tipo di istanza supportato da SageMaker Training.	Campo Tipo di calcolo. L’impostazione predefinita è `ml.m5.large`.	Come per Studio.	Parametro `instance_type`. L’impostazione predefinita è `ml.m5.large`.
Kernel	Il kernel Jupyter utilizzato per eseguire il processo relativo al notebook.	Campo Kernel. L'impostazione predefinita di questo campo è il kernel corrente del notebook. Se necessario, modifica questo campo dal valore predefinito a un valore personalizzato. Se Studio non è in grado di dedurre questo valore, nel modulo viene visualizzato un errore di convalida che richiede di specificarlo.	Campo Kernel. Questo kernel dovrebbe essere presente nell'immagine e seguire le specifiche del kernel Jupyter. Il valore predefinito di questo campo è il kernel Python3 che si trova nell'immagine base di Python 2.0. SageMaker Se necessario, modifica questo campo a un valore personalizzato.	Campo obbligatorio. Parametro `kernel_name`. Questo kernel dovrebbe essere presente nell'immagine e seguire le specifiche del kernel Jupyter. Per vedere gli identificatori del kernel per la tua immagine, consulta (LINK).
SageMaker Sessione AI	La sessione SageMaker AI sottostante a cui vengono delegate le chiamate di servizio SageMaker AI.	N/D	N/D	Parametro `sagemaker_session`. Se non specificato, ne viene creato uno con una catena di configurazione predefinita.
ARN del ruolo	Il nome della risorsa Amazon (ARN) del ruolo utilizzato con il processo relativo al notebook.	Campo ARN ruolo. Il valore predefinito di questo campo è il ruolo di esecuzione di Studio. Se necessario, modifica questo campo a un valore personalizzato. Nota Se Studio non è in grado di dedurre questo valore, il campo ARN del ruolo è vuoto. In questo caso, inserisci l'ARN che desideri utilizzare.	Campo ARN ruolo. Il valore predefinito di questo campo è qualsiasi ruolo preceduto da `SagemakerJupyterScheduler`. Se hai più ruoli con il prefisso, l'estensione ne sceglie uno. Se necessario, modifica questo campo a un valore personalizzato. Per questo campo, puoi impostare i tuoi valori predefiniti utente che vengono precompilati ogni volta che crei una nuova definizione di processo. Per informazioni dettagliate, vedi Configurazione delle opzioni predefinite per i notebook locali.	Parametro `role`. Il valore predefinito è il ruolo IAM predefinito di SageMaker AI se l'SDK è in esecuzione su notebook o SageMaker notebook da studio. SageMaker In caso contrario, restituisce `ValueError`. Consente impostazioni predefinite intelligenti.
Notebook di input	Il nome del notebook che stai pianificando per l’esecuzione.	Campo obbligatorio. Campo File di input.	Come per Studio.	Required.Parameter `input_notebook`.
Cartella di input	La cartella che contiene i tuoi input. Gli input di processo, incluso il notebook di input e gli eventuali script di avvio o inizializzazione opzionali, vengono inseriti in questa cartella.	Campo Cartella di input. Se non fornisci una cartella, il pianificatore crea un bucket Amazon S3 predefinito per i tuoi input.	Come per Studio. Per questo campo, puoi impostare i tuoi valori predefiniti utente che vengono precompilati ogni volta che crei una nuova definizione di processo. Per informazioni dettagliate, vedi Configurazione delle opzioni predefinite per i notebook locali.	N/D. La cartella di input viene inserita nella posizione specificata dal parametro `s3_root_uri`.
Cartella di output	La cartella che contiene i tuoi output. Gli output di processo, inclusi il notebook di output e i log, vengono inseriti in questa cartella.	Campo Cartella di output. Se non specifichi una cartella, il pianificatore crea un bucket Amazon S3 predefinito per i tuoi output.	Come per Studio. Per questo campo, puoi impostare i tuoi valori predefiniti utente che vengono precompilati ogni volta che crei una nuova definizione di processo. Per informazioni dettagliate, vedi Configurazione delle opzioni predefinite per i notebook locali.	N/D. La cartella di output viene inserita nella posizione specificata dal parametro `s3_root_uri`.
Parameters	Un dizionario di variabili e valori da passare al tuo processo del notebook.	Campo Parametri. È necessario definire i parametri del notebook per accettare i parametri.	Come per Studio.	Parametro `parameters`. È necessario definire i parametri del notebook per accettare i parametri.
Dipendenze aggiuntive (file o cartella)	L’elenco delle dipendenze di file o cartelle caricato dal processo del notebook nella cartella di staging s3.	Non supportato.	Non supportato.	Parametro `additional_dependencies`. Il processo del notebook carica queste dipendenze in una cartella di staging S3 in modo che possano essere utilizzate durante l’esecuzione.
URI root S3	La cartella che contiene i tuoi input. Gli input di processo, incluso il notebook di input e gli eventuali script di avvio o inizializzazione opzionali, vengono inseriti in questa cartella. Questo bucket S3 deve trovarsi nello stesso Account AWS utilizzato per eseguire il processo del notebook.	N/D. Utilizza Cartella di input e Cartella di output.	Come per Studio.	Parametro `s3_root_uri`. Il valore predefinito è un bucket S3 predefinito. Consente impostazioni predefinite intelligenti.
Variabili di ambiente	Qualsiasi variabile di ambiente esistente che desideri sostituire o nuove variabili di ambiente che desideri introdurre e utilizzare nel tuo notebook.	Campo Variabili di ambiente.	Come per Studio.	Parametro `environment_variables`. L’impostazione predefinita è `None`.
Tag	Un elenco di tag collegati al processo.	N/D	N/D	Parametro `tags`. L’impostazione predefinita è `None`. I tag controllano il modo in cui l’interfaccia utente di Studio acquisisce e visualizza il processo creato dalla pipeline. Per informazioni dettagliate, vedi Visualizzazione dei processi del notebook nella dashboard dell’interfaccia utente di Studio.
Script di avvio	Uno script precaricato nel menu di avvio del notebook che è possibile scegliere di eseguire prima di eseguire il notebook.	Campo Script di avvio. Seleziona uno script di configurazione del ciclo di vita (LCC) da eseguire sull'immagine all'avvio. Nota Uno script di avvio viene eseguito in una shell esterna all'ambiente di Studio. Pertanto, questo script non può dipendere dall'archiviazione locale di Studio, dalle variabili di ambiente o dai metadati dell'app (in `/opt/ml/metadata`). Inoltre, se si utilizza uno script di avvio e uno script di inizializzazione, lo script di avvio viene eseguito per primo.	Non supportato.	Non supportato.
Script di inizializzazione	Un percorso verso uno script locale che è possibile eseguire all'avvio del notebook.	Campo Script di inizializzazione. Immettere il percorso del file EFS in cui si trova uno script locale o uno script di configurazione del ciclo di vita (LCC). Se si utilizza uno script di avvio e uno script di inizializzazione, lo script di avvio viene eseguito per primo. Nota Uno script di inizializzazione proviene dalla stessa shell del processo relativo al notebook. Questo non è il caso di uno script di avvio descritto in precedenza. Inoltre, se si utilizza uno script di avvio e uno script di inizializzazione, lo script di avvio viene eseguito per primo.	Campo Script di inizializzazione. Immettere il percorso del file locale in cui si trova uno script locale o uno script di configurazione del ciclo di vita (LCC).	Parametro `initialization_script`. L’impostazione predefinita è `None`.
Numero massimo di tentativi	Il numero di volte in cui Studio tenta di rieseguire l'esecuzione di un processo non riuscita.	Campo Numero massimo di nuovi tentativi. L'impostazione predefinita è 2.	Come per Studio.	Parametro `max_retry_attempts`. L'impostazione predefinita è 2.
Tempo di esecuzione massimo (in secondi)	La durata massima, espressa in secondi, di esecuzione di un processo relativo al notebook prima di essere arrestato. Se si configurano sia il Tempo di esecuzione massimo che il Numero massimo di tentativi, il tempo di esecuzione si applica a ogni nuovo tentativo. Se un processo non viene completato entro questo lasso di tempo, il suo stato viene impostato su `Failed`.	Campo Runtime massimo (in secondi). L’impostazione predefinita è `172800 seconds (2 days)`.	Come per Studio.	Parametro `max_runtime_in_seconds`. L’impostazione predefinita è `172800 seconds (2 days)`.
Policy di ripetizione	Un elenco di policy di ripetizione, che regolano le azioni da intraprendere in caso di errore.	Non supportato.	Non supportato.	Parametro `retry_policies`. L’impostazione predefinita è `None`.
Aggiunta di dipendenze `Step` o `StepCollection`	Un elenco di nomi o istanze `Step` o `StepCollection` da cui dipende il processo.	Non supportato.	Non supportato.	Parametro `depends_on`. L’impostazione predefinita è `None`. Utilizzalo per definire le dipendenze esplicite tra le fasi del grafo della pipeline.
Volume size (Dimensione dei volumi)	La dimensione in GB del volume di archiviazione dove archiviare i dati di input e output durante l’addestramento.	Non supportato.	Non supportato.	Parametro `volume_size`. L’impostazione predefinita è 30 GB.
Crittografia del traffico tra container	Un flag che specifica se il traffico tra i container di addestramento è crittografato per il job di addestramento.	N/D. Abilitata per impostazione predefinita.	N/D. Abilitata per impostazione predefinita.	Parametro `encrypt_inter_container_traffic`. L’impostazione predefinita è `True`.
Configurazione della crittografia dei processi	Un indicatore che indica che si desidera crittografare gli output del processo relativo al notebook, il volume dell'istanza del processo o entrambi.	Campo Configura crittografia del processo. Seleziona questa casella per scegliere la crittografia. Se non viene selezionata, gli output del processo vengono crittografati con la chiave KMS predefinita dell'account e il volume dell'istanza del processo non viene crittografato.	Come per Studio.	Non supportato.
Chiave KMS di crittografia di output	Una chiave KMS da utilizzare se si desidera personalizzare la chiave di crittografia utilizzata per gli output del processo relativo al notebook. Questo campo è applicabile solo se è stata selezionata l'opzione Configurazione della crittografia dei processi.	Campo Chiave KMS di crittografia di output Se non specifichi questo campo, gli output del processo relativo al notebook vengono crittografati con SSE-KMS utilizzando la chiave KMS Amazon S3 predefinita. Inoltre, se crei tu stesso il bucket Amazon S3 e utilizzi la crittografia, il metodo di crittografia viene conservato.	Come per Studio. Per questo campo, puoi impostare i tuoi valori predefiniti utente che vengono precompilati ogni volta che crei una nuova definizione di processo. Per informazioni dettagliate, vedi Configurazione delle opzioni predefinite per i notebook locali.	Parametro `s3_kms_key`. L’impostazione predefinita è `None`. Consente impostazioni predefinite intelligenti.
Chiave KMS di crittografia del volume dell'istanza del processo	Una chiave KMS da utilizzare se desideri crittografare il volume dell'istanza del processo. Questo campo è applicabile solo se è stata selezionata l'opzione Configurazione della crittografia dei processi.	Campo Chiave KMS di crittografia del volume dell’istanza del processo.	Campo Chiave KMS di crittografia del volume dell’istanza del processo. Per questo campo, puoi impostare i tuoi valori predefiniti utente che vengono precompilati ogni volta che crei una nuova definizione di processo. Per informazioni dettagliate, vedi Configurazione delle opzioni predefinite per i notebook locali.	Parametro `volume_kms_key`. L’impostazione predefinita è `None`. Consente impostazioni predefinite intelligenti.
Utilizzo di un Cloud privato virtuale per eseguire questo processo (per utenti VPC)	Un indicatore che indica che desideri eseguire questo processo in un cloud privato virtuale (VPC). Per una maggiore sicurezza, si consiglia di utilizzare un VPC privato.	Campo Utilizza un cloud privato virtuale per eseguire questo processo. Seleziona questa casella se desideri utilizzare un VPC. Crea almeno i seguenti endpoint VPC per consentire al tuo notebook job di connettersi privatamente a tali risorse: AWS SageMaker AI: per informazioni su come connettersi all' SageMaker IA tramite un endpoint di interfaccia VPC, consulta. Connettiti all' SageMaker IA all'interno del tuo VPC Amazon S3: per informazioni su come connettersi ad Amazon S3 tramite un endpoint dell'interfaccia VPC, consulta Endpoint gateway per Amazon S3. Amazon EC2: per informazioni su come connettersi ad Amazon EC2 tramite un endpoint dell'interfaccia VPC, consulta Accesso ad Amazon EC2 utilizzando un endpoint VPC dell'interfaccia. Amazon EventBridge: questo endpoint è necessario solo quando si configura un notebook pianificato. Non è necessario quando si avvia un processo on demand. Per informazioni su come connettersi EventBridge tramite un endpoint con interfaccia VPC, consulta Utilizzo di Amazon con endpoint VPC di EventBridge interfaccia. Se scegli di utilizzare un VPC, devi specificare almeno una sottorete privata e almeno un gruppo di sicurezza nelle seguenti opzioni. Se non utilizzi alcuna sottorete privata, devi prendere in considerazione altre opzioni di configurazione. Per i dettagli, consulta Sottoreti VPC pubbliche non supportate in Vincoli e considerazioni.	Come per Studio.	N/D
Sottoreti (per utenti VPC)	Le tue sottoreti. Questo campo deve contenerne almeno una e al massimo cinque e tutte le sottoreti fornite devono essere private. Per i dettagli, consulta Sottoreti VPC pubbliche non supportate in Vincoli e considerazioni.	Campo Sottoreti. Questo campo utilizza per impostazione predefinita le sottoreti associate al dominio Studio, ma è possibile modificare questo campo se necessario.	Campo Sottoreti. Il pianificatore non è in grado di rilevare le tue sottoreti, quindi devi inserire tutte le sottoreti configurate per il tuo VPC.	Parametro `subnets`. L’impostazione predefinita è `None`. Consente impostazioni predefinite intelligenti.
Gruppi di sicurezza (per utenti VPC)	I tuoi gruppi di sicurezza. Questo campo deve contenerne almeno uno e al massimo 15. Per i dettagli, consulta Sottoreti VPC pubbliche non supportate in Vincoli e considerazioni.	Campo Gruppi di sicurezza. Questo campo utilizza per impostazione predefinita i gruppi di sicurezza associati al dominio VPC, ma è possibile modificare questo campo se necessario.	Campo Gruppi di sicurezza. Il pianificatore non è in grado di rilevare i tuoi gruppi di sicurezza, quindi devi inserire tutti i gruppi di sicurezza configurati per il tuo VPC.	Parametro `security_group_ids`. L’impostazione predefinita è `None`. Consente impostazioni predefinite intelligenti.
Nome	Il nome della fase dei processi del notebook.	N/D	N/D	Parametro `name`. Se non specificato, viene derivato dal nome del file del notebook.
Display name (Nome visualizzato)	Il nome del processo così come dovrebbe apparire nell’elenco delle esecuzioni della pipeline.	N/D	N/D	Parametro `display_name`. L’impostazione predefinita è `None`.
Description	Una descrizione del tuo processo.	N/D	N/D	Parametro `description`.

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

Invocazione di un altro notebook nel processo del notebook

Parametrizzare il notebook

Opzioni disponibili

Nota

Nota

Nota