Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Opzioni disponibili
La tabella seguente mostra tutte le opzioni disponibili che è possibile utilizzare per personalizzare il lavoro del notebook, indipendentemente dal fatto che si esegua Notebook Job in Studio, in un ambiente Jupyter locale o utilizzando l'SDK Python SageMaker . La tabella include il tipo di opzione personalizzata, una descrizione, linee guida aggiuntive su come utilizzare l'opzione, un nome di campo per l'opzione in Studio (se disponibile) e il nome del parametro per la fase di lavoro del notebook in SageMaker Python SDK (se disponibile).
Per alcune opzioni, puoi anche preimpostare valori predefiniti personalizzati in modo da non doverli specificare ogni volta che configuri un processo del notebook. Per Studio, queste opzioni sono Ruolo, Cartella di input, Cartella di output e ID chiave KMS e sono specificate nella tabella seguente. Se preimposti valori predefiniti personalizzati per queste opzioni, questi campi vengono precompilati nel modulo Crea processo quando crei il processo del notebook. Per informazioni dettagliate su come creare impostazioni predefinite personalizzate in ambienti Studio e Jupyter locali, consulta Configurazione delle opzioni predefinite per i notebook locali.
L' SageMaker SDK offre anche la possibilità di impostare impostazioni predefinite intelligenti in modo da non dover specificare questi parametri quando si crea un. NotebookJobStep Questi parametri sono role, s3_root_uri, s3_kms_key, volume_kms_key, subnets e security_group_ids e sono specificati nella tabella seguente. Per informazioni su come configurare impostazioni predefinite intelligenti, consulta Configurazione delle opzioni predefinite.
| Opzione personalizzata | Description | Linee guida specifiche per Studio | Linee guida per l'ambiente Jupyter locale | SageMaker Linee guida Python SDK |
|---|---|---|---|---|
| Nome del lavoro | La visualizzazione prevista del nome del processo nella dashboard Processi del notebook. | Campo Nome processo. | Come per Studio. | Parametro notebook_job_name. L’impostazione predefinita è None. |
| Immagine | L'immagine del container utilizzata per eseguire il notebook in modo non interattivo sul tipo di elaborazione scelto. | Campo Immagine. L'impostazione predefinita di questo campo è l'immagine corrente del notebook. Se necessario, modifica questo campo dal valore predefinito a un valore personalizzato. Se Studio non è in grado di dedurre questo valore, nel modulo viene visualizzato un errore di convalida che richiede di specificarlo. Questa immagine può essere un'bring-your-own immagine personalizzata o un' SageMaker immagine Amazon disponibile. Per un elenco delle SageMaker immagini disponibili supportate dal notebook scheduler, consultaSageMaker Immagini Amazon disponibili per l'uso con i notebook Studio Classic. | Campo Immagine. Questo campo richiede un URI ECR di un'immagine Docker in grado di eseguire il notebook fornito sul tipo di elaborazione selezionato. Per impostazione predefinita, l'estensione scheduler utilizza un'immagine SageMaker AI Docker basata su Python 2.0 predefinita. Questa è l'immagine ufficiale di Python 3.8 DockerHub con boto3 AWS CLI e il kernel Python 3. Puoi anche fornire qualsiasi URI ECR che soddisfi le specifiche dell'immagine personalizzata del notebook. Per informazioni dettagliate, vedi Specifiche di SageMaker immagine personalizzate per Amazon SageMaker Studio Classic. Questa immagine dovrebbe contenere tutti i kernel e le librerie necessari per l'esecuzione del notebook. | Campo obbligatorio. Parametro image_uri. Posizione URI di un’immagine Docker su ECR. È possibile utilizzare immagini di SageMaker distribuzione specifiche o immagini personalizzate basate su tali immagini, oppure un'immagine personalizzata preinstallata con le dipendenze dei job del notebook che soddisfino requisiti aggiuntivi. Per informazioni dettagliate, vedi Vincoli di immagine per i lavori su notebook AI SageMaker Python SDK. |
| Tipo di istanza | Il tipo di EC2 istanza da utilizzare per eseguire il processo del notebook. Il job notebook utilizza un SageMaker Training Job come livello di elaborazione, quindi il tipo di istanza specificato deve essere un tipo di istanza supportato da SageMaker Training. | Campo Tipo di calcolo. L’impostazione predefinita è ml.m5.large. |
Come per Studio. | Parametro instance_type. L’impostazione predefinita è ml.m5.large. |
| Kernel | Il kernel Jupyter utilizzato per eseguire il processo relativo al notebook. | Campo Kernel. L'impostazione predefinita di questo campo è il kernel corrente del notebook. Se necessario, modifica questo campo dal valore predefinito a un valore personalizzato. Se Studio non è in grado di dedurre questo valore, nel modulo viene visualizzato un errore di convalida che richiede di specificarlo. | Campo Kernel. Questo kernel dovrebbe essere presente nell'immagine e seguire le specifiche del kernel Jupyter. Il valore predefinito di questo campo è il kernel Python3 che si trova nell'immagine base di Python 2.0. SageMaker Se necessario, modifica questo campo a un valore personalizzato. | Campo obbligatorio. Parametro kernel_name. Questo kernel dovrebbe essere presente nell'immagine e seguire le specifiche del kernel Jupyter. Per vedere gli identificatori del kernel per la tua immagine, consulta (LINK). |
| SageMaker Sessione AI | La sessione SageMaker AI sottostante a cui vengono delegate le chiamate di servizio SageMaker AI. | N/D | N/D | Parametro sagemaker_session. Se non specificato, ne viene creato uno con una catena di configurazione predefinita. |
| ARN del ruolo | Il nome della risorsa Amazon (ARN) del ruolo utilizzato con il processo relativo al notebook. | Campo ARN ruolo. Il valore predefinito di questo campo è il ruolo di esecuzione di Studio. Se necessario, modifica questo campo a un valore personalizzato. NotaSe Studio non è in grado di dedurre questo valore, il campo ARN del ruolo è vuoto. In questo caso, inserisci l'ARN che desideri utilizzare. |
Campo ARN ruolo. Il valore predefinito di questo campo è qualsiasi ruolo preceduto da SagemakerJupyterScheduler. Se hai più ruoli con il prefisso, l'estensione ne sceglie uno. Se necessario, modifica questo campo a un valore personalizzato. Per questo campo, puoi impostare i tuoi valori predefiniti utente che vengono precompilati ogni volta che crei una nuova definizione di processo. Per informazioni dettagliate, vedi Configurazione delle opzioni predefinite per i notebook locali. |
Parametro role. Il valore predefinito è il ruolo IAM predefinito di SageMaker AI se l'SDK è in esecuzione su notebook o SageMaker notebook da studio. SageMaker In caso contrario, restituisce ValueError. Consente impostazioni predefinite intelligenti. |
| Notebook di input | Il nome del notebook che stai pianificando per l’esecuzione. | Campo obbligatorio. Campo File di input. | Come per Studio. | Required.Parameter input_notebook. |
| Cartella di input | La cartella che contiene i tuoi input. Gli input di processo, incluso il notebook di input e gli eventuali script di avvio o inizializzazione opzionali, vengono inseriti in questa cartella. | Campo Cartella di input. Se non fornisci una cartella, il pianificatore crea un bucket Amazon S3 predefinito per i tuoi input. | Come per Studio. Per questo campo, puoi impostare i tuoi valori predefiniti utente che vengono precompilati ogni volta che crei una nuova definizione di processo. Per informazioni dettagliate, vedi Configurazione delle opzioni predefinite per i notebook locali. | N/D. La cartella di input viene inserita nella posizione specificata dal parametro s3_root_uri. |
| Cartella di output | La cartella che contiene i tuoi output. Gli output di processo, inclusi il notebook di output e i log, vengono inseriti in questa cartella. | Campo Cartella di output. Se non specifichi una cartella, il pianificatore crea un bucket Amazon S3 predefinito per i tuoi output. | Come per Studio. Per questo campo, puoi impostare i tuoi valori predefiniti utente che vengono precompilati ogni volta che crei una nuova definizione di processo. Per informazioni dettagliate, vedi Configurazione delle opzioni predefinite per i notebook locali. | N/D. La cartella di output viene inserita nella posizione specificata dal parametro s3_root_uri. |
| Parameters | Un dizionario di variabili e valori da passare al tuo processo del notebook. | Campo Parametri. È necessario definire i parametri del notebook per accettare i parametri. | Come per Studio. | Parametro parameters. È necessario definire i parametri del notebook per accettare i parametri. |
| Dipendenze aggiuntive (file o cartella) | L’elenco delle dipendenze di file o cartelle caricato dal processo del notebook nella cartella di staging s3. | Non supportato. | Non supportato. | Parametro additional_dependencies. Il processo del notebook carica queste dipendenze in una cartella di staging S3 in modo che possano essere utilizzate durante l’esecuzione. |
| URI root S3 | La cartella che contiene i tuoi input. Gli input di processo, incluso il notebook di input e gli eventuali script di avvio o inizializzazione opzionali, vengono inseriti in questa cartella. Questo bucket S3 deve trovarsi nello stesso Account AWS utilizzato per eseguire il processo del notebook. | N/D. Utilizza Cartella di input e Cartella di output. | Come per Studio. | Parametro s3_root_uri. Il valore predefinito è un bucket S3 predefinito. Consente impostazioni predefinite intelligenti. |
| Variabili di ambiente | Qualsiasi variabile di ambiente esistente che desideri sostituire o nuove variabili di ambiente che desideri introdurre e utilizzare nel tuo notebook. | Campo Variabili di ambiente. | Come per Studio. | Parametro environment_variables. L’impostazione predefinita è None. |
| Tag | Un elenco di tag collegati al processo. | N/D | N/D | Parametro tags. L’impostazione predefinita è None. I tag controllano il modo in cui l’interfaccia utente di Studio acquisisce e visualizza il processo creato dalla pipeline. Per informazioni dettagliate, vedi Visualizzazione dei processi del notebook nella dashboard dell’interfaccia utente di Studio. |
| Script di avvio | Uno script precaricato nel menu di avvio del notebook che è possibile scegliere di eseguire prima di eseguire il notebook. | Campo Script di avvio. Seleziona uno script di configurazione del ciclo di vita (LCC) da eseguire sull'immagine all'avvio.NotaUno script di avvio viene eseguito in una shell esterna all'ambiente di Studio. Pertanto, questo script non può dipendere dall'archiviazione locale di Studio, dalle variabili di ambiente o dai metadati dell'app (in |
Non supportato. | Non supportato. |
| Script di inizializzazione | Un percorso verso uno script locale che è possibile eseguire all'avvio del notebook. | Campo Script di inizializzazione. Immettere il percorso del file EFS in cui si trova uno script locale o uno script di configurazione del ciclo di vita (LCC). Se si utilizza uno script di avvio e uno script di inizializzazione, lo script di avvio viene eseguito per primo.NotaUno script di inizializzazione proviene dalla stessa shell del processo relativo al notebook. Questo non è il caso di uno script di avvio descritto in precedenza. Inoltre, se si utilizza uno script di avvio e uno script di inizializzazione, lo script di avvio viene eseguito per primo. |
Campo Script di inizializzazione. Immettere il percorso del file locale in cui si trova uno script locale o uno script di configurazione del ciclo di vita (LCC). | Parametro initialization_script. L’impostazione predefinita è None. |
| Numero massimo di tentativi | Il numero di volte in cui Studio tenta di rieseguire l'esecuzione di un processo non riuscita. | Campo Numero massimo di nuovi tentativi. L'impostazione predefinita è 2. | Come per Studio. | Parametro max_retry_attempts. L'impostazione predefinita è 2. |
| Tempo di esecuzione massimo (in secondi) | La durata massima, espressa in secondi, di esecuzione di un processo relativo al notebook prima di essere arrestato. Se si configurano sia il Tempo di esecuzione massimo che il Numero massimo di tentativi, il tempo di esecuzione si applica a ogni nuovo tentativo. Se un processo non viene completato entro questo lasso di tempo, il suo stato viene impostato su Failed. |
Campo Runtime massimo (in secondi). L’impostazione predefinita è 172800
seconds (2 days). |
Come per Studio. | Parametro max_runtime_in_seconds. L’impostazione predefinita è 172800 seconds
(2 days). |
| Policy di ripetizione | Un elenco di policy di ripetizione, che regolano le azioni da intraprendere in caso di errore. | Non supportato. | Non supportato. | Parametro retry_policies. L’impostazione predefinita è None. |
Aggiunta di dipendenze Step o StepCollection |
Un elenco di nomi o istanze Step o StepCollection da cui dipende il processo. |
Non supportato. | Non supportato. | Parametro depends_on. L’impostazione predefinita è None. Utilizzalo per definire le dipendenze esplicite tra le fasi del grafo della pipeline. |
| Volume size (Dimensione dei volumi) | La dimensione in GB del volume di archiviazione dove archiviare i dati di input e output durante l’addestramento. | Non supportato. | Non supportato. | Parametro volume_size. L’impostazione predefinita è 30 GB. |
| Crittografia del traffico tra container | Un flag che specifica se il traffico tra i container di addestramento è crittografato per il job di addestramento. | N/D. Abilitata per impostazione predefinita. | N/D. Abilitata per impostazione predefinita. | Parametro encrypt_inter_container_traffic. L’impostazione predefinita è True. |
| Configurazione della crittografia dei processi | Un indicatore che indica che si desidera crittografare gli output del processo relativo al notebook, il volume dell'istanza del processo o entrambi. | Campo Configura crittografia del processo. Seleziona questa casella per scegliere la crittografia. Se non viene selezionata, gli output del processo vengono crittografati con la chiave KMS predefinita dell'account e il volume dell'istanza del processo non viene crittografato. | Come per Studio. | Non supportato. |
| Chiave KMS di crittografia di output | Una chiave KMS da utilizzare se si desidera personalizzare la chiave di crittografia utilizzata per gli output del processo relativo al notebook. Questo campo è applicabile solo se è stata selezionata l'opzione Configurazione della crittografia dei processi. | Campo Chiave KMS di crittografia di output Se non specifichi questo campo, gli output del processo relativo al notebook vengono crittografati con SSE-KMS utilizzando la chiave KMS Amazon S3 predefinita. Inoltre, se crei tu stesso il bucket Amazon S3 e utilizzi la crittografia, il metodo di crittografia viene conservato. | Come per Studio. Per questo campo, puoi impostare i tuoi valori predefiniti utente che vengono precompilati ogni volta che crei una nuova definizione di processo. Per informazioni dettagliate, vedi Configurazione delle opzioni predefinite per i notebook locali. | Parametro s3_kms_key. L’impostazione predefinita è None. Consente impostazioni predefinite intelligenti. |
| Chiave KMS di crittografia del volume dell'istanza del processo | Una chiave KMS da utilizzare se desideri crittografare il volume dell'istanza del processo. Questo campo è applicabile solo se è stata selezionata l'opzione Configurazione della crittografia dei processi. | Campo Chiave KMS di crittografia del volume dell’istanza del processo. | Campo Chiave KMS di crittografia del volume dell’istanza del processo. Per questo campo, puoi impostare i tuoi valori predefiniti utente che vengono precompilati ogni volta che crei una nuova definizione di processo. Per informazioni dettagliate, vedi Configurazione delle opzioni predefinite per i notebook locali. | Parametro volume_kms_key. L’impostazione predefinita è None. Consente impostazioni predefinite intelligenti. |
| Utilizzo di un Cloud privato virtuale per eseguire questo processo (per utenti VPC) | Un indicatore che indica che desideri eseguire questo processo in un cloud privato virtuale (VPC). Per una maggiore sicurezza, si consiglia di utilizzare un VPC privato. | Campo Utilizza un cloud privato virtuale per eseguire questo processo. Seleziona questa casella se desideri utilizzare un VPC. Crea almeno i seguenti endpoint VPC per consentire al tuo notebook job di connettersi privatamente a tali risorse: AWS
|
Come per Studio. | N/D |
| Sottoreti (per utenti VPC) | Le tue sottoreti. Questo campo deve contenerne almeno una e al massimo cinque e tutte le sottoreti fornite devono essere private. Per i dettagli, consulta Sottoreti VPC pubbliche non supportate in Vincoli e considerazioni. | Campo Sottoreti. Questo campo utilizza per impostazione predefinita le sottoreti associate al dominio Studio, ma è possibile modificare questo campo se necessario. | Campo Sottoreti. Il pianificatore non è in grado di rilevare le tue sottoreti, quindi devi inserire tutte le sottoreti configurate per il tuo VPC. | Parametro subnets. L’impostazione predefinita è None. Consente impostazioni predefinite intelligenti. |
| Gruppi di sicurezza (per utenti VPC) | I tuoi gruppi di sicurezza. Questo campo deve contenerne almeno uno e al massimo 15. Per i dettagli, consulta Sottoreti VPC pubbliche non supportate in Vincoli e considerazioni. | Campo Gruppi di sicurezza. Questo campo utilizza per impostazione predefinita i gruppi di sicurezza associati al dominio VPC, ma è possibile modificare questo campo se necessario. | Campo Gruppi di sicurezza. Il pianificatore non è in grado di rilevare i tuoi gruppi di sicurezza, quindi devi inserire tutti i gruppi di sicurezza configurati per il tuo VPC. | Parametro security_group_ids. L’impostazione predefinita è None. Consente impostazioni predefinite intelligenti. |
| Name | Il nome della fase dei processi del notebook. | N/D | N/D | Parametro name. Se non specificato, viene derivato dal nome del file del notebook. |
| Display name (Nome visualizzato) | Il nome del processo così come dovrebbe apparire nell’elenco delle esecuzioni della pipeline. | N/D | N/D | Parametro display_name. L’impostazione predefinita è None. |
| Description | Una descrizione del tuo processo. | N/D | N/D | Parametro description. |