Options disponibles

Le tableau suivant présente toutes les options disponibles que vous pouvez utiliser pour personnaliser votre tâche de bloc-notes, que vous exécutiez votre tâche de bloc-notes dans Studio, dans un environnement Jupyter local ou que vous utilisiez le SDK SageMaker Python. Le tableau inclut le type d'option personnalisée, une description, des instructions supplémentaires sur la façon d'utiliser l'option, un nom de champ pour l'option dans Studio (si disponible) et le nom du paramètre pour l'étape de travail du bloc-notes dans le SDK SageMaker Python (si disponible).

Pour certaines options, vous pouvez également prédéfinir des valeurs par défaut personnalisées afin de ne pas avoir à les spécifier chaque fois que vous configurez une tâche de bloc-notes. Pour Studio, ces options sont Rôle, Dossier d’entrée, Dossier de sortie et ID de clé KMS, et sont spécifiées dans le tableau suivant. Si vous prédéfinissez des valeurs par défaut personnalisées pour ces options, ces champs sont préremplis dans le formulaire Créer une tâche lorsque vous créez votre tâche de bloc-notes. Pour plus de détails sur la création de paramètres par défaut personnalisés dans Studio et les environnements Jupyter locaux, consultez Configurer les options par défaut pour les blocs-notes locaux.

Le SageMaker SDK vous donne également la possibilité de définir des valeurs par défaut intelligentes afin que vous n'ayez pas à spécifier ces paramètres lorsque vous créez un. NotebookJobStep Ces paramètres sont role, s3_root_uri, s3_kms_key, volume_kms_key, subnets et security_group_ids, et ils sont spécifiés dans le tableau suivant. Pour en savoir plus sur la façon de définir des valeurs par défaut intelligentes, consultez Configuration des options par défaut.

Option personnalisée	Description	Directive spécifique à Studio	Directive environnementale locale de Jupyter	SageMaker Directive du SDK Python
Nom du job	Le nom de votre tâche, tel qu’il doit apparaître dans le tableau de bord des tâches de bloc-notes.	Champ Nom de la tâche.	Identique à Studio.	Paramètre `notebook_job_name`. La valeur par défaut est `None` .
Image	Image de conteneur utilisée pour exécuter le bloc-notes de manière non interactive sur le type de calcul choisi.	Champ Image. Ce champ contient par défaut l’image actuelle de votre bloc-notes. Remplacez la valeur par défaut de ce champ par une valeur personnalisée, si nécessaire. Si Studio ne peut pas déduire cette valeur, le formulaire affiche une erreur de validation vous demandant de la spécifier. Il peut s'agir d'une image personnalisée, bring-your-own d'une image ou d'une SageMaker image Amazon disponible. Pour obtenir la liste des SageMaker images disponibles prises en charge par le planificateur de bloc-notes, consultez. Amazon SageMaker Images disponibles pour une utilisation avec les blocs-notes Studio Classic	Champ Image. Ce champ nécessite un URI ECR d’une image Docker capable d’exécuter le bloc-notes fourni sur le type de calcul sélectionné. Par défaut, l'extension du planificateur utilise une image SageMaker AI Docker prédéfinie, basée sur Python 2.0. Il s'agit de l'image officielle de Python 3.8 provenant de DockerHub boto3 et du noyau Python 3. AWS CLI Vous pouvez également fournir un URI ECR quelconque conforme à la spécification d'image personnalisée du bloc-notes. Pour en savoir plus, consultez Spécifications SageMaker d'image personnalisées pour Amazon SageMaker Studio Classic. Cette image doit contenir tous les noyaux et bibliothèques nécessaires à l’exécution du bloc-notes.	Obligatoire. Paramètre `image_uri`. Emplacement URI d’une image Docker sur ECR. Vous pouvez utiliser des images de SageMaker distribution spécifiques ou une image personnalisée basée sur ces images, ou votre propre image préinstallée avec des dépendances entre les tâches du bloc-notes répondant à des exigences supplémentaires. Pour en savoir plus, consultez Contraintes d'image pour les SageMaker tâches de bloc-notes du SDK AI Python.
Type d’instance	Type d’instance EC2 à utiliser pour exécuter la tâche de bloc-notes. La tâche de bloc-notes utilise une tâche d' SageMaker entraînement comme couche informatique. Le type d'instance spécifié doit donc être un type d'instance compatible avec la SageMaker formation.	Champ Type de calcul. La valeur par défaut est `ml.m5.large` .	Identique à Studio.	Paramètre `instance_type`. La valeur par défaut est `ml.m5.large` .
Noyau	Le noyau Jupyter utilisé pour exécuter la tâche du bloc-notes.	Champ Noyau. Ce champ contient par défaut le noyau actuel de votre bloc-notes. Remplacez la valeur par défaut de ce champ par une valeur personnalisée, si nécessaire. Si Studio ne peut pas déduire cette valeur, le formulaire affiche une erreur de validation vous demandant de la spécifier.	Champ Noyau. Ce noyau doit être présent dans l’image et respecter les spécifications du noyau Jupyter. Ce champ correspond par défaut au noyau Python3 présent dans l'image de base de Python 2.0. SageMaker Modifiez ce champ en spécifiant une valeur personnalisée, si nécessaire.	Obligatoire. Paramètre `kernel_name`. Ce noyau doit être présent dans l’image et respecter les spécifications du noyau Jupyter. Pour voir les identifiants du noyau pour votre image, consultez (LIEN).
SageMaker Séance d'IA	La session SageMaker AI sous-jacente à laquelle les appels de service SageMaker AI sont délégués.	N/A	N/A	Paramètre `sagemaker_session`. Si elle n’est pas spécifiée, elle est créée à l’aide d’une chaîne de configuration par défaut.
Role ARN (ARN de rôle)	Amazon Resource Name (ARN) du rôle utilisé avec la tâche de bloc-notes.	Champ ARN du rôle. Ce champ utilise par défaut le rôle d’exécution Studio. Modifiez ce champ en spécifiant une valeur personnalisée, si nécessaire. Note Si Studio ne peut pas déduire cette valeur, le champ ARN du rôle est vide. Dans ce cas, insérez l’ARN que vous souhaitez utiliser.	Champ ARN du rôle. Ce champ contient par défaut n’importe quel rôle préfixé par `SagemakerJupyterScheduler`. Si vous avez plusieurs rôles avec le préfixe, l'extension en choisit un. Modifiez ce champ en spécifiant une valeur personnalisée, si nécessaire. Pour ce champ, vous pouvez définir votre propre valeur par défaut d'utilisateur qui est préremplie chaque fois que vous créez une nouvelle définition de tâche. Pour en savoir plus, consultez Configurer les options par défaut pour les blocs-notes locaux.	Paramètre `role`. Par défaut, le rôle IAM par défaut de l' SageMaker IA est utilisé si le SDK est exécuté dans des ordinateurs portables ou des SageMaker blocs-notes Studio. SageMaker Sinon, il renvoie une erreur `ValueError`. Autorise les valeurs par défaut intelligentes.
Bloc-notes d’entrée	Nom du bloc-notes que vous prévoyez d’exécuter.	Obligatoire. Champ Fichier d’entrée.	Identique à Studio.	Requis. Paramètre `input_notebook`.
Input folder (Dossier d’entrée)	Dossier contenant vos entrées. Les entrées de tâche, y compris le bloc-notes d’entrée et tous les scripts de démarrage ou d’initialisation facultatifs, sont placées dans ce dossier.	Champ Dossier d’entrée. Si vous ne spécifiez pas de dossier, le planificateur crée un compartiment Amazon S3 par défaut pour vos entrées.	Identique à Studio. Pour ce champ, vous pouvez définir votre propre valeur par défaut d'utilisateur qui est préremplie chaque fois que vous créez une nouvelle définition de tâche. Pour en savoir plus, consultez Configurer les options par défaut pour les blocs-notes locaux.	S/O. Le dossier d’entrée est placé dans l’emplacement spécifié par le paramètre `s3_root_uri`.
Output folder (Dossier de sortie)	Le dossier contenant vos sorties. Les sorties de tâche, y compris le bloc-notes de sortie et les journaux, sont placées dans ce dossier.	Champ Dossier de sortie. Si vous ne spécifiez pas de dossier, le planificateur crée un compartiment Amazon S3 par défaut pour vos sorties.	Identique à Studio. Pour ce champ, vous pouvez définir votre propre valeur par défaut d'utilisateur qui est préremplie chaque fois que vous créez une nouvelle définition de tâche. Pour en savoir plus, consultez Configurer les options par défaut pour les blocs-notes locaux.	S/O. Le dossier de sortie est placé dans l’emplacement spécifié par le paramètre `s3_root_uri`.
Parameters	Dictionnaire de variables et de valeurs à transmettre à votre tâche de bloc-notes.	Champ Paramètres. Vous devez paramétrer votre bloc-notes pour accepter les paramètres.	Identique à Studio.	Paramètre `parameters`. Vous devez paramétrer votre bloc-notes pour accepter les paramètres.
Dépendances supplémentaires (fichier ou dossier)	La liste des dépendances de fichiers ou de dossiers que la tâche de bloc-notes charge dans le dossier s3 intermédiaire.	Non pris en charge.	Non pris en charge.	Paramètre `additional_dependencies`. La tâche de bloc-notes charge ces dépendances dans un dossier S3 intermédiaire afin qu’elles puissent être consommées pendant l’exécution.
URI racine S3	Dossier contenant vos entrées. Les entrées de tâche, y compris le bloc-notes d’entrée et tous les scripts de démarrage ou d’initialisation facultatifs, sont placées dans ce dossier. Ce compartiment S3 doit se trouver dans le même Compte AWS que vous utilisez pour exécuter votre tâche de bloc-notes.	S/O. Utilisez le dossier d’entrée et le dossier de sortie.	Identique à Studio.	Paramètre `s3_root_uri`. Par défaut, il s’agit d’un compartiment S3 par défaut. Autorise les valeurs par défaut intelligentes.
Variables d’environnement	Toutes les variables d’environnement existantes que vous souhaitez remplacer ou les nouvelles variables d’environnement que vous souhaitez introduire et utiliser dans votre bloc-notes.	Champ Variables d’environnement.	Identique à Studio.	Paramètre `environment_variables`. La valeur par défaut est `None` .
Étiquettes	Liste des balises attachées à la tâche.	N/A	N/A	Paramètre `tags`. La valeur par défaut est `None` . Vos balises contrôlent la manière dont l’interface utilisateur de Studio capture et affiche la tâche créée par le pipeline. Pour en savoir plus, consultez Visualisation de vos tâches de bloc-notes dans le tableau de bord de l’interface utilisateur de Studio.
Start-up script (Script de démarrage)	Script préchargé dans le menu de démarrage du bloc-notes que vous pouvez choisir d’exécuter avant d’exécuter le bloc-notes.	Champ Script de démarrage. Sélectionnez un script de configuration de cycle de vie (LCC) qui s’exécute sur l’image au démarrage. Note Un script de démarrage s’exécute dans un shell en dehors de l’environnement Studio. Ce script ne peut donc pas dépendre du stockage local de Studio, des variables d'environnement ni des métadonnées de l'application (dans `/opt/ml/metadata`). De même, si vous utilisez un script de démarrage et un script d’initialisation, le script de démarrage s’exécute en premier.	Non pris en charge.	Non pris en charge.
Initialization script (Script d’initialisation)	Chemin d’accès à un script local que vous pouvez exécuter au démarrage de votre bloc-notes.	Champ Script d’initialisation. Entrez le chemin du fichier EFS où se trouve un script local ou un script de configuration de cycle de vie (LCC). Si vous utilisez un script de démarrage et un script d'initialisation, le script de démarrage s'exécute en premier. Note Un script d'initialisation provient du même shell que la tâche de bloc-notes. Ce n’est pas le cas pour un script de démarrage décrit précédemment. De même, si vous utilisez un script de démarrage et un script d’initialisation, le script de démarrage s’exécute en premier.	Champ Script d’initialisation. Entrez le chemin du fichier local où se trouve un script local ou un script de configuration de cycle de vie (LCC).	Paramètre `initialization_script`. La valeur par défaut est `None` .
Nombre maximal de nouvelles tentatives	Nombre de fois où Studio essaie de réexécuter une tâche qui a échoué.	Champ Nombre max. de nouvelles tentatives. La valeur par défaut est 1.	Identique à Studio.	Paramètre `max_retry_attempts`. La valeur par défaut est 1.
Durée d’exécution maximale (en secondes)	Durée maximale, en secondes, pendant laquelle une tâche de bloc-notes peut s'exécuter avant d'être arrêtée. Si vous configurez à la fois la durée d'exécution maximale et le nombre maximal de nouvelles tentatives, la durée d'exécution s'applique à chaque nouvelle tentative. Si une tâche ne se termine pas dans ce délai, son statut est défini sur `Failed`.	Champ Durée d’exécution maximale (en secondes). La valeur par défaut est `172800 seconds (2 days)` .	Identique à Studio.	Paramètre `max_runtime_in_seconds`. La valeur par défaut est `172800 seconds (2 days)` .
Politiques de nouvelles tentatives	Liste des politiques relatives aux nouvelles tentatives, qui régissent les actions à entreprendre en cas d’échec.	Non pris en charge.	Non pris en charge.	Paramètre `retry_policies`. La valeur par défaut est `None` .
Ajout de dépendances `Step` ou `StepCollection`	Liste de noms ou d’instances `Step` ou `StepCollection` dont dépend la tâche.	Non pris en charge.	Non pris en charge.	Paramètre `depends_on`. La valeur par défaut est `None` . Utilisez-le pour définir des dépendances explicites entre les étapes de votre graphe de pipeline.
Taille du volume	Taille en Go du volume de stockage des données d’entrée et de sortie pendant l’entraînement.	Non pris en charge.	Non pris en charge.	Paramètre `volume_size`. Correspond par défaut à 30 Go.
Chiffrer le trafic entre les conteneurs	Indicateur qui spécifie si le trafic entre les conteneurs d’entraînement est chiffré pour la tâche d’entraînement.	S/O. Activé par défaut.	S/O. Activé par défaut.	Paramètre `encrypt_inter_container_traffic`. La valeur par défaut est `True` .
Configure job encryption (Configurer le chiffrement des tâches)	Indicateur du fait que vous souhaitez chiffrer vos sorties de tâche de bloc-notes, votre volume d’instance de tâche, ou les deux.	Champ Configurer le chiffrement des tâches. Cochez cette case pour choisir le chiffrement. Si cette option n'est pas cochée, les sorties de tâche sont chiffrées avec la clé KMS par défaut du compte et le volume d'instance de tâche n'est pas chiffré.	Identique à Studio.	Non pris en charge.
Output encryption KMS key (Clé de chiffrement KMS de sortie)	Une clé KMS à utiliser si vous souhaitez personnaliser la clé de chiffrement utilisée pour les sorties de tâche de bloc-notes. Ce champ n’est applicable que si vous avez activé l’option Configurer le chiffrement des tâches.	Champ Clé KMS de chiffrement de sortie. Si vous ne spécifiez pas ce champ, les sorties de tâche de bloc-notes sont chiffrées avec SSE-KMS à l’aide de la clé KMS Amazon S3 par défaut. De même, si vous créez vous-même le compartiment Amazon S3 et utilisez le chiffrement, votre méthode de chiffrement est préservée.	Identique à Studio. Pour ce champ, vous pouvez définir votre propre valeur par défaut d'utilisateur qui est préremplie chaque fois que vous créez une nouvelle définition de tâche. Pour en savoir plus, consultez Configurer les options par défaut pour les blocs-notes locaux.	Paramètre `s3_kms_key`. La valeur par défaut est `None` . Autorise les valeurs par défaut intelligentes.
Job instance volume encryption KMS key (Clé KMS de chiffrement du volume de l’instance de tâche)	Clé KMS à utiliser pour chiffrer votre volume d'instance de tâche. Ce champ n’est applicable que si vous avez activé l’option Configurer le chiffrement des tâches.	Champ Clé KMS de chiffrement du volume de l’instance de tâche.	Champ Clé KMS de chiffrement du volume de l’instance de tâche. Pour ce champ, vous pouvez définir votre propre valeur par défaut d’utilisateur qui est préremplie chaque fois que vous créez une nouvelle définition de tâche. Pour en savoir plus, consultez Configurer les options par défaut pour les blocs-notes locaux.	Paramètre `volume_kms_key`. La valeur par défaut est `None` . Autorise les valeurs par défaut intelligentes.
Utiliser un cloud privé virtuel pour exécuter cette tâche (pour les utilisateurs de VPC)	Indicateur du fait que vous souhaitez exécuter cette tâche dans un cloud privé virtuel (VPC). Pour une meilleure sécurité, il est recommandé d’utiliser un VPC privé.	Champ Utiliser un cloud privé virtuel pour exécuter cette tâche. Cochez cette case si vous souhaitez utiliser un VPC. Créez au minimum les points de terminaison VPC suivants pour permettre à votre tâche de bloc-notes de se connecter de manière privée à ces ressources : AWS SageMaker IA : pour plus d'informations sur la façon de se connecter à l' SageMaker IA via un point de terminaison d'interface VPC, consultez. Connectez-vous à l' SageMaker IA au sein de votre VPC Amazon S3 : pour en savoir plus sur la manière de se connecter à Amazon S3 via un point de terminaison d’interface de VPC, consultez Points de terminaison de passerelle pour Amazon S3. Amazon EC2 : pour en savoir plus sur la manière de se connecter à Amazon EC2 via un point de terminaison d'interface de VPC, consultez Accéder à Amazon EC2 à l'aide du point de terminaison d'un VPC d'interface. Amazon EventBridge : ce point de terminaison n'est nécessaire que lors de la configuration d'un bloc-notes planifié. Il n'est pas nécessaire lors du lancement d'une tâche à la demande. Pour plus d'informations sur la façon de se connecter EventBridge via un point de terminaison d'interface VPC, consultez Utilisation d'Amazon EventBridge avec des points de terminaison VPC d'interface. Si vous choisissez d’utiliser un VPC, vous devez spécifier au moins un sous-réseau privé et au moins un groupe de sécurité dans les options suivantes. Si vous n'utilisez aucun sous-réseau privé, vous devez envisager d'autres options de configuration. Pour plus de détails, consultez Sous-réseaux VPC publics non pris en charge dans Contraintes et considérations.	Identique à Studio.	N/A
Sous-réseau(x) (pour les utilisateurs de VPC)	Vos sous-réseaux. Ce champ doit contenir au moins une entrée et cinq au maximum, et tous les sous-réseaux que vous fournissez doivent être privés. Pour plus de détails, consultez Sous-réseaux VPC publics non pris en charge dans Contraintes et considérations.	Champ Sous-réseau(x). Ce champ contient par défaut les sous-réseaux associés au domaine Studio, mais vous pouvez modifier ce champ si nécessaire.	Champ Sous-réseau(x). Le planificateur ne peut pas détecter vos sous-réseaux. Vous devez donc saisir tous les sous-réseaux que vous avez configurés pour votre VPC.	Paramètre `subnets`. La valeur par défaut est `None` . Autorise les valeurs par défaut intelligentes.
Groupe(s) de sécurité (pour les utilisateurs de VPC)	Vos groupes de sécurité. Ce champ doit contenir au moins une entrée et quinze au maximum. Pour plus de détails, consultez Sous-réseaux VPC publics non pris en charge dans Contraintes et considérations.	Champ Groupes de sécurité. Ce champ contient par défaut les groupes de sécurité associés au VPC du domaine, mais vous pouvez modifier ce champ si nécessaire.	Champ Groupes de sécurité. Le planificateur ne peut pas détecter vos groupes de sécurité. Vous devez donc saisir tous les groupes de sécurité que vous avez configurés pour votre VPC.	Paramètre `security_group_ids`. La valeur par défaut est `None` . Autorise les valeurs par défaut intelligentes.
Nom	Nom de l’étape de tâche de bloc-notes.	N/A	N/A	Paramètre `name`. S’il n’est pas spécifié, il est dérivé du nom du fichier de bloc-notes.
Nom d’affichage	Votre nom de tâche tel qu’il doit apparaître dans votre liste d’exécutions de pipeline.	N/A	N/A	Paramètre `display_name`. La valeur par défaut est `None` .
Description	Description de votre tâche.	N/A	N/A	Paramètre `description`.

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Invocation d’un autre bloc-notes dans votre tâche de bloc-notes

Paramétrer votre bloc-notes