Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Options disponibles
Le tableau suivant présente toutes les options disponibles que vous pouvez utiliser pour personnaliser votre tâche de bloc-notes, que vous exécutiez votre tâche de bloc-notes dans Studio, dans un environnement Jupyter local ou que vous utilisiez le SDK SageMaker Python. Le tableau inclut le type d'option personnalisée, une description, des instructions supplémentaires sur la façon d'utiliser l'option, un nom de champ pour l'option dans Studio (si disponible) et le nom du paramètre pour l'étape de travail du bloc-notes dans le SDK SageMaker Python (si disponible).
Pour certaines options, vous pouvez également prédéfinir des valeurs par défaut personnalisées afin de ne pas avoir à les spécifier chaque fois que vous configurez une tâche de bloc-notes. Pour Studio, ces options sont Rôle, Dossier d’entrée, Dossier de sortie et ID de clé KMS, et sont spécifiées dans le tableau suivant. Si vous prédéfinissez des valeurs par défaut personnalisées pour ces options, ces champs sont préremplis dans le formulaire Créer une tâche lorsque vous créez votre tâche de bloc-notes. Pour plus de détails sur la création de paramètres par défaut personnalisés dans Studio et les environnements Jupyter locaux, consultez Configurer les options par défaut pour les blocs-notes locaux.
Le SageMaker SDK vous donne également la possibilité de définir des valeurs par défaut intelligentes afin que vous n'ayez pas à spécifier ces paramètres lorsque vous créez un. NotebookJobStep Ces paramètres sont role, s3_root_uri, s3_kms_key, volume_kms_key, subnets et security_group_ids, et ils sont spécifiés dans le tableau suivant. Pour en savoir plus sur la façon de définir des valeurs par défaut intelligentes, consultez Configuration des options par défaut.
| Option personnalisée | Description | Directive spécifique à Studio | Directive environnementale locale de Jupyter | SageMaker Directive du SDK Python |
|---|---|---|---|---|
| Nom du job | Le nom de votre tâche, tel qu’il doit apparaître dans le tableau de bord des tâches de bloc-notes. | Champ Nom de la tâche. | Identique à Studio. | Paramètre notebook_job_name. La valeur par défaut est None . |
| Image | Image de conteneur utilisée pour exécuter le bloc-notes de manière non interactive sur le type de calcul choisi. | Champ Image. Ce champ contient par défaut l’image actuelle de votre bloc-notes. Remplacez la valeur par défaut de ce champ par une valeur personnalisée, si nécessaire. Si Studio ne peut pas déduire cette valeur, le formulaire affiche une erreur de validation vous demandant de la spécifier. Il peut s'agir d'une image personnalisée, bring-your-own d'une image ou d'une SageMaker image Amazon disponible. Pour obtenir la liste des SageMaker images disponibles prises en charge par le planificateur de bloc-notes, consultez. Amazon SageMaker Images disponibles pour une utilisation avec les blocs-notes Studio Classic | Champ Image. Ce champ nécessite un URI ECR d’une image Docker capable d’exécuter le bloc-notes fourni sur le type de calcul sélectionné. Par défaut, l'extension du planificateur utilise une image SageMaker AI Docker prédéfinie, basée sur Python 2.0. Il s'agit de l'image officielle de Python 3.8 provenant de DockerHub boto3 et du noyau Python 3. AWS CLI Vous pouvez également fournir un URI ECR quelconque conforme à la spécification d'image personnalisée du bloc-notes. Pour en savoir plus, consultez Spécifications SageMaker d'image personnalisées pour Amazon SageMaker Studio Classic. Cette image doit contenir tous les noyaux et bibliothèques nécessaires à l’exécution du bloc-notes. | Obligatoire. Paramètre image_uri. Emplacement URI d’une image Docker sur ECR. Vous pouvez utiliser des images de SageMaker distribution spécifiques ou une image personnalisée basée sur ces images, ou votre propre image préinstallée avec des dépendances entre les tâches du bloc-notes répondant à des exigences supplémentaires. Pour en savoir plus, consultez Contraintes d'image pour les SageMaker tâches de bloc-notes du SDK AI Python. |
| Type d’instance | Type d' EC2 instance à utiliser pour exécuter la tâche de bloc-notes. La tâche de bloc-notes utilise une tâche d' SageMaker entraînement comme couche informatique. Le type d'instance spécifié doit donc être un type d'instance compatible avec la SageMaker formation. | Champ Type de calcul. La valeur par défaut est ml.m5.large . |
Identique à Studio. | Paramètre instance_type. La valeur par défaut est ml.m5.large . |
| Noyau | Le noyau Jupyter utilisé pour exécuter la tâche du bloc-notes. | Champ Noyau. Ce champ contient par défaut le noyau actuel de votre bloc-notes. Remplacez la valeur par défaut de ce champ par une valeur personnalisée, si nécessaire. Si Studio ne peut pas déduire cette valeur, le formulaire affiche une erreur de validation vous demandant de la spécifier. | Champ Noyau. Ce noyau doit être présent dans l’image et respecter les spécifications du noyau Jupyter. Ce champ correspond par défaut au noyau Python3 présent dans l'image de base de Python 2.0. SageMaker Modifiez ce champ en spécifiant une valeur personnalisée, si nécessaire. | Obligatoire. Paramètre kernel_name. Ce noyau doit être présent dans l’image et respecter les spécifications du noyau Jupyter. Pour voir les identifiants du noyau pour votre image, consultez (LIEN). |
| SageMaker Séance d'IA | La session SageMaker AI sous-jacente à laquelle les appels de service SageMaker AI sont délégués. | N/A | N/A | Paramètre sagemaker_session. Si elle n’est pas spécifiée, elle est créée à l’aide d’une chaîne de configuration par défaut. |
| Role ARN (ARN de rôle) | Amazon Resource Name (ARN) du rôle utilisé avec la tâche de bloc-notes. | Champ ARN du rôle. Ce champ utilise par défaut le rôle d’exécution Studio. Modifiez ce champ en spécifiant une valeur personnalisée, si nécessaire. NoteSi Studio ne peut pas déduire cette valeur, le champ ARN du rôle est vide. Dans ce cas, insérez l’ARN que vous souhaitez utiliser. |
Champ ARN du rôle. Ce champ contient par défaut n’importe quel rôle préfixé par SagemakerJupyterScheduler. Si vous avez plusieurs rôles avec le préfixe, l'extension en choisit un. Modifiez ce champ en spécifiant une valeur personnalisée, si nécessaire. Pour ce champ, vous pouvez définir votre propre valeur par défaut d'utilisateur qui est préremplie chaque fois que vous créez une nouvelle définition de tâche. Pour en savoir plus, consultez Configurer les options par défaut pour les blocs-notes locaux. |
Paramètre role. Par défaut, le rôle IAM par défaut de l' SageMaker IA est utilisé si le SDK est exécuté dans des ordinateurs portables ou des SageMaker blocs-notes Studio. SageMaker Sinon, il renvoie une erreur ValueError. Autorise les valeurs par défaut intelligentes. |
| Bloc-notes d’entrée | Nom du bloc-notes que vous prévoyez d’exécuter. | Obligatoire. Champ Fichier d’entrée. | Identique à Studio. | Requis. Paramètre input_notebook. |
| Input folder (Dossier d’entrée) | Dossier contenant vos entrées. Les entrées de tâche, y compris le bloc-notes d’entrée et tous les scripts de démarrage ou d’initialisation facultatifs, sont placées dans ce dossier. | Champ Dossier d’entrée. Si vous ne spécifiez pas de dossier, le planificateur crée un compartiment Amazon S3 par défaut pour vos entrées. | Identique à Studio. Pour ce champ, vous pouvez définir votre propre valeur par défaut d'utilisateur qui est préremplie chaque fois que vous créez une nouvelle définition de tâche. Pour en savoir plus, consultez Configurer les options par défaut pour les blocs-notes locaux. | S/O. Le dossier d’entrée est placé dans l’emplacement spécifié par le paramètre s3_root_uri. |
| Output folder (Dossier de sortie) | Le dossier contenant vos sorties. Les sorties de tâche, y compris le bloc-notes de sortie et les journaux, sont placées dans ce dossier. | Champ Dossier de sortie. Si vous ne spécifiez pas de dossier, le planificateur crée un compartiment Amazon S3 par défaut pour vos sorties. | Identique à Studio. Pour ce champ, vous pouvez définir votre propre valeur par défaut d'utilisateur qui est préremplie chaque fois que vous créez une nouvelle définition de tâche. Pour en savoir plus, consultez Configurer les options par défaut pour les blocs-notes locaux. | S/O. Le dossier de sortie est placé dans l’emplacement spécifié par le paramètre s3_root_uri. |
| Parameters | Dictionnaire de variables et de valeurs à transmettre à votre tâche de bloc-notes. | Champ Paramètres. Vous devez paramétrer votre bloc-notes pour accepter les paramètres. | Identique à Studio. | Paramètre parameters. Vous devez paramétrer votre bloc-notes pour accepter les paramètres. |
| Dépendances supplémentaires (fichier ou dossier) | La liste des dépendances de fichiers ou de dossiers que la tâche de bloc-notes charge dans le dossier s3 intermédiaire. | Non pris en charge. | Non pris en charge. | Paramètre additional_dependencies. La tâche de bloc-notes charge ces dépendances dans un dossier S3 intermédiaire afin qu’elles puissent être consommées pendant l’exécution. |
| URI racine S3 | Dossier contenant vos entrées. Les entrées de tâche, y compris le bloc-notes d’entrée et tous les scripts de démarrage ou d’initialisation facultatifs, sont placées dans ce dossier. Ce compartiment S3 doit se trouver dans le même Compte AWS que vous utilisez pour exécuter votre tâche de bloc-notes. | S/O. Utilisez le dossier d’entrée et le dossier de sortie. | Identique à Studio. | Paramètre s3_root_uri. Par défaut, il s’agit d’un compartiment S3 par défaut. Autorise les valeurs par défaut intelligentes. |
| Variables d’environnement | Toutes les variables d’environnement existantes que vous souhaitez remplacer ou les nouvelles variables d’environnement que vous souhaitez introduire et utiliser dans votre bloc-notes. | Champ Variables d’environnement. | Identique à Studio. | Paramètre environment_variables. La valeur par défaut est None . |
| Étiquettes | Liste des balises attachées à la tâche. | N/A | N/A | Paramètre tags. La valeur par défaut est None . Vos balises contrôlent la manière dont l’interface utilisateur de Studio capture et affiche la tâche créée par le pipeline. Pour en savoir plus, consultez Visualisation de vos tâches de bloc-notes dans le tableau de bord de l’interface utilisateur de Studio. |
| Start-up script (Script de démarrage) | Script préchargé dans le menu de démarrage du bloc-notes que vous pouvez choisir d’exécuter avant d’exécuter le bloc-notes. | Champ Script de démarrage. Sélectionnez un script de configuration de cycle de vie (LCC) qui s’exécute sur l’image au démarrage.NoteUn script de démarrage s’exécute dans un shell en dehors de l’environnement Studio. Ce script ne peut donc pas dépendre du stockage local de Studio, des variables d'environnement ni des métadonnées de l'application (dans |
Non pris en charge. | Non pris en charge. |
| Initialization script (Script d’initialisation) | Chemin d’accès à un script local que vous pouvez exécuter au démarrage de votre bloc-notes. | Champ Script d’initialisation. Entrez le chemin du fichier EFS où se trouve un script local ou un script de configuration de cycle de vie (LCC). Si vous utilisez un script de démarrage et un script d'initialisation, le script de démarrage s'exécute en premier.NoteUn script d'initialisation provient du même shell que la tâche de bloc-notes. Ce n’est pas le cas pour un script de démarrage décrit précédemment. De même, si vous utilisez un script de démarrage et un script d’initialisation, le script de démarrage s’exécute en premier. |
Champ Script d’initialisation. Entrez le chemin du fichier local où se trouve un script local ou un script de configuration de cycle de vie (LCC). | Paramètre initialization_script. La valeur par défaut est None . |
| Nombre maximal de nouvelles tentatives | Nombre de fois où Studio essaie de réexécuter une tâche qui a échoué. | Champ Nombre max. de nouvelles tentatives. La valeur par défaut est 1. | Identique à Studio. | Paramètre max_retry_attempts. La valeur par défaut est 1. |
| Durée d’exécution maximale (en secondes) | Durée maximale, en secondes, pendant laquelle une tâche de bloc-notes peut s'exécuter avant d'être arrêtée. Si vous configurez à la fois la durée d'exécution maximale et le nombre maximal de nouvelles tentatives, la durée d'exécution s'applique à chaque nouvelle tentative. Si une tâche ne se termine pas dans ce délai, son statut est défini sur Failed. |
Champ Durée d’exécution maximale (en secondes). La valeur par défaut est 172800
seconds (2 days) . |
Identique à Studio. | Paramètre max_runtime_in_seconds. La valeur par défaut est 172800 seconds
(2 days) . |
| Politiques de nouvelles tentatives | Liste des politiques relatives aux nouvelles tentatives, qui régissent les actions à entreprendre en cas d’échec. | Non pris en charge. | Non pris en charge. | Paramètre retry_policies. La valeur par défaut est None . |
Ajout de dépendances Step ou StepCollection |
Liste de noms ou d’instances Step ou StepCollection dont dépend la tâche. |
Non pris en charge. | Non pris en charge. | Paramètre depends_on. La valeur par défaut est None . Utilisez-le pour définir des dépendances explicites entre les étapes de votre graphe de pipeline. |
| Taille du volume | Taille en Go du volume de stockage des données d’entrée et de sortie pendant l’entraînement. | Non pris en charge. | Non pris en charge. | Paramètre volume_size. Correspond par défaut à 30 Go. |
| Chiffrer le trafic entre les conteneurs | Indicateur qui spécifie si le trafic entre les conteneurs d’entraînement est chiffré pour la tâche d’entraînement. | S/O. Activé par défaut. | S/O. Activé par défaut. | Paramètre encrypt_inter_container_traffic. La valeur par défaut est True . |
| Configure job encryption (Configurer le chiffrement des tâches) | Indicateur du fait que vous souhaitez chiffrer vos sorties de tâche de bloc-notes, votre volume d’instance de tâche, ou les deux. | Champ Configurer le chiffrement des tâches. Cochez cette case pour choisir le chiffrement. Si cette option n'est pas cochée, les sorties de tâche sont chiffrées avec la clé KMS par défaut du compte et le volume d'instance de tâche n'est pas chiffré. | Identique à Studio. | Non pris en charge. |
| Output encryption KMS key (Clé de chiffrement KMS de sortie) | Une clé KMS à utiliser si vous souhaitez personnaliser la clé de chiffrement utilisée pour les sorties de tâche de bloc-notes. Ce champ n’est applicable que si vous avez activé l’option Configurer le chiffrement des tâches. | Champ Clé KMS de chiffrement de sortie. Si vous ne spécifiez pas ce champ, les sorties de tâche de bloc-notes sont chiffrées avec SSE-KMS à l’aide de la clé KMS Amazon S3 par défaut. De même, si vous créez vous-même le compartiment Amazon S3 et utilisez le chiffrement, votre méthode de chiffrement est préservée. | Identique à Studio. Pour ce champ, vous pouvez définir votre propre valeur par défaut d'utilisateur qui est préremplie chaque fois que vous créez une nouvelle définition de tâche. Pour en savoir plus, consultez Configurer les options par défaut pour les blocs-notes locaux. | Paramètre s3_kms_key. La valeur par défaut est None . Autorise les valeurs par défaut intelligentes. |
| Job instance volume encryption KMS key (Clé KMS de chiffrement du volume de l’instance de tâche) | Clé KMS à utiliser pour chiffrer votre volume d'instance de tâche. Ce champ n’est applicable que si vous avez activé l’option Configurer le chiffrement des tâches. | Champ Clé KMS de chiffrement du volume de l’instance de tâche. | Champ Clé KMS de chiffrement du volume de l’instance de tâche. Pour ce champ, vous pouvez définir votre propre valeur par défaut d’utilisateur qui est préremplie chaque fois que vous créez une nouvelle définition de tâche. Pour en savoir plus, consultez Configurer les options par défaut pour les blocs-notes locaux. | Paramètre volume_kms_key. La valeur par défaut est None . Autorise les valeurs par défaut intelligentes. |
| Utiliser un cloud privé virtuel pour exécuter cette tâche (pour les utilisateurs de VPC) | Indicateur du fait que vous souhaitez exécuter cette tâche dans un cloud privé virtuel (VPC). Pour une meilleure sécurité, il est recommandé d’utiliser un VPC privé. | Champ Utiliser un cloud privé virtuel pour exécuter cette tâche. Cochez cette case si vous souhaitez utiliser un VPC. Créez au minimum les points de terminaison VPC suivants pour permettre à votre tâche de bloc-notes de se connecter de manière privée à ces ressources : AWS
|
Identique à Studio. | N/A |
| Sous-réseau(x) (pour les utilisateurs de VPC) | Vos sous-réseaux. Ce champ doit contenir au moins une entrée et cinq au maximum, et tous les sous-réseaux que vous fournissez doivent être privés. Pour plus de détails, consultez Sous-réseaux VPC publics non pris en charge dans Contraintes et considérations. | Champ Sous-réseau(x). Ce champ contient par défaut les sous-réseaux associés au domaine Studio, mais vous pouvez modifier ce champ si nécessaire. | Champ Sous-réseau(x). Le planificateur ne peut pas détecter vos sous-réseaux. Vous devez donc saisir tous les sous-réseaux que vous avez configurés pour votre VPC. | Paramètre subnets. La valeur par défaut est None . Autorise les valeurs par défaut intelligentes. |
| Groupe(s) de sécurité (pour les utilisateurs de VPC) | Vos groupes de sécurité. Ce champ doit contenir au moins une entrée et quinze au maximum. Pour plus de détails, consultez Sous-réseaux VPC publics non pris en charge dans Contraintes et considérations. | Champ Groupes de sécurité. Ce champ contient par défaut les groupes de sécurité associés au VPC du domaine, mais vous pouvez modifier ce champ si nécessaire. | Champ Groupes de sécurité. Le planificateur ne peut pas détecter vos groupes de sécurité. Vous devez donc saisir tous les groupes de sécurité que vous avez configurés pour votre VPC. | Paramètre security_group_ids. La valeur par défaut est None . Autorise les valeurs par défaut intelligentes. |
| Name | Nom de l’étape de tâche de bloc-notes. | N/A | N/A | Paramètre name. S’il n’est pas spécifié, il est dérivé du nom du fichier de bloc-notes. |
| Nom d’affichage | Votre nom de tâche tel qu’il doit apparaître dans votre liste d’exécutions de pipeline. | N/A | N/A | Paramètre display_name. La valeur par défaut est None . |
| Description | Description de votre tâche. | N/A | N/A | Paramètre description. |