Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Crea un lavoro di formazione utilizzando l'API AWS CLI, SageMaker SDK
Per utilizzare SageMaker i piani di SageMaker formazione per il tuo lavoro di formazione, specifica il TrainingPlanArn parametro del piano desiderato ResourceConfig nell'operazione di chiamata dell'CreateTrainingJobAPI. Puoi utilizzare un solo piano per processo.
Importante
Il campo InstanceType impostato nella sezione ResourceConfig della richiesta CreateTrainingJob deve corrispondere a InstanceType del piano di addestramento.
Esecuzione di un job di addestramento in un piano con la CLI
L'esempio seguente dimostra come creare un processo di SageMaker formazione e associarlo a un piano di formazione fornito utilizzando l'TrainingPlanArnattributo nel create-training-job AWS CLI comando.
Per ulteriori informazioni su come creare un processo di formazione utilizzando il AWS CLI CreateTrainingJobcomando, vedere create-training-job.
# Create a training job aws sagemaker create-training-job \ --training-job-nametraining-job-name\ ... --resource-config '{ "InstanceType": "ml.p5.48xlarge", "InstanceCount":8, "VolumeSizeInGB":10, "TrainingPlanArn": "training-plan-arn" } }' \ ...
Questo comando di AWS CLI esempio crea un nuovo processo di addestramento in SageMaker AI inserendo un piano di formazione nell'--resource-configargomento.
aws sagemaker create-training-job \ --training-job-namejob-name\ --role-arnarn:aws:iam::111122223333:role/DataAndAPIAccessRole\ --algorithm-specification '{"TrainingInputMode": "File","TrainingImage": "111122223333.dkr.ecr.us-east-1.amazonaws.com/algo-image:tag", "ContainerArguments": [" "]}' \ --input-data-config '[{"ChannelName":"training","DataSource":{"S3DataSource":{"S3DataType":"S3Prefix","S3Uri":"s3://bucketname/input","S3DataDistributionType":"ShardedByS3Key"}}}]' \ --output-data-config '{"S3OutputPath": "s3://bucketname/output"}' \ --resource-config '{"VolumeSizeInGB":10,"InstanceCount":4,"InstanceType":"ml.p5.48xlarge", "TrainingPlanArn" : "arn:aws:sagemaker:us-east-1:111122223333:training-plan/plan-name"}' \ --stopping-condition '{"MaxRuntimeInSeconds":1800}' \ --regionus-east-1
Dopo aver creato il job di addestramento, puoi verificare che sia stato assegnato correttamente al piano di addestramento chiamando l’API DescribeTrainingJob.
aws sagemaker describe-training-job --training-job-nametraining-job-name
Esegui un processo di formazione su un piano utilizzando SageMaker AI Python SDK
In alternativa, puoi creare un lavoro di formazione associato a un piano di formazione utilizzando SageMaker Python
Se utilizzi SageMaker Python SDK da Studio per creare un processo di formazione, assicurati che il ruolo di esecuzione utilizzato dallo spazio su cui è JupyterLab in esecuzione l' JupyterLabapplicazione disponga delle autorizzazioni necessarie per utilizzare i piani di formazione. SageMaker Per ulteriori informazioni sulle autorizzazioni necessarie per utilizzare i piani di SageMaker formazione, consulta. IAM per i piani SageMaker di formazione
L'esempio seguente dimostra come creare un processo di SageMaker formazione e associarlo a un piano di formazione fornito utilizzando l'training_planattributo nell'Estimatoroggetto quando si utilizza SageMaker Python SDK.
Per ulteriori informazioni sull' SageMaker Estimator, consulta Utilizzare uno SageMaker stimatore per eseguire un processo di formazione.
import sagemaker import boto3 from sagemaker import get_execution_role from sagemaker.estimator import Estimator from sagemaker.inputs import TrainingInput # Set up the session and SageMaker client session = boto3.Session() region = session.region_name sagemaker_session = session.client('sagemaker') # Get the execution role for the training job role = get_execution_role() # Define the input data configuration trainingInput = TrainingInput( s3_data='s3://input-path', distribution='ShardedByS3Key', s3_data_type='S3Prefix' ) estimator = Estimator( entry_point='train.py', image_uri="123456789123.dkr.ecr.{}.amazonaws.com/image:tag", role=role, instance_count=4, instance_type='ml.p5.48xlarge', training_plan="training-plan-arn", volume_size=20, max_run=3600, sagemaker_session=sagemaker_session, output_path="s3://output-path" ) # Create the training job estimator.fit(inputs=trainingInput, job_name=job_name)
Dopo aver creato il job di addestramento, puoi verificare che sia stato assegnato correttamente al piano di addestramento chiamando l’API DescribeTrainingJob.
# Check job details sagemaker_session.describe_training_job(TrainingJobName=job_name)