Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Erstellen Sie mit der API AWS CLI, dem SageMaker SDK einen Trainingsjob
Um SageMaker Trainingspläne für Ihren SageMaker Trainingsjob zu verwenden, geben Sie ResourceConfig beim Aufrufen der CreateTrainingJobAPI-Operation den TrainingPlanArn Parameter des gewünschten Plans an. Es kann genau ein Plan pro Job verwenden.
Wichtig
Das im ResourceConfig Abschnitt der CreateTrainingJob Anfrage angegebene InstanceType Feld muss mit dem InstanceType Ihres Trainingsplans übereinstimmen.
Führen Sie mithilfe der CLI einen Trainingsjob für einen Plan aus
Das folgende Beispiel zeigt, wie Sie mithilfe des TrainingPlanArn Attributs im create-training-job AWS CLI Befehl einen SageMaker Schulungsjob erstellen und ihn mit einem bereitgestellten Schulungsplan verknüpfen.
Weitere Informationen zum Erstellen einer Ausbildungsstelle mithilfe des AWS CLI CreateTrainingJobBefehls finden Sie unter create-training-job.
# Create a training job aws sagemaker create-training-job \ --training-job-nametraining-job-name\ ... --resource-config '{ "InstanceType": "ml.p5.48xlarge", "InstanceCount":8, "VolumeSizeInGB":10, "TrainingPlanArn": "training-plan-arn" } }' \ ...
Mit diesem AWS CLI Beispielbefehl wird ein neuer Trainingsjob in SageMaker KI erstellt, der einen Trainingsplan im --resource-config Argument erfüllt.
aws sagemaker create-training-job \ --training-job-namejob-name\ --role-arnarn:aws:iam::111122223333:role/DataAndAPIAccessRole\ --algorithm-specification '{"TrainingInputMode": "File","TrainingImage": "111122223333.dkr.ecr.us-east-1.amazonaws.com/algo-image:tag", "ContainerArguments": [" "]}' \ --input-data-config '[{"ChannelName":"training","DataSource":{"S3DataSource":{"S3DataType":"S3Prefix","S3Uri":"s3://bucketname/input","S3DataDistributionType":"ShardedByS3Key"}}}]' \ --output-data-config '{"S3OutputPath": "s3://bucketname/output"}' \ --resource-config '{"VolumeSizeInGB":10,"InstanceCount":4,"InstanceType":"ml.p5.48xlarge", "TrainingPlanArn" : "arn:aws:sagemaker:us-east-1:111122223333:training-plan/plan-name"}' \ --stopping-condition '{"MaxRuntimeInSeconds":1800}' \ --regionus-east-1
Nachdem Sie den Trainingsjob erstellt haben, können Sie überprüfen, ob er dem Trainingsplan ordnungsgemäß zugewiesen wurde, indem Sie die DescribeTrainingJob API aufrufen.
aws sagemaker describe-training-job --training-job-nametraining-job-name
Führen Sie mithilfe des SageMaker AI Python SDK einen Trainingsjob auf einem Plan aus
Alternativ können Sie mit dem SageMaker Python-SDK
Wenn Sie das SageMaker Python-SDK JupyterLab in Studio verwenden, um einen Trainingsjob zu erstellen, stellen Sie sicher, dass die Ausführungsrolle, die von dem Bereich verwendet wird, in dem Ihre JupyterLab Anwendung ausgeführt wird, über die erforderlichen Berechtigungen für die Verwendung von SageMaker Trainingsplänen verfügt. Informationen zu den erforderlichen Berechtigungen für die Verwendung von SageMaker Trainingsplänen finden Sie unterIAM für SageMaker Schulungspläne.
Das folgende Beispiel zeigt, wie Sie einen SageMaker Trainingsjob erstellen und ihn mit einem bereitgestellten Trainingsplan verknüpfen, indem Sie das training_plan Attribut im Estimator Objekt verwenden, wenn Sie das SageMaker Python-SDK verwenden.
Weitere Informationen zum SageMaker Estimator finden Sie unter Verwenden eines SageMaker Schätzers zur Ausführung eines Trainingsjobs.
import sagemaker import boto3 from sagemaker import get_execution_role from sagemaker.estimator import Estimator from sagemaker.inputs import TrainingInput # Set up the session and SageMaker client session = boto3.Session() region = session.region_name sagemaker_session = session.client('sagemaker') # Get the execution role for the training job role = get_execution_role() # Define the input data configuration trainingInput = TrainingInput( s3_data='s3://input-path', distribution='ShardedByS3Key', s3_data_type='S3Prefix' ) estimator = Estimator( entry_point='train.py', image_uri="123456789123.dkr.ecr.{}.amazonaws.com/image:tag", role=role, instance_count=4, instance_type='ml.p5.48xlarge', training_plan="training-plan-arn", volume_size=20, max_run=3600, sagemaker_session=sagemaker_session, output_path="s3://output-path" ) # Create the training job estimator.fit(inputs=trainingInput, job_name=job_name)
Nachdem Sie den Trainingsjob erstellt haben, können Sie überprüfen, ob er dem Trainingsplan ordnungsgemäß zugewiesen wurde, indem Sie die DescribeTrainingJob API aufrufen.
# Check job details sagemaker_session.describe_training_job(TrainingJobName=job_name)