Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Visualizzazione dei dettagli del piano di addestramento
Per monitorare lo stato o recuperare i dettagli di un piano di addestramento, puoi utilizzare l’API DescribeTrainingPlan. La risposta dell’API include un campo Status che riflette lo stato attuale del piano di addestramento:
-
Se l’acquisto del piano non riesce, lo stato viene impostato su
Failed. -
Una volta completato il pagamento, lo stato passa da
PendingaScheduled, in base alla data di inizio del piano. -
Quando il piano raggiunge la data di inizio, lo stato cambia in
Active. -
Per i piani con più capacità riservate discontinue, lo stato torna su
Scheduledtra un periodo di attività e l’altro, finché non viene raggiunta la data di inizio della capacità riservata successiva. -
Dopo la data di fine del piano, lo stato diventa
Expired.
Una volta raggiunto lo statoScheduled, è possibile utilizzare la capacità riservata nel piano per i lavori di SageMaker formazione o i carichi di lavoro HyperPod del cluster.
Nota
-
I job di addestramento associati al piano rimangono nello stato
Pendingfino a quando il piano non diventaActive. -
Per HyperPod i cluster che utilizzano un piano di formazione per la capacità di calcolo, lo stato del gruppo di istanze viene visualizzato come una volta creato.
InService
L'esempio seguente utilizza un AWS CLI comando per recuperare i dettagli di un piano di allenamento in base al nome.
aws sagemaker describe-training-plan \ --training-plan-name "name"
Questo documento JSON è un esempio di risposta dall'API dei piani SageMaker di formazione. Questa risposta fornisce dettagli su un piano di addestramento creato correttamente.
{ "AvailableInstanceCount": 2, "CurrencyCode": "USD", "DurationHours": 48, "DurationMinutes": 0, "EndTime": "2024-09-28T04:30:00-07:00", "InUseInstanceCount": 2, "ReservedCapacitySummaries": [ { "AvailabilityZone": "string", "DurationHours": 48, "DurationMinutes": 0, "EndTime": "2024-09-28T04:30:00-07:00", "InstanceType": "ml.p5.48xlarge", "ReservedCapacityArn": "arn:aws:sagemaker:us-east-1:123456789123:reserved-capacity/large-models-fine-tuning-rc1", "StartTime": "2024-09-26T04:30:00-07:00", "Status": "Scheduled", "TotalInstanceCount": 4, "UltraServerCount": 4, "UltraServerType": "ml.p6e-gb200.36xlarge" } ], "StartTime": "2024-09-26T04:30:00-07:00", "Status": "Scheduled", "StatusMessage": "Payment confirmed, training plan scheduled." "TargetResources": [ "training-job" ], "TotalInstanceCount": 4, "TotalUltraServerCount": 4, "TrainingPlanArn": "arn:aws:sagemaker:us-east-1:123456789123:training-plan/large-models-fine-tuning", "TrainingPlanName": "large-models-fine-tuning", "UpfrontFee": "xxxx.xx" }
Le sezioni seguenti definiscono il parametro di richiesta di input obbligatorio per l’operazione API DescribeTrainingPlan.
Parametri obbligatori
-
TrainingPlanName: il nome del piano di addestramento da descrivere.