Visualizar detalhes do plano de treinamento - SageMaker IA da Amazon

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Visualizar detalhes do plano de treinamento

Para monitorar o status ou recuperar detalhes de um plano de treinamento, você pode usar a API DescribeTrainingPlan. A resposta da API inclui um campo Status que mostra o estado atual do plano de treinamento:

  • Se a compra do plano falhar, o status será definido como Failed.

  • Após o pagamento bem-sucedido, o status muda de Pending para Scheduled, com base na data de início do plano.

  • Quando o plano atinge a data de início, o status muda para Active.

  • Para planos com várias capacidades reservadas descontínuas, o status reverte para Scheduled entre os períodos ativos, até a data de início da próxima capacidade reservada.

  • Após a data de término do plano, o status passa a ser Expired.

Quando o status forScheduled, você poderá utilizar a capacidade reservada no plano para seus trabalhos de SageMaker treinamento ou cargas de trabalho de HyperPod cluster.

nota
  • As tarefas de treinamento associadas ao plano permanecem no status Pending até que o plano se torne Active.

  • Para HyperPod clusters que usam um plano de treinamento para capacidade computacional, o status do grupo de instâncias aparece como InService uma vez criado.

O exemplo a seguir usa um AWS CLI comando para recuperar os detalhes de um plano de treinamento pelo nome.

aws sagemaker describe-training-plan \ --training-plan-name "name"

Este documento JSON é um exemplo de resposta da API de planos de SageMaker treinamento. Essa resposta fornece detalhes sobre um plano de treinamento que foi criado com êxito.

{ "AvailableInstanceCount": 2, "CurrencyCode": "USD", "DurationHours": 48, "DurationMinutes": 0, "EndTime": "2024-09-28T04:30:00-07:00", "InUseInstanceCount": 2, "ReservedCapacitySummaries": [ { "AvailabilityZone": "string", "DurationHours": 48, "DurationMinutes": 0, "EndTime": "2024-09-28T04:30:00-07:00", "InstanceType": "ml.p5.48xlarge", "ReservedCapacityArn": "arn:aws:sagemaker:us-east-1:123456789123:reserved-capacity/large-models-fine-tuning-rc1", "StartTime": "2024-09-26T04:30:00-07:00", "Status": "Scheduled", "TotalInstanceCount": 4, "UltraServerCount": 4, "UltraServerType": "ml.p6e-gb200.36xlarge" } ], "StartTime": "2024-09-26T04:30:00-07:00", "Status": "Scheduled", "StatusMessage": "Payment confirmed, training plan scheduled." "TargetResources": [ "training-job" ], "TotalInstanceCount": 4, "TotalUltraServerCount": 4, "TrainingPlanArn": "arn:aws:sagemaker:us-east-1:123456789123:training-plan/large-models-fine-tuning", "TrainingPlanName": "large-models-fine-tuning", "UpfrontFee": "xxxx.xx" }

As seções a seguir definem o parâmetro de solicitação de entrada obrigatório para a operação de API DescribeTrainingPlan.

Parâmetros necessários

  • TrainingPlanName: o nome do plano de treinamento que você deseja descrever.