Visualización de los detalles del plan de entrenamiento - Amazon SageMaker AI

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Visualización de los detalles del plan de entrenamiento

Para supervisar el estado o recuperar los detalles de un plan de entrenamiento, puede utilizar la API DescribeTrainingPlan. La respuesta de la API incluye un campo Status que refleja el estado actual del plan de entrenamiento:

  • Si el plan genera un error, el estado se establece en Failed.

  • Si el pago se realiza correctamente, el estado pasa de Pending a Scheduled, en función de la fecha de inicio del plan.

  • Cuando el plan alcanza la fecha de inicio, su estado cambia a Active.

  • En el caso de los planes con varias capacidades reservadas discontinuas, el estado vuelve al estado Scheduled entre períodos activos, hasta la fecha de inicio de la siguiente capacidad reservada.

  • Tras la fecha de finalización del plan, el estado pasa a Expired.

Una vez obtenido el estadoScheduled, puede utilizar la capacidad reservada en el plan para sus trabajos de SageMaker formación o cargas de trabajo en HyperPod clústeres.

nota
  • Los trabajos de entrenamiento asociados al plan conservan el estado Pending hasta que el plan pase a estar Active.

  • En el caso de HyperPod los clústeres que utilizan un plan de capacitación para la capacidad de cómputo, el estado del grupo de instancias aparece como InService una vez creado.

En el siguiente ejemplo, se usa un AWS CLI comando para recuperar los detalles de un plan de entrenamiento por su nombre.

aws sagemaker describe-training-plan \ --training-plan-name "name"

Este documento JSON es un ejemplo de respuesta de la API de planes de SageMaker formación. Esta respuesta proporciona detalles sobre un plan de entrenamiento que se ha creado correctamente.

{ "AvailableInstanceCount": 2, "CurrencyCode": "USD", "DurationHours": 48, "DurationMinutes": 0, "EndTime": "2024-09-28T04:30:00-07:00", "InUseInstanceCount": 2, "ReservedCapacitySummaries": [ { "AvailabilityZone": "string", "DurationHours": 48, "DurationMinutes": 0, "EndTime": "2024-09-28T04:30:00-07:00", "InstanceType": "ml.p5.48xlarge", "ReservedCapacityArn": "arn:aws:sagemaker:us-east-1:123456789123:reserved-capacity/large-models-fine-tuning-rc1", "StartTime": "2024-09-26T04:30:00-07:00", "Status": "Scheduled", "TotalInstanceCount": 4, "UltraServerCount": 4, "UltraServerType": "ml.p6e-gb200.36xlarge" } ], "StartTime": "2024-09-26T04:30:00-07:00", "Status": "Scheduled", "StatusMessage": "Payment confirmed, training plan scheduled." "TargetResources": [ "training-job" ], "TotalInstanceCount": 4, "TotalUltraServerCount": 4, "TrainingPlanArn": "arn:aws:sagemaker:us-east-1:123456789123:training-plan/large-models-fine-tuning", "TrainingPlanName": "large-models-fine-tuning", "UpfrontFee": "xxxx.xx" }

En las siguientes secciones se definen los parámetros de solicitud de entrada obligatorios para la operación de la API DescribeTrainingPlan.

Parámetros necesarios

  • TrainingPlanName: es el nombre del plan de entrenamiento que desea describir.