Implementación de modelos de Piloto automático para realizar inferencias en tiempo real - Amazon SageMaker AI

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Implementación de modelos de Piloto automático para realizar inferencias en tiempo real

Después de entrenar los modelos de Piloto automático de Amazon SageMaker, puede configurar un punto de conexión y obtener predicciones de forma interactiva. En la siguiente sección se describen los pasos para implementar el modelo en un punto de conexión de inferencia en tiempo real de SageMaker AI para obtener las predicciones del modelo.

Inferencia en tiempo real

La inferencia en tiempo real es idónea para cargas de trabajo de inferencia con requisitos en tiempo real, interactivos y de baja latencia. Esta sección le muestra cómo puede usar la inferencia en tiempo real para obtener predicciones de forma interactiva a partir de su modelo.

Puede utilizar las API de SageMaker para implementar manualmente el modelo que produjo la mejor métrica de validación en un experimento de Piloto automático de la siguiente manera.

También puede elegir la opción de implementación automática al crear el experimento de Piloto automático. Para obtener más información sobre cómo configurar la implementación automática de modelos, consulte ModelDeployConfig en los parámetros de solicitud de CreateAutoMLJobV2. Esto crea un punto de conexión automáticamente.

nota

Para evitar incurrir en cargos innecesarios, puede eliminar los puntos de conexión y los recursos innecesarios creados a partir de la implementación del modelo. Para obtener información sobre los precios de las instancias por región, consulte Precios de Amazon SageMaker.

  1. Obtener las definiciones del contenedor del candidato

    Obtenga las definiciones del contenedor del candidato desde InferenceContainers. Una definición de contenedor para inferencias hace referencia al entorno contenerizado que se ha diseñado para implementar y ejecutar el modelo entrenado de SageMaker AI a fin de realizar predicciones.

    El siguiente ejemplo de comando AWS CLI utiliza la API DescribeAutoMLJobV2 para obtener las definiciones candidatas del mejor modelo candidato.

    aws sagemaker describe-auto-ml-job-v2 --auto-ml-job-name job-name --region region
  2. Enumerar los candidatos

    El siguiente ejemplo de comando AWS CLI utiliza la API ListCandidatesForAutoMLJob para enumerar todos los modelos candidatos.

    aws sagemaker list-candidates-for-auto-ml-job --auto-ml-job-name <job-name> --region <region>
  3. Crear un modelo de SageMaker AI

    Utilice las definiciones de contenedor del paso anterior y un candidato que usted elija para crear un modelo de SageMaker AI mediante la API CreateModel. Observe el siguiente comando AWS CLI como ejemplo.

    aws sagemaker create-model --model-name '<your-candidate-name>' \ --containers ['<container-definition1>, <container-definition2>, <container-definition3>]' \ --execution-role-arn '<execution-role-arn>' --region '<region>
  4. Crear la configuración de un punto de conexión

    El siguiente ejemplo de comando de la AWS CLI usa la API CreateEndpointConfig para crear una configuración de punto de conexión.

    aws sagemaker create-endpoint-config --endpoint-config-name '<your-endpoint-config-name>' \ --production-variants '<list-of-production-variants>' \ --region '<region>'
  5. Crear el punto de conexión

    El siguiente ejemplo de comando de la AWS CLI usa la API CreateEndpoint para crear el punto de conexión.

    aws sagemaker create-endpoint --endpoint-name '<your-endpoint-name>' \ --endpoint-config-name '<endpoint-config-name-you-just-created>' \ --region '<region>'

    Compruebe el progreso de la implementación del punto de conexión mediante la API DescribeEndpoint. Observe el siguiente comando AWS CLI como ejemplo.

    aws sagemaker describe-endpoint —endpoint-name '<endpoint-name>' —region <region>

    Cuando EndpointStatus cambie a InService, el punto de conexión estará listo para usarse en la inferencia en tiempo real.

  6. Invocar al punto de conexión

    La siguiente estructura de comandos invoca el punto de conexión para realizar inferencias en tiempo real.

    aws sagemaker invoke-endpoint --endpoint-name '<endpoint-name>' \ --region '<region>' --body '<your-data>' [--content-type] '<content-type>' <outfile>