Opciones para implementar modelos y obtener inferencias en Amazon SageMaker AI - Amazon SageMaker AI

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Opciones para implementar modelos y obtener inferencias en Amazon SageMaker AI

Para ayudarle a empezar a utilizar SageMaker AI Inference, consulte las siguientes secciones, que explican sus opciones para implementar un modelo en SageMaker AI y obtener inferencias. La sección Opciones de inferencia en Amazon SageMaker AI puede ayudarle a determinar qué característica se adapta mejor a su caso de uso para la inferencia.

Puede consultar la sección Recursos para obtener más información de referencia y resolución de problemas, blogs y ejemplos que le ayudarán a empezar, además de preguntas frecuentes.

Antes de empezar

En estos temas se presupone que ha creado y entrenado modelos de machine learning y que está listo para implementarlos. No necesita entrenar su modelo en SageMaker para implementar su modelo en SageMaker AI y obtener inferencias. Si no tiene su propio modelo, también puede utilizar los algoritmos integrados o los modelos previamente entrenados de SageMaker AI.

Si es la primera vez que utiliza SageMaker AI y aún no ha elegido un modelo para implementarlo, siga los pasos del tutorial Introducción a Amazon SageMaker AI. Utilice el tutorial para familiarizarse con la forma en que SageMaker AI administra el proceso de ciencia de datos y cómo gestiona la implementación del modelo. Para obtener más información acerca de entrenamiento de modelos, consulte Entrenamiento de modelos.

Para obtener más información, referencias y ejemplos, consulte Recursos.

Pasos para la implementación de modelos

Para los punto de conexión de inferencia, el flujo de trabajo general consiste en lo siguiente:

  • Cree un modelo en SageMaker AI Inference apuntando a los artefactos del modelo almacenados en Amazon S3 y a una imagen de contenedor.

  • Seleccione una opción de inferencia. Para obtener más información, consulte Opciones de inferencia en Amazon SageMaker AI.

  • Cree una configuración de punto de conexión de SageMaker AI Inference eligiendo el tipo de instancia y el número de instancias que necesita detrás del punto de conexión. Puede usar Recomendador de inferencias de Amazon SageMaker para obtener recomendaciones de tipos de instancias. Para la inferencia sin servidor, solo necesita proporcionar la configuración de memoria que necesita en función del tamaño del modelo.

  • Cree un punto de conexión de SageMaker AI Inference.

  • Invoque su punto de conexión para recibir una inferencia como respuesta.

El siguiente diagrama muestra el flujo de trabajo anterior.

Un diagrama del flujo de trabajo descrito en el párrafo anterior que muestra cómo obtener inferencias de SageMaker AI.

Puede realizar estas acciones mediante la AWS consola, los SDK AWS, el SageMaker Python SDK CloudFormation o AWS CLI.

Para realizar inferencias por lotes con transformación por lotes, señale los artefactos del modelo y los datos de entrada y cree un trabajo de inferencia por lotes. En lugar de alojar un punto de conexión para realizar inferencias, SageMaker AI envía sus inferencias a la ubicación de Amazon S3 que elija.