Opciones avanzadas de punto de conexión para inferencias con Amazon SageMaker AI - Amazon SageMaker AI

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Opciones avanzadas de punto de conexión para inferencias con Amazon SageMaker AI

Con la inferencia en tiempo real, puede optimizar aún más el rendimiento y los costos con las siguientes opciones de inferencia avanzadas:

  • Puntos de conexión multimodelo: utilice esta opción si tiene varios modelos que utilizan el mismo marco y pueden compartir un contenedor. Esta opción le ayuda a optimizar los costos al mejorar la utilización de los puntos de conexión y reducir la sobrecarga de implementación.

  • Puntos de conexión con varios contenedores: utilice esta opción si tiene varios modelos que utilizan distintos marcos y requieren sus propios contenedores. Obtiene muchas de las ventajas de los puntos de conexión multimodelo y puede implementar una variedad de marcos y modelos.

  • Canalizaciones de inferencia en serie: utilice esta opción si desea alojar modelos con lógica de preprocesamiento y posprocesamiento detrás de un punto de conexión. SageMaker AI administra completamente las canalizaciones de inferencia y proporcionan una latencia más baja porque todos los contenedores se alojan en las mismas instancias de Amazon EC2.