Opciones de punto final avanzadas para realizar inferencias con Amazon AI SageMaker

Con la inferencia en tiempo real, puede optimizar aún más el rendimiento y los costos con las siguientes opciones de inferencia avanzadas:

Puntos de conexión multimodelo: utilice esta opción si tiene varios modelos que utilizan el mismo marco y pueden compartir un contenedor. Esta opción le ayuda a optimizar los costos al mejorar la utilización de los puntos de conexión y reducir la sobrecarga de implementación.
Puntos de conexión con varios contenedores: utilice esta opción si tiene varios modelos que utilizan distintos marcos y requieren sus propios contenedores. Obtiene muchas de las ventajas de los puntos de conexión multimodelo y puede implementar una variedad de marcos y modelos.
Canalizaciones de inferencia en serie: utilice esta opción si desea alojar modelos con lógica de preprocesamiento y posprocesamiento detrás de un punto de conexión. La SageMaker IA gestiona completamente las canalizaciones de inferencia y ofrecen una latencia más baja, ya que todos los contenedores están alojados en las mismas instancias de Amazon EC2.

Aviso JavaScript está desactivado o no está disponible en su navegador.

Para utilizar la documentación de AWS, debe estar habilitado JavaScript. Para obtener más información, consulte las páginas de ayuda de su navegador.

Opciones de inferencia

Siguientes pasos