Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Opciones de punto final avanzadas para realizar inferencias con Amazon AI SageMaker
Con la inferencia en tiempo real, puede optimizar aún más el rendimiento y los costos con las siguientes opciones de inferencia avanzadas:
-
Puntos de conexión multimodelo: utilice esta opción si tiene varios modelos que utilizan el mismo marco y pueden compartir un contenedor. Esta opción le ayuda a optimizar los costos al mejorar la utilización de los puntos de conexión y reducir la sobrecarga de implementación.
-
Puntos de conexión con varios contenedores: utilice esta opción si tiene varios modelos que utilizan distintos marcos y requieren sus propios contenedores. Obtiene muchas de las ventajas de los puntos de conexión multimodelo y puede implementar una variedad de marcos y modelos.
-
Canalizaciones de inferencia en serie: utilice esta opción si desea alojar modelos con lógica de preprocesamiento y posprocesamiento detrás de un punto de conexión. La SageMaker IA gestiona completamente las canalizaciones de inferencia y ofrecen una latencia más baja, ya que todos los contenedores están alojados en las mismas instancias de Amazon EC2.